Ученые всегда рады взять что-то такое бесформенное и разобраться в нем, найти свои законы, упорядочить, построить модель и взглянуть со стороны: красиво же получилось! Вот как с элементами было: столько их всех всяких, как их правильно размесить-посчитать? Думал-думал Менделеев и придумал периодическую систему. Или вот зверей у нас — всяких разных много. Придумали систему классификации. Сразу все стало просто и понятно. Или Карл Линней все по лугам и лесам бродил, записывал, записывал — а потом взял и систематизировал все растения.
Зачем проделывалась такая работа? Ответ более чем очевиден: для управления. Как только Менделеев расставил в правильном порядке все элементы, стало более чем видно, как они могут взаимодействовать друг с другом. Классификация животных дала совершенно новые направления в науке, способствовала направленности всех дальнейших усилий по изучению животного мира.
Когда система понятна со стороны, значит, можно искать пути управления ею.
В общем, решение нескольких математиков Кембриджского центра психометрии попытаться изучить нас, как наборы цифровых данных, понятно и естественно.
Для проведения своего исследования предварительно были получены реальные данные о пятидесяти восьми тысячах пользователей Фейсбука. Делалось это только с той целью, чтобы потом сверить реальные данные с теми, что получит специальная программа.
Да, была разработана специальная программа, которая в течение длительного времени отслеживала этих пятьдесят восемь тысяч пользователей. В качестве главных информационных данных использовались: тот самый лайк, а также просмотренные страницы, комментарии. Программа была достаточно «умной» — создатели научили ее распознавать семантический смысл текста, который комментировал или лайкал пользователь. Все эти данные собирались, затем раскладывались в нужные места. После этого наступал черед анализа полученных данных. Причем анализ заканчивался определенного рода выводом или предположением программы о том, кем или чем является конкретный индивидуум. Иными словами, целью ученых было создать личностные характеристики сетюлей, используя только их поведение в сети. В этой характеристике должны были быть отражены политические пристрастия, раса, вероисповедание, семейное положение, отношение к однополым бракам (вот что сейчас так сильно волнует Европу…).
Результат работы программы и построенная ею модель сетевого мира Фейсбука оказались настолько точными, что сами создатели ощутили легкий испуг — ведь и они тоже являются участниками сети!
Итак, вот такие итоги, в частности, получились (после проверки полученных данных с ранее известными фактами о пользователях, которые они дали ранее добровольно).
Алгоритм программы проанализировал и правильно указал сексуальную ориентацию людей в 88 процентах случаев.
Программа правильно отличила по кликам и комментариям в сети чернокожих от белых американцев в 95 процентах случаев.
Точность определения политических взглядов (республиканец — демократ) оказалась на цифре 85 процентов.
Вероисповедание человека было правильно указано в 82 процентах случаев — программа отделяла мусульман от христиан.
Семейный статус пользователя был определен с точностью до 65 процентов случаев. (Заметим, что этот, самый низкий, показатель точности ученые объяснили тем, что практически девять десятых всех сетюлей или тщательно скрывают свое семейное положение, или сознательно искажают его.)
То же желание (иногда и подсознательное) скрыть подальше от чужих глаз истинное положение вещей бывает у сетюли, когда речь заходит о его злоупотреблении алкоголем или наркотиками. Однако, как ни прятались пользователи, программа смогла в 73 процентах случаев вычислить алкоголиков и наркоманов.
Это — только основные, некоторые из тех характеристик, которые определяла программа. Всех и всяких вопросов было почти полсотни. К слову сказать, ученые не стали распространяться обо всех. Из чего можно сделать не очень радужный вывод: это желание ученых создать программу было продиктовано не столько интересом к исследованию и зудом научного изыскания, сколько заказом со стороны…
Математики немножко рассказали о некоторых других характеристиках пользователей Фейсбука, которые собирала программа. Например, даже такие данные: «Были ли в разводе родители пользователя, когда ему исполнился двадцать один год?» Казалось бы, каким образом программа, прямо не задавая вопроса, может найти ответ на него? Но — находила и, мало того, более чем в шестидесяти случаях из ста указывала правильно.
Что получилось у программы больше всего, с максимальной степенью вероятности — так это определения такого личностного показателя пользователя, как открытость, способность идти на контакт с незнакомыми людьми. Еще одна характеристика пользователя оказалась точной близко к ста процентам: готовность человека принимать или отвергать изменения.