К группе а
) были отнесены такие параметры, как возраст, пол, политические и религиозные взгляды, семейное положение, сексуальная ориентация, размеры и плотность личной социальной сети. В группу б) вошёл только один параметр — этническая принадлежность. В группу в) были включены психологические параметры, характеризующие индивидуальность личности человека по общепризнанной 5-факторной модели (невроз или эмоциональная стабильность, экстраверт или интраверт, открытость к новому опыту или закрытость, уступчивость или конфликтность, добросовестность или нет)[15]. В данной работе использовались данные по 5-факторной модели для 54 373 участников, полученные с помощью обобщения ответов на вопросы международного обследования[16].Кроме того в группу в
) попали оценки уровня интеллектуального развития[17], удовлетворённости жизнью[18] и статус взаимоотношений между родителями подростка до достижения им 21 года.Для предсказания параметров каждой группы использовались различные методы. Для прогнозирования количественных параметров (возраста или уровня интеллектуального развития) использовались линейные регрессионные модели; для дихотомических параметров (пол или сексуальная ориентация) модели логической регрессии. В обоих случаях применялась 10-кратная перекрёстная оценка параметров регрессионных уравнений, построенных по 100 выделенным значимым факторам (SVD components
). Для предсказания таких параметров, как сексуальная ориентация, статус взаимоотношений между родителями подростка, а также потребление алкоголя, наркотиков и сигарет, было выбрано 30 значимых факторов (из-за относительно небольшого количества представленной информации). Результаты предсказания дихотомичных "атрибутов" представлены на рис. 2.
Точность предсказания дихотомичных «атрибутов»
Сверху вниз:
— семейное положение (одинокий или нет);
— жили ли родители вместе до достижения подростком 21 года;
— употребление сигарет, алкоголя, наркотиков;
— являешься ли белым американцем или африканского происхождения;
— христианин или мусульманин;
— демократ или республиканец;
— являешься ли геем, лесбиянкой;
— пол.
Учёные обнаружили, что надёжнее всего данная методика различает пол участника (вероятность 93 %), а также его этническую принадлежность, точнее, является ли он белым американцем или африканского происхождения (вероятность 95 %). Далее, выяснилось, что, анализируя пометки like
на предпочитаемых пользователями фильмах и телевизионных шоу (на фоне прочей информации), можно с 88-процентной точностью угадать сексуальную ориентацию мужчин и с 75-процентной — женщин[19]; с точностью 82 % определить христиан и мусульман; с точностью 85 % отличать американских "демократов" от "республиканцев". Достаточно высоким оказалось доверие в отношении употребления наркотиков, алкоголя и сигарет (примерно 70 %).Оценивая это исследование, уместно вспомнить, что развитие методов предсказания тех или иных индивидуальных наклонностей и "атрибутов" личности на основе её различных проявлений (поведения) имеет долгую историю. Психологической науке давно известны работы, в которых в качестве исходных использовались такие материалы, как образцы письменного текста[20]
, ответы на специальные психометрические тесты[21] (например, обследование на "детекторе лжи") или анкетирование для выявления "ролевой функции" данной личности в среде её обитания[22].Сегодня в психологической науке многое изменилось. Во-первых
, если раньше особые и весьма специфические по своему характеру методы и методики применялись, как правило, немногочисленными высококвалифицированными профессиональными экспертами-психологами и только в рамках научных, медицинских и/или криминалистических исследований, то сегодня такие методы и методики стали доступны для использования в коммерческих целях и без каких-либо морально-этических ограничений. Во-вторых, если раньше такие методы и методики применялись для анализа малых выборок (примерно несколько сотен представителей), то сегодня они могут использоваться для классификации широких масс обитателей киберпространства (сотни миллионов и более).