К. Санстейн и Р. Талер не ограничились при построении своего метода исключительно достижениями психологии и нейронаук. Как раз к моменту написания их книги начался бум Больших Данных. При этом быстро стало понятно, что Большие Данные тем Больше, чем больше характеристик того или иного объекта, субъекта и т. п. они охватывают, чем больше параметров, характеристик содержится в Данных, и чем чаще эти Данные собираются.
Сегодня в Америке имеется несколько провайдеров данных о людях, социальных группах и компаниях. Крупнейший из них, Аcxiom имеет полный набор данных более чем на 500 млн. человек, включая большинство взрослых американцев и жителей других стран. Общее число параметров цифровой личности каждого человека, включенного в базу компании, в среднем составляет в США около 50.
Однако, самый большой провайдер данных — это американское правительство. Официально это — финансовые, налоговые службы, системы медицинского страхования и т. п. В имеющихся у государства и крупнейших частных провайдеров данных содержится практически все. От номеров социального страхования и водительского удостоверения до историй болезни и взаимоотношений с кредитными учреждениями. От девичьей фамилии матери до перечня мелких административных правонарушений. Третьей составляющей технологии К. Санстейна и Р. Талера стало использование Больших Данных в виде поведенческого архива, т. е. интернета. Как сказал уже упоминавшийся автор триллеров Майкл Маршалл Смит: «Цифровые следы, в отличие от следов на земле, остаются навечно».
Фактически интернет, помимо многого другого, является еще и всеобъемлющим цифровым поведенческим архивом, в котором зафиксирована активность людей в Сети за многие годы. При этом в архиве содержатся данные как о практических действиях, включая различного рода поездки, покупки, обращения к врачам и т. п., так и мысли в виде текстов и, наконец, даже намерения и эмоции, материализованные в коротких записях в социальных сетях, в текстах электронных писем и т. п. Этот архив имеет распределенную архитектуру. Его составные блоки имеются у поисковиков, у владельцев социальных сетей, в крупнейших интернет-магазинах, интернет-сервисах и, конечно же, у структур американского правительства, прежде всего, в АНБ.
Наличие огромного всеобъемлющего поведенческого архива позволило компаниям — владельцам Больших Данных использовать их для предсказания поведения. Проиллюстрируем это широко известной в Америке историей. Однажды в магазин крупнейшей торговой сети Target зашел мужчина и потребовал вызвать менеджера. В своих руках он сжимал огромную кипу купонов магазина, полученных его дочерью.
«Моя дочь получила это по почте! — прокричал он. — Она еще в школу ходит, а вы посылаете ей купоны на детскую одежду и памперсы? Да как вы смеете! Вы хотите таким способом побудить школьниц рожать?»
Менеджер посмотрел на пачку купонов на материнскую одежду, детскую мебель — действительно, они были адресованы дочери рассерженного мужчины. Менеджер принес свои извинения.
Через несколько дней он позвонил мужчине, чтобы еще раз извиниться. По телефону голос отца звучал растерянно. «Знаете, я серьезно поговорил с дочерью, и выяснилось, что в моем доме происходило то, о чем я совершенно не догадывался. Она рожает в августе. Примите мои извинения».
Поэтому Target поставил перед отделом прогнозной аналитики задачу: определить, какая из покупательниц ждет ребенка до того, как это станет очевидно. Проанализировав покупательские привычки беременных женщин, аналитиками была разработана система прогнозирования беременности.
Представим себе ситуацию: молодая женщина заходит в магазин и покупает лосьон с кокосовым маслом, сумку для прогулок и ярко-голубой плед. Программное обеспечение в Target выдаст свой вердикт: вероятность беременности этой покупательницы — 87 %. Данные поступают маркетологам, и теперь Target начнет формировать ее привычки и управлять ими: пришлет ей купон со скидкой на детскую кроватку, присыпку, детские бутылочки и т. д. Причем это будет выглядеть ненавязчиво, чтобы не вызвать волну негодования за «шпионаж»: скидки на товары для детей помещаются среди скидок на другие товары.
«Подталкивание» («Надж») представляет собой использование поведенческих стереотипов, психофизиологических реакций и Больших Данных для целенаправленной коррекции поведения тех или иных конкретных социальных, имущественных, возрастных и т. п. групп. Для коррекции поведения используется открытый Куртом Левиным канальный, или тоннельный эффект. Выбор тех или иных факторов воздействия, которые обеспечивают реализацию этого эффекта, осуществляется на основе предсказательной аналитики и Больших Данных. В бизнесе это используется для увеличения продаж. А в политике, например, для прямого воздействия на электоральное поведение, как во время последних президентских выборов в США.