Когда владельцы сервера-сирены убеждены в том, что этот сервер занимается научно обоснованными вычислениями – то есть анализом и прогнозированием событий, просвещающих человечество, – а сервер набирает все больше влияния, ничего полезного из этого не выйдет.
Иногда объективная проверка больших массивов бизнес-данных показывает, что эти замки в облаках никогда не существовали на самом деле. Поток хвастовства соцсетей, пытающихся продать рекламу, нескончаем. Продавцы громко заявляют, что их система способна создать подробнейшую модель целевой аудитории и выявить ее так же точно, как военный дрон – боевиков Талибана. Но эту же систему смогут легко и просто обмануть дети, выдающие себя за взрослых.
И все же фантазия о точности никуда не исчезает. В момент запуска сервера-сирены можно почти физически ощутить сладостное упоение властью. Это ваш пост перехвата информации. Информационное превосходство у вас в руках. Одна из сильнейших иллюзий нашего времени – считать, что это ты ведешь игру, а с тобой никто не играет.
Природа больших массивов данных бросает вызов человеческому восприятию
Говоря по-простому, стоит признать, что на Facebook существует две версии вас: на поддержание имиджа первой вы бросаете все усилия, вторая же – величайшая в мире тайна, а именно данные о вас, которые продаются третьим лицам, например рекламодателям. Этих данных о себе вы никогда не получите.
Но дело даже не в том, что их от вас скрывают. Сами по себе они не будут иметь никакого смысла. Они неотделимы от всех остальных глобальных данных, которые собирает Facebook. Исходя из поведения современных людей, самые ценные и охраняемые данные – это результаты статистических корреляций. Эта информация нужна для работы алгоритмов, но люди редко видят ее и еще реже могут ее осмыслить.
Возможно, люди с кустистыми бровями, которые осенью собирают мухоморы, действительно захотят добавить острый соус в картофельное пюре весной. Не исключено, что это правдивая информация, обладающая коммерческой ценностью, но никто и никогда не сообщит о подобном совпадении, если его обнаружит. Вместо этого продавец соуса теоретически сможет разместить рекламную ссылку прямо на виду у пользователя, повысив шанс, что она попадется правильному человеку, и никому не нужно знать, почему именно.
Коммерческие корреляции больших массивов данных почти всегда скрыты. Это крошечные математические составляющие программ, обеспечивающих прибыль или влияние тем или иным корпорациям – владельцам облачных серверов. Если ту или иную корреляцию отделить от остальных и раскрыть, какой от нее толк? В отличие от крупиц научных данных, это не компоненты четкой структуры, и они не обязательно сохранят смысл в отрыве от контекста.
Проблема с магией
Большие массивы данных, хотя и кажутся волшебством, запросто могут сбить с толку. Разве это не очевидно? Углядеть в чем-то магию – значит достигнуть пределов собственного понимания.
Когда статистическую корреляцию путают с пониманием, за это приходится дорого расплачиваться. Примером такой путаницы стала череда финансовых кризисов в начале двадцать первого века. Гигантские инвестиционные пакеты, созданные за счет корреляций, оказались пустышками. Из-за них весь мир оказался в долгах, что привело к введению жестких экономических мер. И все же виноваты в этом далеко не всегда финансисты, хотя бы потому что финансовые механизмы были сложными и почти полностью автоматизированными.
Можно задать закономерный встречный вопрос, почему в большие массивы бизнес-данных все еще верят и продолжают их применять, даже несмотря на то, что они уже доказали свою полную несостоятельность. Ответ очевиден: потому что большие массивы бизнес-данных помогают очень быстро и в большом масштабе получить влияние и деньги.
Игра началась
Почему большие массивы бизнес-данных часто оказываются несостоятельными? Их ненадежность – коллективный проект, в котором мы все принимаем участие. Все дело в коллективном разуме.
Владелец потенциального сервера-сирены сначала может выгодно пользоваться честным доступом к данным в качестве невидимого наблюдателя. Но если ему повезет преуспеть и его сервер действительно станет сиреной, все изменится. Поднимется волна манипуляций, и собранные данные станут сомнительными.
Если работа сервера основана на отзывах, среди них появится множество фальшивых. Если в основе его работы лежит стремление к известности, то внезапно там окажется множество фальшивых заискивающих поклонников, поддерживающих иллюзию популярности. Если сервер пытается вычислить самых кредитоспособных или привлекательных людей, ждите, что их профили окажутся по большей части липовыми. Подобные иллюзии создают или умные третьи лица, чтобы внести в работу сервера какое-то оживление, или же те, кто хочет извлечь из сетевой жизни пусть и небольшую, но выгоду.