Facebook или других социальных сетях. По словам Алек- сандра Граубнера-Мюллера, одного из основателей фирмы, список ваших друзей выдаёт немало. Претен- дент, приятели которого прилично зарабатывают и жи- вут в хороших районах, имеет больше шансов на кредит. Претендент, знакомый которого отказался возвращать деньги, занятые у Kreditech, ничего не получит.
В качестве одного из наиболее ярких примеров сложных прогнозных систем можно привести проект Recorded Future. В январе 2010 года проект Recorded Future был запущен за счет инвестиций Google, инвести- ционного фонда американского разведывательного со- общества In-Q-Tel и собственных вложений К. Альберга – основателя проекта, в прошлом шведского разведчика и известного программиста.
Recorded Future базируется
на
трех основных
блоках:
• Встроенном поисковике третьего поколения. В пер- вом поколении были системы типа Yahoo и HotBot. Они искали просто те или иные слова в документах и выдава- ли документы в произвольном порядке. Поэтому такого рода поисковики сопровождались каталогами, форми- ровавшимися в основном экспертами на основе поис- ковой выдачи. Нечто подобное можно до сих пор уви- деть на первой странице Rambler. Вторым поколением стал Google. Революция Брина-Пейджа состояла в том, что поисковик стал искать не только по документам, но и в значительной степени по связям между документами или сайтами. Третье поколение ищет не только объекты, соответствующие поисковым запросам, не только связи между документами, но и взаимосвязи между объекта- ми, их характеристиками и отношениями, содержащи- мися в различных документах. Сегодня это главное на- правление развития поиска. Оно в полной мере реали- зовано в Recorded Future.
• Разделении информационного поля на составляю- щие. В Recorded Future выделено три класса сообщений.
Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ
Первый – это сообщения о событиях. События – это для- щиеся определенный, достаточно небольшой период времени устойчивые конфигурации, которые характери- зуются единством времени, места, участников и т.п. К со- бытиям Recorded Future относит то, что может быть ин- терпретировано как факты, то, что реально произошло или происходит в данный момент. Второй – это мнения. К мнениям относятся любые сообщения относительно прошлых, настоящих или будущих событий, высказан- ные в авторитетных источниках, либо авторитетными людьми. В системе есть специальные алгоритмы, кото- рые позволяют для каждой области выделить большую выборку таких источников и персон. Наконец, третий – это реакции. Здесь принимаются во внимание любые спонтанные реакции людей на те или иные ожидаемые события, зафиксированные в различного рода тексто- вых сообщениях. Не обязательно, чтобы эти сообщения были из авторитетных источников. Главное, чтобы они имели отношение к событиям и мнениям, так или ина- че рассматриваемым и высказываемым в авторитетных источниках. Такое разделение на три сегмента информа- ционного поля, как выяснилось, позволяет достаточно хорошо улавливать как господствующие тенденции и опережающим образом реагировать на их изменения, так и выявлять слабые сигналы.
• Рассмотрении интернета, как огромной распреде- ленной сетевой базы неструктурированных данных. Еще у древних греков были знаменитые Мойры, которые пря- ли нити судьбы, образующие ткань реальности. Сестер было три. Первая олицетворяла, как мы теперь говорим, тренды. Вторая – случайности. Третья – неотвратимость последствий поступков и решений. Собственно Recorded Future использует поисковик, работающий в сегменти- рованном информационном пространстве в масштабе огромной сетевой базы данных. В сетевой базе данных разные объекты и их характеристики связаны друг с дру-
Глава 3 БОЛЬШИЕ ДАННЫЕ
гом прямыми, обратными и опосредованными связями. Соответственно, такой подход позволяет выявлять не только явные и очевидные связи, но и вести так назы- ваемый латентный анализ, т.е. получать неочевидные, а иногда даже и абсолютно не предполагаемые связи и от- ношения. К тому же обрабатывать огромное количество информации в алгоритмическом режиме. Т.е. опериро- вать информационными массивами, непосильными для непосредственной обработки человеком.
В настоящее время Recorded Future используется в трех сферах: государственной разведке и безопасности, в бизнесе, и в финансах для разработки инвестиционных стратегий.
Другим ярким примером прогностических систем нового поколения является платформа Quid. Эта систе- ма создана известным американским программистом и разработчиков Ш. Горли на деньги знаменитого Питера Тиля, чья разведывательная программа Palantir является любимым инструментом американского разведыватель- ного сообщества.