Третье. За последние четыре года Соединенные Штаты истратили несколько сот миллионов долларов на разработку программ интеллектуального анализа не просто Больших, а сверхбольших массивов данных. При- мечательно следующее обстоятельство. В коммерче- ском секторе для анализа Больших Данных в основном используются методы математической статистики. В то же время, анализируя гранты таких агентств, как DARPA и IARPA, можно увидеть, что средства затрачивались на разработку программ по анализу и прогнозированию на основе Больших Данных, базирующихся на принци- пиально новых разделах математики, типа теории кате- горий и функторов, на системах распознавания образов, нейронных вычислениях и так называемом глубоком машинном обучении. Все эти методы на порядки пре- восходят с точки зрения выявления нетривиальных за-
Глава 3 БОЛЬШИЕ ДАННЫЕ
висимостей и связей, мощности и точности прогнозиро- вания, методы стандартной математической статистики, которые описываются как основной инструмент во всей специализированной литературе по Большим Данным.
Четвертое. Последние годы в США предпринимают- ся организационные и законодательные меры по обе- спечению потребностей разведсообщества Большими Данными. Прежде всего, следует иметь в виду, что само по себе Агентство Национальной Безопасности является обладателем крупнейших массивов Больших Данных, которые оно получает в результате своей шпионской де- ятельности, о которой мир сегодня неплохо осведомлен благодаря разоблачениям Э. Сноудена.
Гораздо менее известна организация FSD. В перево- де на русский она может быть названа Службой Феде- ральных Данных. Главным ее назначением является кон- центрация данных об американцах, которые собирают практически все федеральные ведомства, министерства, агентства и т.п. Без преувеличения можно сказать, что не в одной стране мира нет такой подробной базы данных на своих граждан, как в Соединенных Штатах, и содер- жится эта база не в АНБ, а в неприметной организации с указанным выше названием. При этом надо иметь в виду, что в данную организацию дополнительно стека- ются все данные из страховых компаний, банков, пенси- онных фондов, авиакомпаний и т.п. под американской юрисдикцией. Соответственно, если те или иные люди застрахованы в американской компании, обслуживают- ся американскими банками или банками, имеющими корреспондентские счета в американских банках, лета- ли американскими авиалиниями или используют аме- риканские кредитные карты, типа Visa, American Express и т.д., то все их данных также попадают в эту организа- цию, а оттуда – в Центр Больших Данных АНБ.
Э. Сноуден не просто рассказал, а даже показал на слайдах связь с АНБ крупнейших интернет-компаний
Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ
и телекоммуникационных гигантов. В результате прои- зошел большой скандал. Компании сначала протесто- вали, затем сообщили, что вносят соответствующие тре- бования в Конгресс США о том, чтобы прекратить прак- тику использования их данных в интересах АНБ. Однако от публики, и даже большинства экспертов укрылось крайне важное обстоятельство. Речь в протестах идет о персональных данных, т.е. данных, по которым можно идентифицировать пользователя как Ивана Ивановича Иванова, либо Джона Смита Третьего и т.п.
Большие же Данные – это не персональные данные. В принципе, персональные данные могут быть Больши- ми Данными, а могут и не быть. Более того, для техно- логий Больших Данных сама по себе идентификация конкретного человека не важна и не интересна, потому что связи и закономерности, выявляемые при помощи Больших Данных, имеют статистический характер, а не касаются судьбы конкретного индивидуума. Про Боль- шие Данные речь в разоблачениях Э. Сноудена вообще не шла.
Практически все крупнейшие провайдеры Боль- ших Данных, а ими являются Google, Facebook, Twitter, Amazon, eBay и т.п., имеют американскую юрисдикцию. Между тем, в антитеррористическом законе США, име- нуемом как «Акт 2001 года, сплачивающий и укрепляю- щий Америку обеспечением надлежащими орудиями, требуемыми для пресечения терроризма и воспре- пятствования ему» и Указе №13603 от 16 марта 2012 г. подписанном Президентом Б. Обамой, озаглавленном
«О готовности ресурсов национальной обороны» четко прописаны обязанности американских компаний с точки зрения национальной обороны.
В число этих обязанностей входит предоставление данных, потребных для выполнения задач националь- ной обороны. Известно, что Большие Данные подпадают под юрисдикцию этих указов. Причем, если в отношении
Глава 3 БОЛЬШИЕ ДАННЫЕ
персональных данных вообще и американцев в частно- сти предусмотрены некоторые ограничения, связанные с необходимостью решений Секретного Суда для полу- чения таких данных, то Большие обезличенные Данные должны предоставляться что называется в рабочем по- рядке по требованию.