Читаем Интернет как оружие. Что скрывают Google, Tor и ЦРУ полностью

Брин с детства проявлял незаурядные математические способности. В девять он открыл для себя интернет и стал зависать в чатах и в многопользовательских «подземельях»[25],{385}. Он часы напролет проводил в мире новых коммуникационных технологий, пока не разочаровался в нем, осознав, что там было полно людей вроде него – «десятилетних мальчишек, пытающихся поговорить про секс»{386}.

Брин окончил школу в 1990 году, на год быстрее, и поступил в Мэрилендский университет сразу на две специальности: математику и информатику. В 1993 году он с отличием выпустился и перебрался в Пало-Альто для продолжения обучения в Стэнфорде на аспирантском гранте, предоставленном Национальным научным фондом{387}. В Стэнфорде он увлекся темой извлечения данных – созданием компьютерных алгоритмов, которые могли бы предсказывать поступки людей на основании их прошлых действий. Что они хотят купить? Какие фильмы им понравятся?{388} Он даже создал студенческую группу под названием MIDAS (Mining Data at Stanford[26]). Впоследствии извлечение поведенческих данных действительно оказалось золотоносным для Google, как прикосновение Мидаса. Но тогда до этого было еще далеко. Когда Брину наскучила узкая тема его исследования, он решил создать новый проект со своим закадычным другом Ларри Пейджем. «Я общался с многими исследовательскими группами, но этот проект был особенно увлекательным, потому что он был связан с вебом, воплощением всех знаний человечества, и поскольку мне нравился Ларри», – вспоминал Брин в одном из интервью{389}.

Главная проблема поиска заключалась в релевантности информации. Одни веб-страницы были важнее и авторитетнее других, однако первые поисковики не видели между ними разницы. Пейдж понимал, что было необходимо встроить в результаты поиска рейтинговую систему. Простая, но мощная идея, пришедшая из академического мира, где важность научной работы измерялась количеством ее цитирований в других работах. Считалось, что процитированная тысячу раз статья важнее процитированной десять раз. Гиперссылочная структура интернета, где каждая веб-страница была связана ссылками с другими страницами, фактически делала его гигантской машиной цитирования. Это было открытие Пейджа. Он назвал свой экспериментальный проект PageRank и вместе с Брином приступил к его реализации.

Сначала они создали бота, который должен был «шерстить» интернет, собирая данные и сохраняя их на стэнфордском сервере. Затем они усовершенствовали алгоритм PageRank для получения релевантных результатов поиска. Так как разные ссылки обладали разной ценностью (ссылка на страницу газеты вроде New York Times была важнее ссылки на чей-то сайт-визитку), они скорректировали свои расчеты таким образом, чтобы страницы обсчитывались сразу и по количеству ссылок на них, и по «весу» этих ссылок. В итоге учитывались сумма всех ссылок и количественные выражения их ценности. Когда значения первых нескольких страниц попадали в алгоритм PageRank, новые данные ранжирования рекурсивно применялись ко всей сети. «Мы превратили весь веб в большое уравнение с несколькими сотнями миллионов переменных, которые представляли собой рейтинговые значения для всех страниц», – объяснял Брин после запуска Google{390}. Это была динамичная математическая модель интернета. Если менялось одно значение, то происходил перерасчет по всей сети{391}.

Они вложили алгоритм в экспериментальный поисковый движок, который назвали BackRub, и запустили его для стэнфордской внутренней сети. Логотип BackRub был жутковатый: черно-белая фотография ладони, приделанной к волосатой руке, которая чесала голую спину. Но никому до этого не было дела. Когда о поисковике прослышали студенты, то они стали активно им пользоваться и были поражены. Студенческий проект оказался лучше, чем любой имевшийся на тот момент коммерческий поисковик вроде Excite или AltaVista. Ведущие поисковые компании стоили миллиарды, но не понимали, чем занимались. «Они видели только текст, но не учитывали ничего, кроме него», – говорил Пейдж{392}.

Поисковый движок, который друзья быстро переименовали в Google, стал таким популярным, что превысил пропускную способность стэнфордской сети. Брин и Пейдж осознали, что они сделали нечто особенное. Google был больше, чем просто исследовательский проект.

Перейти на страницу:

Похожие книги

Недокументированные и малоизвестные возможности Windows XP
Недокументированные и малоизвестные возможности Windows XP

Книга содержит подробные сведения о таких недокументированных или малоизвестных возможностях Windows XP, как принципы работы с программами rundll32.exe и regsvr32.exe, написание скриптов сервера сценариев Windows и создание INF-файлов. Р' ней приведено описание оснасток, изложены принципы работы с консолью управления mmc.exe и параметрами реестра, которые изменяются с ее помощью. Кроме того, рассмотрено большое количество средств, позволяющих выполнить тонкую настройку Windows XP.Эта книга предназначена для опытных пользователей и администраторов, которым интересно узнать о нестандартных возможностях Windows. Тем более что довольно часто эти возможности позволяют обойти ограничения на те или иные функции Windows, установленные администратором. Р

Роман Александрович Клименко

ОС и Сети, интернет / ОС и Сети / Книги по IT
Сетевые средства Linux
Сетевые средства Linux

В этой книге описаны принципы действия и область применения многих серверов, выполняющихся в системе Linux. Здесь рассматриваются DHCP-сервер, серверы Samba и NFS, серверы печати, NTP-сервер, средства удаленной регистрации и система X Window. He забыты и средства, традиционно используемые для обеспечения работы Internet-служб: серверы DNS, SMTP, HTTP и FTP. Большое внимание уделено вопросам безопасности сети. В данной книге нашли отражения также средства удаленного администрирования — инструменты Linuxconf, Webmin и SWAT.Данная книга несомненно окажется полезной как начинающим, так и опытным системным администраторам.Отзывы о книге Сетевые средства LinuxПоявилась прекрасная книга по Linux, осталось воспользоваться ею. Не упустите свой шанс.Александр Стенцин, Help Net Security, www.net-security.orgЕсли вы стремитесь в полной мере использовать сетевые возможности Linux — эта книга для вас. Я настоятельно рекомендую прочитать ее.Майкл Дж. Джордан, Linux OnlineВыхода подобной книги давно ожидали читатели. Менее чем на 700 страницах автор смог изложить суть самых различных вопросов, связанных с работой Linux. Автор является высококвалифицированным специалистом в своей области и щедро делится своими знаниями с читателями.Роджер Бертон, West, DiverseBooks.com

Родерик В. Смит

ОС и Сети, интернет / ОС и Сети / Книги по IT