Научные журналы имеют еще и другое предназначение, помимо распространения информации о последних достижениях, скажем, в физической антропологии или органической химии. Они являются средством, с помощью которого ученые надежно «защищают свои владения» и создают репутацию среди коллег. При написании статьи для публикации профессор очень внимательно выстраивает свои аргументы через ссылки на уже имеющуюся литературу в заданной области, аналогично тому, как адвокат «отполировывает» дело, ссылаясь на прецеденты. Любая научная статья представляет собой свод многочисленных ссылок на другие научные работы. В совокупности научная литература формирует собственную паутину ссылок.
В 1950-х гг. американский лингвист Юджин Гарфилд разработал метод определения степени весомости представленной работы. Впоследствии ставший общепринятым, анализ цитирования заключается в подсчитывании количества ссылок на определенную статью в других работах. Так, знаменитая статья Эйнштейна о теории относительности, написанная в 1905 г., считается пятой из наиболее «важных» научных статьей, опубликованной до 1930 г., поскольку другие ученые ссылались на нее 450 раз.
Главным достижением Ларри Пейджа стало понимание того, что гипертекст – это всего лишь ссылка, а сам Интернет – литературный корпус тесно взаимосвязанных между собой текстов, который, по сути, ничем не отличается от издаваемых десятилетиями «бумажных» научных публикаций. Точно так же, как ученый будет ссылаться на работу А. Эйнштейна «К электродинамике движущихся тел», гурманы на форуме Chowhound.com будут ссылаться на «Лучшие рецепты в мире» Марка Биттмана в своих статьях о приготовлении блюда из сырой рыбы, маринованной в лимонном соке. Конечно, в первом случае речь идет о физике космической плазмы, в то время как во втором – о сырой рыбе, но, исходя из текстовой динамики, они имеют много общего.
С позиции сегодняшнего дня такое наблюдение – а именно то, что ссылка представляет собой упоминание документа в гипертексте, – кажется обычным явлением, но в то время это было выдающимся открытием. В 1995 г. Интернету исполнился всего один год, а «поисковые системы» находились в зачаточном состоянии. В то время Yahoo! тогда, как и сейчас, один из наиболее популярных интернет-адресов, представлял собой обычный каталог веб-сайтов, созданных основателями Yahoo! Джерри Янгом и Дэвидом Фило. Интернет-контенты ранжировались самими Фило, Янгом и их сотрудниками, а не с помощью независимых действий коллективных пользователей Интернета. Другие поисковые системы, как например АltaVista, работали по принципу запуска «пауков» в сеть Интернета, которые, пробираясь по паутине, будут отправлять обратно списки веб-страниц, впоследствии организуемых в главный каталог. Но еще не существовало какого-либо эффективного способа ранжирования результатов по степени их значимости. Поэтому, задав при поиске слово «токсичный», можно было легко наткнуться на «токсичные отходы»: странички, посвященные малоизвестным ирландским группам с таким названием, или зайти на сайт Агентства по охране окружающей среды США, публикующего список мест на территории страны с высоким уровнем содержания токсинов. Технологии плохо справлялись с задачей «укрощения» анархии, существовавшей в Интернете.
Официально Google был зарегистрирован 7 сентября 1998 г. Он использовал алгоритм своих основателей – PageRank (остроумная игра слов с использованием фамилии Ларри Пейджа, который сыграл такую же роль в развитии Интернета, как и Гарфилд в оценке научных публикаций). PageRank определяет актуальность и степень важности сайта путем подсчета количества других сайтов, ссылающихся на него, а также количества ссылок на сами эти сайты. В качестве примера допустим, что на обе страницы – Агентства по охране окружающей среды с информацией о токсичных территориях и фанатов группы Toxic Waste имеется по десять ссылок. Но на страницу агентства ссылаются различные университетские сайты, некоторые газеты и главная страница сенатора, на которые, в свою очередь, ссылаются несколько сотен маленьких сайтов. Общее количество ссылок в этой расширенной сети определяет так называемый Googlejuice сайта агентства, или его место в рейтингах. В этом отношении его сайт будет существенно опережать сайт фанатов группы, на который наверняка ссылались ему же подобные безвестные сайты. PageRank включает в себя и другие переменные величины, которых, если судить по работе Джона Баттеля «Поиск: как Google и его конкуренты переписали правила бизнеса преобразовали нашу культуру» (The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture75), насчитывается около двухсот, Но оценка значимости ссылок остается главным компонентом. Поисковая функция Google оказалась настолько эффективной при определении релевантности (а это обязательное условие для хорошей поисковой системы), что сайт достаточно быстро стал доминирующим игроком в индустрии веб-поиска.