Читаем Google. Прошлое. Настоящее. Будущее полностью

Вместо того чтобы полагаться на помощь группы редакторов или на то, как часто слово появляется на вебстранице, Google ранжирует каждую веб-страниу с помощью PageRank… Революционная технология PageRank оценивает все сайты, связанные с данной веб-страницей, и присуждает им важность, частично основанную на сайтах, которые указывают на них. Посредством анализа всего содержания веб-страницы система Google способна определить, за какие сайты те, кто более всего интересовался данной информацией, «проголосовали» как за наиболее ценные источники, предлагающие эту информацию(13).

Как уже говорилось, программу, которая делает поисковую систему Google уникальной по сравнению со всеми остальными, Ларри назвал своим именем. Идея, лежащая в ее основе, аналогична той, которая действует в академических исследованиях. Суть в том, что значимость научной публикации определяется тем, сколько раз на нее ссылаются солидные академические издания. Чем чаще коллеги ссылаются в своих работах на данную публикацию, тем больше значимости и релевантности она приобретает.

А на корпоративной странице Google объяснено, каким образом этот процесс усложняется:

PageRank полагается на демократическую природу Сети, используя систему ссылок как индикатор ценности отдельной страницы. Вместо того чтобы подсчитывать прямые ссылки, PageRank рассматривает ссылку со страницы А на страницу Б как голос в пользу страницы Б от страницы А. Затем по количеству полученных голосов PageRank определяет значимость данной страницы. PageRank оценивает также важность каждой страницы, принимающей участие в голосовании. При получении голосов от страниц с большей значимостью ссылка становится более ценной. Поисковая система Google, как и другие системы, также анализирует содержание страницы, на которой расположена та или иная ссылка. Поисковый движок Google анализирует не только все содержание страницы <…> но и содержание соседних веб-страниц, чтобы убедиться в том, что полученные результаты наиболее точно соответствуют запросу пользователя(14).

Но и это всего лишь часть протокола. Как ни трудно это себе представить, но PageRank для объективной оценки значимости веб-страниц учитывает более 500 миллионов переменных и три миллиарда терминов и тем не менее умудряется выдать результат в доли секунды. И все же поисковый алгоритм в значительной степени упрощен.

Как отмечает профессор Стэнфордского университета и один из первых инвесторов в Google Раджив Мотвани, «как вы, между прочим, могли бы заметить, поисковая машина, в сущности, делает почти то же, что скромный библиотекарь, только более сознательно! В то же время автоматизированные программы поиска помогают нам угнаться за экспоненциально возрастающим объемом информации»(15).

Платформа властвует

В мире компьютеров и Интернета английское слово platform (платформа) многозначно. Иногда речь идет о физической платформе, то есть совокупности оборудования, иногда – о программном обеспечении, иногда – обо всем вместе, а иногда оно означает и сам Интернет или конкретную вебстраницу, а то и поисковик. В общем, это слово может касаться любого из вышеназванных элементов.

«Платформа – по сути, игровое поле», – объясняет чикагский эксперт в области компьютерных технологий Джон Макдугалл:

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже