•
•
•
•
3. ОКРУЖЕНИЕ. В 2002 г. активность оптимизаторов приняла формы, опасные для поисковых машин. Оптимизация сайтов проводилась автоматически при помощи скриптов, страницы оптимизировались сотнями тысяч и даже миллионами по любым словам, не обязательно ключевым для рекламируемого сайта. В итоге базы данных поисковых машин стали представлять собой чудовищную помойку, а качество поиска все ухудшалось и ухудшалось. Поисковые машины и вообще модель навигации через поиск в Интернете были на грани краха.
На самом деле я немного преувеличиваю, и реальное положение вещей было не столь удручающим, но вот качество поиска в начале 2000-х гг. действительно было очень низким – поисковые машины не справлялись с огромным объемом спама, которым их захламляли оптимизаторы.
Именно в этот момент родилась идея о необходимости использовать в технологии ранжирования какие-то дополнительные параметры, не зависящие или мало зависящие от владельца сайта и вообще внешние по отношению к сайту. Экспериментов в этот момент проводилось довольно много, но самый известный и наилучшим образом зарекомендовавший себя метод –
С момента изобретения алгоритм претерпел значительные изменения, разветвился и сейчас используется множеством других поисковых машин, а не только Google, в то время как другие механизмы практически не прижились. Например, Rambler в качестве инструмента ранжирования использовал данные собственного счетчика, считая, что из двух сайтов более посещаемый является более релевантным. Еще одним довольно новым, но еще мало распространенным вариантом является механизм меток – один из вариантов социального поиска, когда пользователи поисковой машины размечают результаты поиска вручную. Эти, а также другие пока неудачные эксперименты когда-нибудь снова могут оказаться «в строю» в новом исполнении, но пока Page Rank – основной инструмент оценки окружения сайта поисковой машиной.
На сегодняшний момент механизм Page Rank ранжирует сайты по количеству ссылок на них с других сайтов с учетом количества ссылок на сайты, с которых ведут ссылки. Для этого каждому известному поисковой машине сайту присвоен ранг, который зависит от числа и ранга ссьшающихся на него сайтов. Говоря иными словами, одна ссылка с Yahoo стоит существенно больше, чем несколько тысяч ссылок с сайтов-однодневок.
Поисковая система Яндекс использует очень похожий механизм учета ссылок в русскоязычном Интернете, который называется «индекс цитирования». У этого механизма есть свои особенности, однако общая схема выглядит примерно так же. Практически все современные поисковые системы так или иначе используют механизм ранжирования по внешним ссылкам.