Может, и не собираются, но раздвигание границ продолжится. По обыкновению, на основе анализа данных. В 2009 г., согласно специальному исследованию, проведенному «Яндексом», примерно четверть из 15 млн российских сайтов почти не содержат полезных сведений, а порядка 88 % текстовой информации сконцентрировано всего на 1 % сайтов. Именно этот 1 % и является наиболее интересным для пользователей. По утверждению «Яндекса», такое соотношение справедливо для всей мировой Сети. Из этого наблюдения следует рецепт действий: для того чтобы ответить на запрос пользователя, необязательно индексировать всю информацию. Достаточно выбрать авторитетные источники по теме и ранжировать их, чтобы на самом верху выдачи оказались наиболее подходящие пользователю или релевантные запросу результаты
.19 мая 2010 г. запущен поиск в англоязычном Интернете в доменах. ru, ua, kz и. by и yandex.com. Поисковик начал индексировать зарубежные сайты около двух лет назад, но в выдаче (страница, которая является ответом на запрос пользователя) иноязычные результаты появлялись вместе с русскоязычными — скорее как дополнительные данные. С 19 мая 2010 г. «Яндекс» по англоязычным запросам стал готовить выдачу исключительно по зарубежным сайтам. Получить ее можно, используя либо фильтры поиска на портале http://yandex.ru
, либо тестовую площадку http://yandex.com, на которой иностранный поиск установлен по умолчанию. Это по-настоящему историческое событие в бизнес-биографии «Яндекса».В компании отмечают, что поиск по зарубежным ресурсам ориентирован на русскоязычную аудиторию. «Яндекс» стремится к тому, чтобы пользователи оставались с ним в случае формулирования иноязычных запросов, которых насчитывается уже 12–15 % (1,5–2 млн пользователей).
По оценке «Яндекса», суммарно в мировой Сети проиндексировано уже около 100 млрд страниц; по состоянию на 2010 г. «Яндекс» проиндексировал в Рунете 5,25 млрд страниц. И более 4 млрд веб-страниц на латинице, большая часть которых англоязычные, меньшая — на французском и немецком языках. Исходя из достигнутых на тот момент результатов поисковиков из первой тройки, чтобы конкурировать с ними, «Яндексу» поначалу достаточно проиндексировать в мировой Сети 20 млрд страниц.
Хотя Волож полагает, что выигрывает не тот, у кого больше индекс, а тот, у кого лучше поиск:
«Когда мы запускали мировой индекс, мы действительно делали его для своего рынка, в этом была его непосредственная практическая польза. Мы просто не могли себе позволить его не иметь. Но тогда же мы говорили, что собственный мировой индекс позволяет нам начать думать и о чем-то большем. В мире всего несколько компаний, которые имеют поисковые технологии и защищают свои рынки. Они всем известны: поисковые технологии есть в США, Китае, Южной Корее, Чехии и России. Больше нигде своего большого поиска нет. Но из всех этих национальных лидеров на сегодня только три имеют глобальные индексы. Это Google, Bing и “Яндекс”… Разумеется, просто пока мы не работаем на многих рынках. Но на тех рынках, куда мы выходим, наш индекс, как правило, больше. Вопрос не в общем количестве страниц в индексе, а в числе полезных. Для американцев и французов полезные страницы будут разными, индексы тоже. Поэтому сравнивать нас напрямую с другими поисковиками пока нет смысла… Если хотите, у нас другой подход: не глобальный, а транслокальный, так сказать».В интервью «РБК daily» Волож уточняет задачу: «Сейчас мы активно работаем над увеличением иностранной базы страниц… Содержательная база Интернета — это, по сути, несколько десятков миллиардов страниц. Наверное, это количество и есть цель для любого поисковика. Но цель любой поисковой машины — не проиндексировать много страниц, а выдать правильный и быстрый ответ. На 90 % успех нашей компании зависит от качества нашего поиска и информационных сервисов. Мы в последнее время активно работали в этой области… Мы внедрили новую поисковую технологию “Матрикснет” (в декабре 2009 г.), результатом которой в том числе стал рост нашей доли. Конечно, сыграло роль и то, что большинство наших сервисов ориентировано в первую очередь на русскоговорящих пользователей». Действительно, Рунет — это русскоговорящий, но не российский сектор мировой Сети.