Затем сервис был несколько модифицирован, поскольку, с точки зрения Яндекса, этого сегодня уже недостаточно. Один из разработчиков сервиса Алексей Пяллинг так объяснил происшедшие изменения: “„Обычный” словарь — это, конечно, хорошо. Но в наше время, когда новые слова появляются чуть ли не каждый день, поддерживать актуальность словаря невозможно. Сами посудите, ежедневно регистрируются новые фирмы, появляются новые музыкальные группы, новые спортсмены выигрывают новые соревнования. Возникающие при этом новые слова часто бывают непроизносимыми, нечитаемыми и даже непечатными. Разбором и анализом таких ситуаций в Яндексе как раз и занимается новый алгоритм, автоматически строящий словарь исправлений. Запросы пользователей собираются и анализируются, обрабатывается статистика. Если оказывается, что по какому-то слову есть много вариантов исправлений, то из кластера выбирается похожее слово из наиболее распространенных в Интернете. Таким образом, появляется база пар „плохих” и „хороших” слов — слов с ошибками и исправленных, и каждое слово в запросе пользователя теперь проверяется по такому „народному” словарю”.
“Афтар” и “автор”.
Инициатива — наказуема. И Яндекс начал получать письма возмущенных пользователей, которые обвинили поисковик в безграмотности. На одно из таких писем ответил директор Яндекса по технологиям и разработке Илья Сегалович: “Нам задают вопросы про Query-based speller, который наряду со словарным орфографическим корректором работает на поиске Яндекса. Автор письма пишет: „Однако меня все равно не устраивает, когда в ответ на запрос ‘афтор‘ с одной опечаткой мне говорят, что, возможно, следует писать ‘афтар‘, а не ‘автор‘”. Отвечаем: [автор] и [афтар] — два разных слова, они принадлежат к двум разным пластам языка, имеют разную сочетаемость. По ассоциациям запросов видно, что такую опечатку делают т. н. „падонки”, которые намеренно пишут это слово через „ф”. Нормальный человек не поставит случайно вместо „в” букву „ф” — и по звучанию не похоже, и расположена она на клавиатуре не рядом. Иными словами, замену [афтор] — [афтар] мы считаем вполне адекватной. Более того, по-видимому, орфографической ошибкой является написание [автор жжот]. Правильно [афтар жжот]””.