По версии «Яндекса», отключение произошло вследствие ошибки программного обеспечения на маршрутизаторе, расположенном в новом европейском дата-центре «Яндекса» в Амстердаме. Заместитель руководителя департамента эксплуатации Владимир Иванов (возможно, этот тот самый Владимир Иванов, у которого акций компании было больше, чем у Ильи Сегаловича, основателя «Яндекса») поздно вечером 19 августа в своем блоге объяснился с пользователями. По его версии, авария произошла из-за «проблем с маршрутизацией в сети “Яндекса”», то есть сбой был не связан «с работой дата-центров, DDoS-атаками, пожарами, а также любыми другими внешними факторами». Никакие пользовательские данные не потеряны. А «проблема была вызвана ошибкой программного обеспечения на маршрутизаторе, расположенном в нашем новом дата-центре в Амстердаме. В “Яндексе” используются протоколы маршрутизации — внутренний протокол OSPF и внешний протокол BGP. Из-за ошибки информация обо всех внешних маршрутах оказалась во внутренних таблицах маршрутизации. Это примерно на три порядка больше маршрутов, чем обычно. Протокол OSPF не рассчитан на такое количество. В результате у всех маршрутизаторов кончилась память, и они перестали работать. Нарушилась работа сети, и через несколько минут “Яндекс” стал полностью недоступен». По словам Иванова, внутренняя сеть поисковика тоже не работала, поэтому специалистам потребовалось много времени, «чтобы по цепочке добраться до источника проблемы». Когда администраторы исправили ошибку на маршрутизаторе, специалистам пришлось «разделить сеть на несколько частей», чтобы снять лишнюю нагрузку с остальных маршрутизаторов, которых в «Яндексе» больше сотни. Когда количество трафика снизилось, маршрутизаторы смогли самостоятельно восстановить связность сети, и через некоторое время сервисы «Яндекса» стали доступны большей части пользователей.
По наблюдениям Игоря Ашманова (из компании «Ашманов и партнеры»), это был как минимум третий крупный сбой в истории «Яндекса».
Примерно через год, 8 октября 2012 г., около 14:40 у части пользователей оказалась недоступной главная страница «Яндекса» — http://yandex.ru
. У другой части пользователей с главной страницы невозможно было перейти к сервисам «Яндекса», включая поиск. По данным Lenta.Ru и сервиса HostTracker, в результате масштабного сбоя «Яндекс» был недоступен для 41 из 42 серверов, находящихся в разных городах мира. Около 15:15 работоспособность главной страницы «Яндекса» была восстановлена.Представители компании сообщили, что к этому времени последствия сбоя были полностью устранены, и принесли извинения пользователям за доставленные неудобства. О причинах и масштабах сбоя комментариев не последовало.
Вообще-то сбоев немного, к тому же в масштабах гигантской системы. Удивительно.
Это свидетельствует не только об исключительности технологий, надежности инфраструктуры, исполнительной дисциплине и оптимальной структуре, но и об эффективности управления системой во главе с генеральным директором Аркадием Воложем. Такой вот банально-глобальный вывод из локального, казалось бы, события.
С голландским акцентом
«Переломный момент наступил в 2004 г. Мы поняли, что народу много, все вроде бы заняты делом, а ничего стоящего на свет не появляется…» По словам Воложа, это был момент истины, потому что исчерпан был ресурс развития компании как большой дружной компании, семьи: «Мы поняли, что в таком режиме, делая все по-старому, мы уже не можем расти дальше и при этом сохранять управляемость. И тогда началась большая перестройка».
И Волож вовремя прочувствовал необходимость изменения структуры компании. Важное обстоятельство: создание новой «более четкой корпоративной структуры происходило не по учебникам, а на уровне здравого смысла», как говорит сам Волож.
Старт этому процессу был дан во время одного разговора Аркадия Воложа и набирающего силу управленца Дмитрия Иванова (ныне директор «Яндекса» по проектам), пришедшего в компанию в 2003 г. из Фонда эффективной политики (ФЭП).
«Митя меня спросил, со сколькими людьми мне удобно работать напрямую. Я ответил: ну, где-то с семью. Отлично, говорит он, значит, сделаем семь департаментов. А они уже будут работать с остальными», — рассказывает Волож.
Забавно, что Волож сказал — семь. Число 7 — символ гармонии и уравновешенности природного мира, код природы. Впрочем, может быть, Аркадию в тот момент вспомнились семь гномов из гриммовской сказки про Белоснежку или семь богатырей из пушкинской сказки про мертвую царевну. Из собственного детства или детства его детей.