Читаем Netflix. Инсайдерская история компании, завоевавшей мир полностью

Интеллектуальный анализ данных – это процесс определения значимых закономерностей в больших наборах данных, при помощи которых можно составить прогноз: мгновенная сортировка и фильтрация миллиардов веб-сайтов, которые образуют ранжированные результаты Google-поиска; определение аномалий среди нормальных клеток при автоматизированном медицинском сканировании; или подозрительные перемещения группы обладателей визы, которая может свидетельствовать о потенциальной угрозе для США.

Ученые, осваивающие интеллектуальный анализ данных, должны писать алгоритмы, которые анализируют набор данных для поиска важных паттернов, но также и отбрасывают ассоциации, которые могут казаться убедительными, но в итоге никуда не ведут.

Волынски был общительным мужчиной, чья детская страсть к бейсбольной статистике переросла в карьеру эксперта по интеллектуальному анализу данных; он любил конкурсы не только за возможность продемонстрировать, на что способна лаборатория AT&T, но и за азартную конкуренцию с лучшими умами мира в их развивающейся отрасли. Любил Волынски и фильмы, и вместе с Беллом, который также нашел свое призвание благодаря бейсбольной статистике, они оба были в восторге от возможности поэкспериментировать с огромным массивом реальных данных Netflix – набором рейтингов клиентов, который был в сто раз больше, чем любой, что попадался им ранее.

Еще до соревнования Netflix Prize Белл участвовал и выигрывал в конкурсах, но приз в 1 млн долларов и открытость – любой, у кого есть компьютер и Интернет, мог принять участие – придавали конкурсу особое очарование. Он быстро стал главной темой для разговоров в научных и академических кругах, в которые входил Белл, и именно ему выпал счастливый шанс получить кучу денег на глазах своих товарищей.

Около пятнадцати человек пришли на мозговой штурм, организованный Волынски сразу после того, как было объявлено соревнование Netflix Prize, но за пару недель число активных участников сократилось до трех человек, которыми были Белл, Волынский и самый юный их израильский коллега, Иегуда Корен.

Сначала они наблюдали за тем, как на поддерживаемой Netflix доске лидеров высветилась пара сотен решений, и по крайней мере два из них улучшили алгоритмы Cinematch в течение недели. Спустя месяц было уже несколько тысяч команд, лучшие из которых добились четырехпроцентного улучшения Cinematch по сравнению с использованием оригинальных решений. Погоня за призом в 1 млн долларов привлекла не только элиту интеллектуального анализа данных, но и специалистов из сообществ изучения машинного языка и математиков, а также гениальных разработчиков ПО – любителей и даже психологов.

Каждая команда была ограничена одной заявкой в день, но оживленные беседы велись и днем и ночью, так как участники со всего мира подписались на дискуссионный форум, предоставленный Netflix.

Для Корена этот неформальный конклав[27] гениальных умов, собравшихся вокруг одной-единственной задачи, был захватывающим. И дома и на работе он часами возился с их уравнениями и пытался опередить бурный прогресс на доске лидеров. Каждая корректировка уравнения могла украсть неделю и больше времени, которое обычно уходило на решение обычных рабочих задач – день на написание предлагаемого решения, несколько часов для проверки огромного набора данных с помощью мощных компьютеров, еще больше времени на анализ результата и внесение корректировок и еще много часов на повторную проверку данных. Каждый думал о конкурсе в любое, самое неурочное время, возможно, просыпаясь ночью с идеей о постепенном улучшении.

К четвертому месяцу конкурса участники команды BellKor были готовы разместить свою заявку на доске лидеров. После того как Netflix применила конфиденциальный набор данных для проверки их результатов, команда BellKor появилась среди участников конкурса на двадцатом месте. С тех пор Корен стал одержим, подталкивая Волынского и Белла попытаться подняться вверх на доске лидеров. «Посмотрим, попадем ли мы в десятку лучших», – сказал он. Затем в пятерку, а затем и в тройку лидеров.

В апреле 2007 года они ненадолго заняли верхнюю строчку, но только лишь затем, чтоб их вытеснили оттуда несколько дней спустя. Неделями они боролись за лидерство с Dinosaur Planet из Принстона и командой из четырех венгерских исследователей Gravity. На восьмом месяце BellKor снова вырвалась вперед, и на этот раз им удалось удержать свои позиции. Они получили первую награду Progress Prize в размере 50 000 долларов за улучшение Cinematch на 8,4 %. Когда на второй год они снова приняли участие в конкурсе, казалось, что главный приз в пределах их досягаемости.


Перейти на страницу:

Все книги серии Top Business Awards

Похожие книги

Алчность
Алчность

Тара Мосс — топ-модель и один из лучших современных авторов детективных романов. Ее книги возглавляют списки бестселлеров в США, Канаде, Австралии, Новой Зеландии, Японии и Бразилии. Чтобы уверенно себя чувствовать в криминальном жанре, она прошла стажировку в Академии ФБР, полицейском управлении Лос-Анджелеса, была участницей многочисленных конференций по криминалистике и психоанализу.Благодаря своему обаянию и проницательному уму известная фотомодель Макейди смогла раскрыть серию преступлений и избежать собственной смерти. Однако ей предстоит еще одна встреча с жестоким убийцей — в зале суда. Станет ли эта встреча последней? Ведь девушка даже не подозревает, что чистосердечное признание обвиняемого лишь продуманный шаг на пути к свободе и осуществлению его преступных планов…

Александр Иванович Алтунин , Андрей Истомин , Дмитрий Давыдов , Дмитрий Иванович Живодворов , Никки Ром , Тара Мосс

Фантастика / Детективы / Триллер / Фантастика: прочее / Криминальные детективы / Маньяки / Триллеры / Современная проза / Карьера, кадры