Читаем Неизведанная территория полностью

Нам стало ясно, что для того, чтобы собраться с мыслями, потребуется помощь других. Поэтому мы взяли четыре ноутбука, имевших доступ к базе данных n-грамов, – единственные четыре ноутбука в мире, способные работать с нашим прототипом интерфейса Bookworm, – и раздали их. Один отправился к Пинкеру, который принялся быстро создавать с его помощью графики для включения в книгу, которую писал в то время. Другой ушел Авиве, жене Эреца. Она тут же сообщила о новых открытиях – проверка n-грама для фамилии Мендельсон заставила ее углубиться в изучение темы цензуры. Теперь на этот наркотик подсела и она.

Третья машина отправилась к Мартину Новаку. Как-то раз, вернувшись домой, он показал Bookworm своему сыну Себастьяну, которому в то время было 16 лет. Себастьян ввел запрос. На экране появился график. Заинтересовавшись, он попробовал еще; а после еще двух запросов он забрал машину у Мартина и удалился. Уже через несколько минут работы он позвонил другу: «Ты должен сейчас же прийти и увидеть, что у меня есть». Друг пришел, и они отправляли запрос за запросом до глубокой ночи.

Последняя машина отправилась на Библиотечный саммит 2010 года, проводившийся компанией Google. Нас пригласили сделать на этом мероприятии доклад. Именно на этом саммите Google обычно рассказывала главам многих библиотек мира о последних новостях своего проекта по оцифровке.

Наверное, вы считаете библиотекарей тихими и спокойными людьми. Мы столкнулись с обратной картиной.

После того как мы объяснили базовую концепцию того, чем занимаемся, уровень энтузиазма в зале резко возрос – никто и никогда не слышал ни о чем подобном (по крайней мере в таких масштабах). Мы смогли привлечь внимание каждого человека, находившегося в переполненном зале. Ко времени, когда мы стали показывать примеры, комната наполнилась удивительной энергией. Наконец, после 45 минут общения мы перестали разговаривать и загрузили Bookworm.

Мы поинтересовались у аудитории: «А теперь… какие мы отправим запросы?» В ответ раздались бурные аплодисменты, подобных которым мы не слышали никогда в жизни. Но библиотекари еще и принялись кричать, не в силах сдержать эмоции:

– Сравните слова «он» и «она»!

– Давайте попробуем «глобальное потепление»!

– «Пираты» против «ниндзя»!

Комната буквально взорвалась от восторга, любопытства и ликования.

N-грамы очаровывали, манили и моментально вызывали привыкание. Казалось, будто мы открыли новую разновидность героина для «ботаников».

Боремся с зависимостью: новая стратегия

Сидевший в первом ряду Дэн Клэнси понимал, что наше странное изобретение будет интересным не только для нас самих и кучки библиотекарей, но и для множества пользователей Google. Он пообещал, что Google займется адаптацией нашего прототипа и выпустит его в свет в рамках проекта Google Books. Мы были в восторге.

Внезапно наш проект превратился из черепахи научного метода в стремительного кролика, работающего на энергии Google. Ровно через две недели потрясающие программисты из Google Йон Орвант, Мэттью Грей и Уильям Брокман создали прекрасную веб-версию Bookworm. Чтобы избежать длительного процесса согласования новых торговых марок внутри компании, мы были вынуждены сменить прежнее название на более простое и технологичное – Ngram Viewer. В 14:00 16 декабря 2010 г. журнал Science опубликовал нашу статью с описанием исследования, и одновременно с этим Google выпустила Ngram Viewer в свет.

За первые же 24 часа на сайт зашло три миллиона посетителей. Тут же стали появляться сообщения в Twitter. Обзоры Ngram Viewer варьировались от «вызывает привыкание» (@gbilder) до «вызывает тотальное привыкание» (@paulfroberts) и «божежтымой google ngram viewer вызывает привыкание, с каким я никогда прежде в жизни не сталкивался» (@rachsyme). Журнал Mother Jones окрестила его «возможно, величайшим расточителем времени в истории Интернета» [185]. Прочитав на следующее утро газету New York Times, мы с удивлением увидели рассказ о нашей работе на первой полосе.

Проблема была решена: раз уж мы не могли избавиться от парализующей волю тяги к n-грамам, то мы решили подсадить на них весь мир.

Мамочка, откуда берутся марсиане?

В сентябре 1610 года Галилей начал серию наблюдений планеты Марс. К декабрю того же года он заметил нечто примечательное – казалось, что Марс становится все меньше и меньше, и теперь его размер составлял всего треть от сентябрьского[186]. Галилей пришел к выводу, что за несколько месяцев планета удалилась от Земли на огромное расстояние, – и это стало одним из важнейших доказательств того, что Земля не находится в центре Вселенной. Однако, помимо этого, Галилей не мог увидеть практически ничего другого. Его телескоп был слишком примитивен, чтобы что-то рассказать о поверхности планеты.

Перейти на страницу:

Все книги серии Наука XXI век

Неизведанная территория
Неизведанная территория

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Жан-Батист Мишель , Эрец Эйден

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература

Похожие книги

Искусство статистики. Как находить ответы в данных
Искусство статистики. Как находить ответы в данных

Статистика играла ключевую роль в научном познании мира на протяжении веков, а в эпоху больших данных базовое понимание этой дисциплины и статистическая грамотность становятся критически важными. Дэвид Шпигельхалтер приглашает вас в не обремененное техническими деталями увлекательное знакомство с теорией и практикой статистики.Эта книга предназначена как для студентов, которые хотят ознакомиться со статистикой, не углубляясь в технические детали, так и для широкого круга читателей, интересующихся статистикой, с которой они сталкиваются на работе и в повседневной жизни. Но даже опытные аналитики найдут в книге интересные примеры и новые знания для своей практики.На русском языке публикуется впервые.

Дэвид Шпигельхалтер

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
От болезни тела – к исцелению души. Почему мы болеем?
От болезни тела – к исцелению души. Почему мы болеем?

Все болезни имеют глубокий смысл. Они передают ценнейшие послания психики. Психолог Торвальд Детлефсен и врач Рудигер Дальке помогают нам понять, о чем свидетельствуют инфекционные заболевания, головные боли, несчастные случаи, сердечные приступы и желудочные колики, а также рак и СПИД. Если вы осознаете картину собственной болезни, то сможете найти новый прямой путь к самому себе. Болезнь не является неприятной помехой на этом пути, ибо она сама – путь. Чем сознательнее мы к ней относимся, тем лучше она выполняет свои задачи. Наша цель – не борьба с болезнью, а ее использование для исцеления души.

Рудигер Дальке , Торвальд Детлефсен

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Эзотерика / Здоровье и красота / Дом и досуг