Чтобы протестировать свою гипотезу, Эрик поинтересовался у Google
, может ли он получить данные по статистике поиска. Ему ответили, что никакого специального разрешения здесь не требуется и что эти данные бесплатно доступны онлайн. Эрик и его аспирант Линн Ву (оба – совсем не специалисты в области экономики недвижимости) построили простую статистическую модель, чтобы изучить данные, использующие контент, создаваемый пользователями в ходе их поисковых запросов через Google. Их модель связывала изменения в количестве поисковых запросов определенного рода с последующими изменениями цен на недвижимость и предсказывала, что если количество запросов, подобных описанным выше, сегодня выросло, то цены на дома и объем предложения в Финиксе будут расти в ближайшие три месяца. Оказалось, что эта простая модель вполне работает: фактически она предсказывала уровень продаж на 23,6 % точнее, чем прогнозы, публикуемые экспертами Национальной ассоциации риэлторов.Подобных же успехов при использовании доступных цифровых данных добиваются и исследователи в других областях. Команда под руководством Руми Чунара из Гарвардской медицинской школы исследовала пути распространения холеры после землетрясения 2010 года на Гаити и выяснила, что информация об эпидемии в «Твиттере» была не менее точной, чем данные официальных отчетов; кроме того, эта информация появлялась как минимум на две недели раньше.[105]
Ситарам Асур и Бернардо Губерман из Лаборатории социальной инженерии компании Hewlett Packard обнаружили, что твиты могут также использоваться для прогнозирования дохода от проданных билетов в кинотеатры. По словам ученых, их исследование «наглядно продемонстрировало, как социальные сети отражают коллективную мудрость, которая, если ее направить в нужное русло, может чрезвычайно мощно и точно предсказывать, что произойдет в будущем».[106]Дигитализация может также помочь нам лучше понимать прошлое. Так, по состоянию на март 2012 года компания Google
отсканировала свыше 20 миллионов книг, опубликованных за несколько столетий.[107] Этот огромный массив цифровых слов и фраз формирует основу для так называемой культуромики, или «применения техники сбора данных с высокой пропускной способностью и их анализа для изучения человеческой культуры».[108] Команда профессионалов из нескольких отраслей под руководством Жана-Батиста Мишеля и Эреца Либермана Эйдена проанализировала свыше 5 миллионов книг, опубликованных на английском языке начиная с 1800 года. Помимо прочего, они обнаружили, что количество слов в английском языке за период между 1950 и 2000 годами выросло более чем на 70 %, что прославиться в наши дни можно быстрее и легче, чем в прошлом (но и проходит эта слава быстрее), и что в XX веке интерес к вопросам эволюции стабильно снижался до тех пор, пока Уотсон и Крик не открыли структуру ДНК.[109]Все это – примеры более ясного понимания и точного предсказания (или более качественной науки), возникшие благодаря дигитализации. Хэл Вариан, главный экономист Google
, многие годы изучал это явление. Он также умеет отлично описывать то, что видит. Одно из наших любимых высказываний Вариана звучит так: «Я утверждаю и буду утверждать, что самой модной и привлекательной профессией в следующие 10 лет будет статистика. И я не шучу».[110] Когда мы видим объемы постоянно создающихся цифровых данных и думаем о том, сколько еще открытий при их исследовании нас ожидает, то не можем не согласиться с ним.Новые уровни приносят новые рецепты
Информация в цифровой форме – это не только питательная среда для новых видов науки; это вторая фундаментальная сила (после экспоненциального прогресса), которая стимулирует инновации и этим формирует вторую эру машин. Отличным примером может служить Waze
. Этот сервис выстроен на множестве цифровых технологий разных уровней и разных поколений, и ни одна из этих технологий не стала дефицитной и не истощилась, поскольку все цифровые продукты неконкурентны.Первый и самый старый уровень – это цифровые карты, появившиеся как минимум одновременно с персональными компьютерами.[111]
Второй – это GPS-информация о местоположении, ставшая намного более полезной для водителей после того, как правительство США повысило точность GPS-позиционирования в 2000 году.[112] Третий – это пользовательские данные; пользователи Waze помогают друг другу, предоставляя информацию обо всем, начиная с аварий и полицейских радаров, замеряющих скорость, и заканчивая более дешевыми заправками; они даже могут использовать приложение для общения между собой. И, наконец, Waze активно использует сенсорные данные; по сути, программа превращает каждый автомобиль в сенсор, оценивающий скорость дорожного потока, и использует эти данные для расчета оптимальных маршрутов.