Ставшие сейчас доступными огромные объемы данных в сочетании со статистическими методами, позволяющими обрабатывать эти цифры, открывают совершенно новые пути понимания мира. Корреляция важнее, чем причинность, и наука может двигаться вперед даже и без непротиворечивых моделей, объединенных теорий или, собственно говоря, вообще каких-либо механистических объяснений… при наличии массы данных такой подход к научным исследованиям – гипотеза, модель, проверка – оказывается устаревшим. ‹…› Отбросим все теории человеческого поведения, от лингвистических до социологических. Забудем таксономию, онтологию и психологию. Как знать, почему люди ведут себя именно так, а не иначе? Важно то, что они ведут себя именно так, и мы можем отслеживать и измерять их поведение с беспрецедентной точностью. При наличии достаточного количества данных цифры говорят сами за себя. ‹…› Сегодня компании вроде Google, выросшие в эпоху доступности огромного количества данных, могут не довольствоваться ошибочными моделями. Собственно говоря, модели им вообще не нужны. ‹…› Нет никаких причин цепляться за старые методы. Пора спросить: чему Google может научить науку?
Я не собираюсь отвечать на этот вопрос; замечу только, что такая радикальная точка зрения становится более или менее господствующей повсюду в Кремниевой долине, в сфере информационных технологий и, все в большей степени, в деловом сообществе. В несколько менее бескомпромиссном варианте она также быстро приобретает популярность и в научных кругах. За последние несколько лет почти во всех университетах окрылись хорошо финансируемые центры или институты, посвященные работе с большими данными и в то же время уделяющие должное внимание другому модному слову – междисциплинарности. Например, Оксфордский университет только что создал в новом, привлекательном, «соответствующем последнему слову техники» здании собственный Институт больших данных (Big Data Institute, BDI). Вот что было сказано по этому поводу: «Работа этого междисциплинарного исследовательского центра будет сосредоточена на анализе больших, сложных, разнородных массивов данных для исследования причин и следствий, профилактики и лечения болезней». Это, несомненно, чрезвычайно достойная задача, несмотря на отсутствие упоминаний о развитии теорий или концепций.
Противоположную точку зрения ярко выразил нобелевский лауреат, генетик Сидней Бреннер, которого я уже цитировал в главе 3 (кстати говоря, он был директором того самого знаменитого кембриджского института, основанного Максом Перуцем, о котором я говорил выше): «Биологические исследования переживают кризис… Технологии дают нам инструменты для анализа организмов на всех масштабных уровнях, но мы тонем в море данных и задыхаемся без теоретической основы, которая позволила бы осознать их. Хотя многие считают, что “чем больше, тем лучше”, история учит нас, что на самом деле “лучше меньше, да лучше”. Нам нужна теория и уверенное понимание природы изучаемых объектов, чтобы предсказывать все остальное».