Это более многочисленное и плотное научное сообщество снова изменилось после возникновения новых, более эффективных инструментов и методов работы. Одним из самых больших затруднений сравнительного метода было секвенирование ДНК. После того как была проделана трудная работа по обнаружению гена, отвечающего за муковисцидоз (в нашей седьмой хромосоме), началось настоящее испытание: нужно было выписать фактическую последовательность A, C, G и T в этом фрагменте. Это была трудоемкая и технически непростая лабораторная работа, в процессе которой ученые проводили долгие часы над пробирками, центрифугами и электронными микроскопами. Исследователь, не имеющий больше никаких заданий, мог бы секвенировать 100 тысяч символов в год. В таком случае, для того чтобы секвенировать геном человека целиком, потребовалось бы 30–50 тысяч человеко-лет. Поэтому никто и не пытался это сделать. Понимая, что у них никогда не будет достаточно времени или денег, чтобы выполнить эту работу, ученые ничего не предпринимали, пока у них не появлялось по-настоящему существенное предположение, почему именно этот фрагмент может быть важен. Секвенирование должно было неукоснительно следовать за конкретной гипотезой. В противном случае оно превращалось в черную дыру, которая поглощала карьеру исследователя, не давая ничего взамен.
Но начиная с 1980-х гг. ученые, решившие преодолеть это затруднение, ввели ряд технических новшеств. Машины для секвенирования помогли автоматизировать многие задачи процесса декодирования, которыми ранее занимались лаборанты. Были изобретены машины для копирования ДНК, которые могли взять один интересующий ученых фрагмент ДНК и за одну ночь сделать миллионы копий, что, в свою очередь, ознаменовало появление более быстрых секвенсоров, предназначенных для применения грубой силы к неисчерпаемому источнику материала. Математики разработали новые статистические модели, чтобы разобраться, как соединить любое количество фрагментов в правильном порядке, возник «метод дробовика» (суть этой техники в делении всего генома на десятки тысяч очень коротких фрагментов), позволяющий воспользоваться новой возможностью – «сначала секвенирование, потом упорядочивание». И наконец, программисты разработали более совершенное аппаратное и программное обеспечение, позволяющее отделять, сравнивать и сохранять стремительно возрастающие объемы данных, полученных с помощью этих новых методов.
Резкое возрастание умственных и вычислительных мощностей перевернуло модель исследования в генетике с ног на голову. Старая модель говорила: мы не можем вскипятить океан, поэтому давайте предположим, какая чашка в нем важнее, и вскипятим ее. Новая модель говорит: мы
Стоимость секвенирования 1 генома, 2001–2005
Стоимость секвенирования генома снижается быстрее, чем предсказывает закон Мура.
К 2003 г. генетики покрыли все 10 футбольных полей чертежами человеческого устройства. Хотя это важное событие приобрело огромную известность, его научное значение было ограничено, так как в распоряжении ученых на тот момент не было других образцов генома человека, с которыми можно было бы сравнить полученный результат. Сегодня они появились. К 2015 г. удалось секвенировать более 250 тысяч полных геномов и миллионы частичных [11]. С помощью этих данных, а также вычислительной мощности компьютеров, позволяющих их анализировать, исследователи выявили в общей сложности примерно 20 тысяч генов, отвечающих за кодирование белков, и в большинстве случаев уже установили, какие белки они печатают [12].