Читаем Расшифрованная жизнь полностью

Алгоритмы, закодированные в полумиллионе строк компьютерного кода команды Джина, предполагали поэтапный сценарий – от самых «безвредных» действий, например простого перекрывания двух последовательностей, до более сложных, например использования обнаруженных пар для слияния островков перекрывшихся последовательностей. Это было похоже на сложение головоломки, когда небольшие островки собранных участков составляются вместе и образуют бо́льшие острова, а затем весь процесс повторяется снова. Только вот в нашей головоломке было 27 миллионов фрагментов. И было очень важно, чтобы участки брались из последовательности высокого качества сборки: представьте себе, что будет, если вы собираете пазл, а цвета или изображения его элементов нечеткие и размытые. Для дальнего порядка последовательности генома значительная доля прочтений должна быть в виде совпадающих пар. Учитывая, что результаты все еще отслеживались вручную, мы с облегчением обнаружили, что 70 % имевшихся у нас последовательностей именно такие. Специалисты по компьютерному моделированию объяснили, что при меньшем проценте собрать нашего «шалтая-болтая» было бы невозможно.

И теперь мы смогли использовать ассемблер Celera для секвенирования последовательности: на первом этапе результаты корректировались для достижения самой высокой точности; на втором этапе программа Screener удаляла загрязняющие последовательности из ДНК плазмиды или E. coli. Процесс сборки может быть нарушен всего-навсего какими-то 10 парами оснований «чужой» последовательности. На третьем этапе программа Screener проверяла каждый фрагмент на соответствие известным повторяющимся последовательностям в геноме плодовой мушки – данным Джерри Рубина, который их «любезно» нам предоставил. Местоположение повторов с частично перекрывающимися участками записывалось. На четвертом этапе другая программа (Overlapper) обнаруживала перекрывающиеся участки, сравнивая каждый фрагмент со всеми остальными, – колоссальный эксперимент по обработке огромного объема числовых данных. Ежесекундно мы сравнивали 32 миллиона фрагментов с целью обнаружить по крайней мере 40 перекрывающихся пар оснований с менее 6 % различий. При обнаружении двух перекрывающихся участков мы объединяли их в больший фрагмент, так называемый «контиг» – набор перекрывающихся фрагментов.

В идеальном случае этого бы вполне хватило для сборки генома. Но нам приходилось бороться со статтерами и повторами в коде ДНК, а это означало, что один фрагмент ДНК может перекрываться с несколькими различными участками, создавая ложные соединения. Чтобы упростить задачу, мы оставляли только однозначно соединенные фрагменты, так называемые «унитиги». Программа, с помощью которой мы выполняли эту операцию (Unitigger), по существу удаляла всю последовательность ДНК, которую мы не могли с уверенностью определить, оставляя лишь эти унитиги. Этот шаг не только дал нам возможность рассмотреть другие варианты сборки фрагментов, но и существенно упростил задачу. После редукции количество перекрывающихся фрагментов сократилось с 212 миллионов до 3,1 миллиона, и проблема упростилась в 68 раз. Детали головоломки постепенно, но неуклонно вставали на свои места.

А затем мы могли использовать информацию о способе спаривания последовательностей одного и того же клона, используя «каркасный» алгоритм. Все возможные унитиги со взаимно перекрывающимися парами оснований объединялись в специальные каркасы. Для описания этого этапа в своих лекциях я провожу аналогию с детским игрушечным конструктором Tinkertoys. Он состоит из палочек разной длины, которые можно вставлять в отверстия, расположенные на деревянных узловых деталях (шариках и дисках), и составить так объемную конструкцию. В нашем случае узловые детали – это унитиги. Зная, что парные последовательности располагаются на концах клонов длиной в 2 тысячи, 10 тысяч или 50 тысяч пар оснований – то есть как бы находятся на расстоянии определенного количества отверстий друг от друга, – их можно выстроить в одну линию.

В результате тестирования этой методики на последовательности Джерри Рубина, составлявшей примерно одну пятую генома плодовой мушки, мы получили всего лишь 500 пробелов. Проведя в августе испытания на наших собственных данных, мы получили в результате более 800 тысяч небольших фрагментов. Существенно большее количество данных для обработки показало, что методика работала плохо – результат оказался противоположным ожидаемому. В течение нескольких следующих дней паника нарастала, а список возможных ошибок удлинялся. С верхнего этажа корпуса № 2 адреналиновый раж просачивался в комнату, шутливо называемую «Безмятежными покоями». Однако никакого покоя и безмятежности там не ощущалось, особенно в течение по крайней мере пары недель, когда сотрудники буквально кругами слонялись в поисках выхода из создавшегося положения.

Перейти на страницу:

Все книги серии Universum

Растут ли волосы у покойника?
Растут ли волосы у покойника?

В науке часто возникают мифы, которые порой отличаются поразительной живучестью. Они передаются из поколения в поколение, появляясь на страницах книг, на интернетовских сайтах, звучат в научных докладах и в разговорах обычных людей.Именно таким мифам и посвятил свою книгу известный немецкий популяризатор науки Э. П. Фишер. Он рассказывает, почему весь мир полагает, что пенициллин открыл Александр Флеминг, а родители троечников утешают себя тем, что великий Эйнштейн в школе тоже не был отличником. Фишер говорит и о мифах, возникших в последние годы, например, о запрограммированности нашей жизни в генах или о том, что мы должны в день выпивать два литра воды. Вероятно, многие с Фишером где-то и не согласятся, но его книга наверняка заставит читателя улыбнуться, а потом задуматься о довольно серьезных вещах.2-е издание.

Эрнст Петер Фишер

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
Коннектом. Как мозг делает нас тем, что мы есть
Коннектом. Как мозг делает нас тем, что мы есть

Что такое человек? Какую роль в формировании личности играют гены, а какую – процессы, происходящие в нашем мозге? Сегодня ученые считают, что личность и интеллект определяются коннектомом, совокупностью связей между нейронами. Описание коннектома человека – невероятно сложная задача, ее решение станет не менее важным этапом в развитии науки, чем расшифровка генома, недаром в 2009 году Национальный институт здоровья США запустил специальный проект – «Коннектом человека», в котором сегодня участвуют уже ученые многих стран.В своей книге Себастьян Сеунг, известный американский ученый, профессор компьютерной нейробиологии Массачусетского технологического института, рассказывает о самых последних результатах, полученных на пути изучения коннектома человека, и о том, зачем нам это все нужно.

Себастьян Сеунг

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература

Похожие книги

Нейрогастрономия. Почему мозг создает вкус еды и как этим управлять
Нейрогастрономия. Почему мозг создает вкус еды и как этим управлять

Про еду нам важно знать все: какого она цвета, какова она на запах и вкус, приятны ли ее текстура и температура. Ведь на основе этих знаний мы принимаем решение о том, стоит или не стоит это есть, удовлетворит ли данное блюдо наши физиологические потребности. На восприятие вкуса влияют практически все ощущения, которые мы испытываем, прошлый опыт и с кем мы ели то или иное блюдо.Нейрогастрономия (наука о вкусовых ощущениях) не пытается «насильно» заменить еду на более полезную, она направлена на то, как человек воспринимает ее вкус. Профессор Гордон Шеперд считает, что мы можем не только привыкнуть к более здоровой пище, но и не ощущать себя при этом так, будто постоянно чем-то жертвуем. Чтобы этого добиться, придется ввести в заблуждение мозг и заставить его думать, например, что вареное вкуснее жареного. А как это сделать – расскажет автор книги.Внимание! Информация, содержащаяся в книге, не может служить заменой консультации врача. Перед совершением любых рекомендуемых действий необходимо проконсультироваться со специалистом.В формате PDF A4 сохранён издательский дизайн.

Гордон Шеперд

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Медицина и здоровье / Дом и досуг
Математика космоса. Как современная наука расшифровывает Вселенную
Математика космоса. Как современная наука расшифровывает Вселенную

Как математические модели объясняют космос? Иэн Стюарт, лауреат нескольких премий за популяризацию науки, представляет захватывающее руководство по механике космоса в пределах от нашей Солнечной системы и до всей Вселенной. Он описывает архитектуру пространства и времени, темную материю и темную энергию, рассказывает, как сформировались галактики и почему взрываются звезды, как все началось и чем все это может закончиться. Он обсуждает параллельные вселенные, проблему тонкой настройки космоса, которая позволяет жить в нем, какие формы может принимать внеземная жизнь и с какой вероятностью наша земная может быть сметена ударом астероида.«Математика космоса» — это волнующий и захватывающий математический квест на деталях внутреннего мира астрономии и космологии.Издание подготовлено в партнерстве с Фондом некоммерческих инициатив «Траектория».

Йэн Стюарт

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
Почему сердце находится слева, а стрелки часов движутся вправо. Тайны асимметричности мира
Почему сердце находится слева, а стрелки часов движутся вправо. Тайны асимметричности мира

До недавних пор даже объяснить разницу между «право» и «лево» условному инопланетянину было бы проблематично – настолько «земными» казались эти привычные понятия. Но и без таких абстрактных проблем вопросов хватает. Почему большинство людей являются правшами? Действительно ли левши ведут себя иначе, чем правши? Как связаны доминирующие руки с некоторыми нарушениями речи, такими как заикание? Почему сердце почти всегда находится с левой стороны тела, а человеческий организм состоит из аминокислот с левой хиральностью? Почему два полушария головного мозга настолько разные? Отчего торнадо вращаются против часовой стрелки в Северном полушарии и по часовой стрелке в Южном полушарии? Почему одна треть мира ездит на автомобиле слева, а две трети – справа? Из-за чего европейское письмо идет слева направо, а арабское и иврит – справа налево? На какие-то вопросы наука уже нашла ответы, но с некоторыми парадоксами асимметрии в природе, теле и культуре по-прежнему увлекательно борется. Рассматривая примеры от физики частиц до человеческого тела и от культуры и спорта до повседневной жизни, эта книга развеет ваши заблуждения о левом и правом и раскроет тайны асимметрии. Приз Лондонского королевского общества за научно-популярную книгу года. В формате PDF A4 сохранён издательский дизайн.

Крис Макманус

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Зарубежная образовательная литература / Образование и наука