Читаем Логика случая. О природе и происхождении биологической эволюции полностью

Таблица 2-1

Краткое описание филогенетических методов

Методы, основанные на секвенировании

Требуют многократного сравнения гомологичных нуклеотидов или белковых последовательностей.

Дистанционно-матричные методы

Все эти методы используют матрицы межвидовых расстояний <dij> (i, j соответствуют видам), рассчитанные на основе сравнений последовательностей с корректировкой на множественные замещения. Ультраметрические методы (простая иерархическая кластеризация). Достоверны только для стабильных молекулярных часов. В принципе не считаются приемлемыми филогенетическими методами, но могут быть использованы для целей классификации или генерации предварительных филогенетических деревьев.

Метод объединения ближайших соседей (neighbor-joining). Более сложный метод восходящей кластеризации, основанный на минимальном эволюционном критерии (кратчайшая суммарная длина ветвей дерева). Чувствителен к ПДВ и гораздо менее точен, чем метод наибольшего правдоподобия, однако высокоэффективен для вычислений и быстр. Не используется для исчерпывающего филогенетического анализа, но для анализа большого количества последовательностей может быть единственным практически применимым методом.

Метод наименьших квадратов, метод Фитча. Метод измерения расстояний, основанный на минимизации разностей между расстояниями на филогенетическом дереве и в соответствующей матрице расстояний. По точности и эффективности примерно равен методу объединения ближайших соседей. Считается неподходящим для исчерпывающего филогенетического анализа, но используется для построения предварительных филогенетических деревьев для метода наибольшего правдоподобия.

Принцип наибольшей экономии (maximum parsimony)

Не использует матрицы расстояний, вместо этого работает с наборами состояний признаков. Состояниями признаков, в частности, могут быть нуклеотиды или аминокислоты в определенных позициях множественных выравниваний. Принцип наибольшей экономии (НЭ), основанный на принципе наименьшего действия в физике, определяет как наиболее вероятный тот эволюционный сценарий (филогенетическое дерево), который включает в себя наименьшее количество событий (переходов состояний в наборе признаков).

Существует множество алгоритмов, вычисляющих деревья, наиболее соответствующие принципу НЭ и использующие значимые и незначимые признаки. Принцип НЭ часто ставится под сомнение, поскольку существуют деревья, лишь слегка отличающиеся от наиболее экономичного варианта, но имеющие совершенно иную топологию. Метод высоко чувствителен к ПДВ.

Метод наибольшего правдоподобия (maximum likelihood)

Аналогично методу НЭ, в методе наибольшего правдоподобия (НП) оцениваются переходы между состояниями признаков и выбираются деревья, набравшие наибольший вес. В отличие от метода НЭ, метод НП является параметрическим статистическим подходом, который использует детальную модель эволюции признака для оценки вероятности данных на основе имеющегося эволюционного дерева. Дерево, которое имеет наибольшую вероятность возникновения наблюдаемых данных, признается наиболее вероятным. Метод НП зачастую производит деревья, аналогичные тем, которые получаются методом НЭ, но теоретически он предпочтительнее, будучи (в отличие от НЭ) статистически более достоверным (то есть при наличии достаточного количества данных гарантирует получение наиболее правдоподобного дерева). На практике метод НП часто превосходит метод НЭ. Методы НП чрезвычайно затратны с вычислительной точки зрения и непрактичны при работе с большими наборами данных. Таким образом, методы НП зачастую используются для оптимизации предварительных деревьев, полученных методом объединения ближайших соседей и методом Фитча. Для тех же филогенетических исследований, где точность построения дерева важнее скорости, следует выбирать методы НП. Более того, недавние алгоритмические достижения более чем на порядок ускорили построение филогенетических деревьев методами НП без серьезных потерь точности (Price et al., 2010).

Байесовский подход

Подобно методу НП, этот подход использует функцию правдоподобия, но прибегает к теореме Байеса с целью связать апостериорную вероятность дерева с правдоподобием данных и априорную вероятность дерева с эволюционной моделью. В отличие от методов НЭ и НП, которые выводят наилучшее дерево или набор деревьев, методы байесовского вывода выбирают деревья пропорционально их правдоподобию и определяют представительный набор деревьев. Метод хорошо работает для относительно небольших объемов данных, но непрактичен для больших.

Проверка точности филогенетических методов и достоверности деревьев

Модельные деревья

Филогенетические методы постоянно проверяются на искусственно смоделированных данных, для которых известна точная история эволюции. Методы сравниваются по критерию точности реконструкции топологии для искусственно построенных деревьев. Как правило, различные методы НП и байесовские методы превосходят все остальные для небольших наборов данных. Наилучшие результаты показывают итерационные методы, которые используют исходное дерево, построенное по методу НП, чтобы выравнивать данные, перестраивать дерево и повторять так до сходимости.

Бутстреппинг

Наиболее часто используемый тест на надежность топологии филогенетического дерева, при котором рассматриваются выборки данных (колонки выравнивания) и дерево оценивается по большому числу выборок. Процент выборок (то есть репликаций), в которых реконструируется данный узел дерева, называют уровнем поддержки. Статистика бутстреппинга еще не полностью разработана, поэтому пороговые значения для «достаточно высокого» уровня поддержки определяются путем моделирования или эмпирического анализа и могут варьировать в зависимости от целей конкретного исследования (например, значения более 90 процентов, или более 70 процентов; поддержка ниже 50 процентов обычно не считается надежной).

Статистические критерии проверки филогенетических гипотез (топологий деревьев)

Для сравнения правдоподобия различных топологий деревьев, выводимых из одного и того же набора данных, разработаны статистические критерии, основанные на различных моделях правдоподобия (самые известные — критерий Кишино—Хасегавы и приблизительно несмещенный критерий).

Когда исследователь интересуется филогенетическим сродством конкретного таксона, соответствующая ветвь переносится в различные положения в дереве, при сохранении топологии остальных ветвей, и правдоподобие каждого из полученных деревьев сравнивается при помощи статистических критериев с правдоподобием исходного дерева, полученного методом НП. Разновидность этого критерия применяется к деревьям с ограничениями, используемым для проверки филогенетических гипотез, таких как монофилия определенной группы (например, архей) в определенном наборе данных. В этом случае сравнивается правдоподобие дерева с ограничениями (монофилия в данном примере) с правдоподобием исходного НП-дерева.

Часто встречающиеся аномалии филогенетического анализа

Ни один филогенетический метод не застрахован от аномалий, которые часто оказывают заметное влияние на топологию дерева. Двумя основными классами филогенетических аномалий являются гомоплазия и притяжение длинных ветвей (ПДВ). Гомоплазия включает в себя параллельные, сходящиеся и обратные мутации, которые филогенетически не информативны и неверно истолковываются филогенетическими методами. ПДВ называется чрезвычайно распространенный случай, когда длинные ветви (быстро эволюционирующие линии) в дереве кластеризуются вместе только потому, что ни одна из них не проявляет сродства к другим группам, а не потому, что они на самом деле образуют монофилетическую группу. Филогенетики также иногда говорят о притяжении коротких ветвей, то есть ошибочной кластеризации коротких ветвей дерева. Разработка новых методов филогенетического анализа в большой степени побуждается необходимостью преодолеть эти аномалии, сохраняя притом вычислительный метод приемлемым с практической точки зрения.

Общие производные признаки

Важным подходом филогенетического анализа, дополняющим традиционные молекулярные филогенетические методы, является анализ общих производных признаков (так называемых синапоморфий), которые могут быть использованы для разграничения монофилетических групп (клад). Синапоморфии суть признаки, объединяющие всех членов монофилетической группы и исключающие все другие виды. В принципе одна достоверная синапоморфия может определять кладу. Однако это верно только в отсутствие гомоплазии, которую невозможно исключить для большинства признаков. Предполагаемые синапоморфии выбираются таким образом, чтобы свести вероятность гомоплазии к минимуму, например уникальные вставки в консервативных генах, в частности вставки мобильных элементов, мутации, которые требуют нескольких нуклеотидных замен, и слияния генов. В филогеномике идет активный поиск подобных редких геномных изменений. Одних синапоморфий часто недостаточно для несомненных филогенетических выводов, но они предоставляют дополнительные свидетельства для филогений, основанных на геномных последовательностях.

Деревья, не основанные на геномных последовательностях

Филогенетические методы пригодны не только для выравнивания гомологичных последовательностей, но и для анализа дистанционных матриц, полученных полногеномным сравнением любого числа других признаков (таких как содержание общих генов или оперонная организация). Например, в случае содержания общих генов расстояние между двумя геномами определяется как Dij = nij/ni, где nij — число генов, общих для двух геномов, а ni — полное число генов в меньшем геноме. Геномные деревья, полученные этим методом, обычно не являются надежными филогениями из-за обширной гомоплазии. Однако эти деревья могут быть информативными для сравнения образа жизни организмов.

Перейти на страницу:

Все книги серии Занимательная наука (Центрполиграф)

Откуда приходят герои любимых книг. Литературное зазеркалье. Живые судьбы в книжном отражении
Откуда приходят герои любимых книг. Литературное зазеркалье. Живые судьбы в книжном отражении

А вы когда-нибудь задумывались над тем, где родилась Золушка? Знаете ли вы, что Белоснежка пала жертвой придворных интриг? Что были времена, когда реальный Бэтмен патрулировал улицы Нью-Йорка, настоящий Робинзон Крузо дни напролет ждал корабля на необитаемом острове, который, кстати, впоследствии назвали его именем, а прототип Алеши из «Черной курицы» Погорельского вырос и послужил прототипом Алексея Вронского в «Анне Карениной»? Согласитесь, интересно изучать произведения известных авторов под столь непривычным углом. Из этой книги вы узнаете, что печальная история Муму писана с натуры, что Туве Янссон чуть было не вышла замуж за прототипа своего Снусмумрика, а Джоан Роулинг развелась с прототипом Златопуста Локонса. Многие литературные герои — отражение настоящих людей. Читайте, и вы узнаете, что жил некогда реальный злодей Синяя Борода, что Штирлиц не плод фантазии Юлиана Семенова, а маленькая Алиса родилась вовсе не в Стране чудес… Будем рады, если чтение этой книги принесет вам столько же открытий, сколько принесло нам во время работы над текстом.

Юлия Игоревна Андреева

Языкознание, иностранные языки
Знаем ли мы все о классиках мировой литературы?
Знаем ли мы все о классиках мировой литературы?

…«И гений, парадоксов друг» – гений и впрямь может быть другом парадоксов своей биографии… Как только писателя причисляют к сонму классиков – происходит небожественное чудо: живого человека заменяет икона в виде портрета в кабинете литературы, а всё, что не укладывается в канон, как будто стирается ластиком из его биографии. А не укладывается не так уж мало. Пушкин – «Солнце русской поэзии» – в жизни был сердцеедом, разрушившим множество женских судеб, а в личной переписке – иногда и пошляком. Можно умиляться светлым отрывкам из недавно введённого в школьную программу «Лета Господня» Ивана Шмелёва, но как забыть о том, что одновременно с этой книгой он писал пламенные оды в поддержку Гитлера? В школе обходят эти трудности, предлагая детям удобный миф, «хрестоматийный глянец» вместо живого человека. В этой книге есть и не слишком приглядные подробности из биографий русских классиков. Их вполне достаточно для того, чтобы стряхнуть с их тел гранитно-чугунную шинель официозной иконы. Когда писатели становятся гораздо более живыми, чем на страницах учебников, то и их позитивное воздействие на нас обретает большую ценность.

Мария Дмитриевна Аксенова

Литературоведение
Логика случая. О природе и происхождении биологической эволюции
Логика случая. О природе и происхождении биологической эволюции

В этой амбициозной книге Евгений Кунин освещает переплетение случайного и закономерного, лежащих в основе самой сути жизни. В попытке достичь более глубокого понимания взаимного влияния случайности и необходимости, двигающих вперед биологическую эволюцию, Кунин сводит воедино новые данные и концепции, намечая при этом дорогу, ведущую за пределы синтетической теории эволюции. Он интерпретирует эволюцию как стохастический процесс, основанный на заранее непредвиденных обстоятельствах, ограниченный необходимостью поддержки клеточной организации и направляемый процессом адаптации. Для поддержки своих выводов он объединяет между собой множество концептуальных идей: сравнительную геномику, проливающую свет на предковые формы; новое понимание шаблонов, способов и непредсказуемости процесса эволюции; достижения в изучении экспрессии генов, распространенности белков и других фенотипических молекулярных характеристик; применение методов статистической физики для изучения генов и геномов и новый взгляд на вероятность самопроизвольного появления жизни, порождаемый современной космологией.Логика случая демонстрирует, что то понимание эволюции, которое было выработано наукой XX века, является устаревшим и неполным, и обрисовывает фундаментально новый подход — вызывающий, иногда противоречивый, но всегда основанный на твердых научных знаниях.

Евгений Викторович Кунин

Биология, биофизика, биохимия / Биология / Образование и наука

Похожие книги

Психология стресса
Психология стресса

Одна из самых авторитетных и знаменитых во всем мире книг по психологии и физиологии стресса. Ее автор — специалист с мировым именем, выдающийся биолог и психолог Роберт Сапольски убежден, что человеческая способность готовиться к будущему и беспокоиться о нем — это и благословение, и проклятие. Благословение — в превентивном и подготовительном поведении, а проклятие — в том, что наша склонность беспокоиться о будущем вызывает постоянный стресс.Оказывается, эволюционно люди предрасположены реагировать и избегать угрозы, как это делают зебры. Мы должны расслабляться большую часть дня и бегать как сумасшедшие только при приближении опасности.У зебры время от времени возникает острая стрессовая реакция (физические угрозы). У нас, напротив, хроническая стрессовая реакция (психологические угрозы) редко доходит до таких величин, как у зебры, зато никуда не исчезает.Зебры погибают быстро, попадая в лапы хищников. Люди умирают медленнее: от ишемической болезни сердца, рака и других болезней, возникающих из-за хронических стрессовых реакций. Но когда стресс предсказуем, а вы можете контролировать свою реакцию на него, на развитие болезней он влияет уже не так сильно.Эти и многие другие вопросы, касающиеся стресса и управления им, затронуты в замечательной книге профессора Сапольски, которая адресована специалистам психологического, педагогического, биологического и медицинского профилей, а также преподавателям и студентам соответствующих вузовских факультетов.

Борис Рувимович Мандель , Роберт Сапольски

Биология, биофизика, биохимия / Психология и психотерапия / Учебники и пособия ВУЗов