В моем случае это произошло с геном ARID1A. И хотя анализ покрывал весь геном, глубина покрытия составляла около 30. Это значит, что каждая позиция в геноме была прочитана в среднем 30 раз. Однако разброс глубины покрытия секвенирования составлял от 0 в некоторых областях (большинство из них неинтересны и поэтому их игнорируют) до 100 и более, из-за технических аспектов подготовки «библиотек» ДНК для секвенирования. Так случилось, что в конкретной позиции в гене ARID1A глубина покрытия составила всего 8. В каждом прочтении последовательности встречаются ошибки, связанные с встраиванием неправильного нуклеотида. Анализирующая программа усредняет множество прочтений, чтобы выдать конечный результат по конкретной позиции. К сожалению, алгоритм плохо справился с этой задачей, и я получил ложноположительный результат – мутацию, которой на самом деле нет, призрак, порожденный вычислениями.
На самом деле я нашел по меньшей мере дюжину своих генов, в некоторых экзонах которых была такая же плохая глубина покрытия и в которых присутствовали аналогичные ошибки, хотя эти конкретные места в геноме и соответствующие аминокислоты не влияют на заболевания. Например, мне определили мутацию в гене ActinB, который никогда не был связан с каким-либо человеческим заболеванием, и это был ложноположительный результат из-за плохой глубины покрытия. Однако же, если эти плохо прочитанные области содержали клинически важные гены, при секвенировании моего генома можно было легко пропустить важные результаты. Возможно, отеческая забота штата Нью-Йорк была не такой бессмысленной, как я изначально предполагал. Что ввел, то и получил, как говорят компьютерщики.
Первое секвенирование моего генома обошлось мне примерно в $2750. Позже мой геном секвенировали в другой лаборатории с более высоким уровнем контроля качества, и это стоило около $5000. Эта версия пришла на iPad со специальным геномным приложением. Я вручную проверил первичные данные, прежде чем смотреть, что там нашлось. Общая глубина покрытия была намного лучше (более чем в 40 раз), и по ряду дополнительных признаков я смог убедиться, что эта последовательность действительно моя. Это был геном мужчины (верно!). В нем были десятки аллелей, частота которых выше у евреев-ашкенази, что соответствует моему этническому происхождению.
В общей сложности у меня было идентифицировано около 4 млн нуклеотидных замен. Среди этого множества лишь немногие предположительно имели хоть какое-то отношение к здоровью. Большинство просто составляли длинный список генетических изменений, значение которых не ясно, по крайней мере в настоящее время. Просматривая этот список, я мог лишь пожать плечами и понадеяться, что медицинская генетика еще при моей жизни сумеет понять, какое значение имеют эти варианты, если это не бессмыслица и они вообще имеют какое-то значение.
Около 25 000 таких вариаций найдено в моем экзоме. В отличие от стандартного генетического набора
Неандертальцы – вымерший вид человека, у них примерно один из 300 нуклеотидов отличается от тех, что имеются у современного вида