Теперь, располагая полной последовательностью человеческого генома, мы понимаем, что плотность распределения генов в 22-й хромосоме нисколько не атипична. Если уж на то пошло, 22-я хромосома с ее 545 генами оказалась при своем маленьком размере, скорее, даже насыщена генами, а не бедна ими. В 21-й хромосоме – примерно такого же размера – удалось выделить всего 236 генов. В настоящее время всего известно около 21 тысячи генов в полном наборе человеческих хромосом (22 + X + Y). Пока остается смириться и признать, что мы по-прежнему не знаем, сколько именно генов в человеческом геноме, хотя проект «Геном человека» завершился уже более десяти лет назад. Несколько международных групп, в том числе Национальный центр биотехнологической информации при Национальных институтах здравоохранения, организация
Насколько не дотягивает – покажет время. Поиск генов – нетривиальная задача; области, кодирующие белки, – это просто последовательности А, Г, Т и Ц, «встроенные» в геном посреди других А, Г, Т и Ц; они ничем особо не выделяются. Как вы помните, всего около 2 % генов в геноме человека кодируют белки; все остальное, пренебрежительно именуемое в учебниках «мусорная ДНК», до недавнего времени казалось набором явно нефункциональных отрезков различной длины, многие из которых встречаются неоднократно. Мнение об этом принципиально изменилось в свете данных, полученных в проекте ENCODE (об этом было рассказано в главе 7). Такой «мусор» бывает рассеян даже в самих генах; гены, нашпигованные некодирующими сегментами (интронами), могут занимать обширные участки ДНК, и кодирующие элементы напоминают отдельные городки, расположенные вдоль пустынной молекулярной автомагистрали. Некоторое время самым длинным человеческим геном считался дистрофин (мутации в этом гене вызывают мышечную дистрофию), который простирается более чем на 2,4 миллиона пар оснований. Всего 11 055 из них (0,5 гена) кодируют сам белок; остальная часть гена приходится на 78 интронов (человеческий ген содержит в среднем восемь интронов). Именно из-за такого несуразного устройства генома идентифицировать гены настолько сложно. Но потрясающая воображение длина дистрофина меркнет по сравнению с длиной коннектина (титина), основного белка эластичной решетки цитоскелета и третьего по распространенности мышечного белка. Этот сократительный белок поперечно-полосатых мышц состоит примерно из 33 тысяч аминокислот, и длина его достигает 1 микрометра. Ген, кодирующий титин, расположен во 2-й хромосоме; он простирается почти на 300 тысяч оснований и содержит 363 экзона.
В последние годы поиск человеческих генов значительно упростился, поскольку значительно лучше, чем раньше, изучены геномы мыши, шимпанзе и многих других млекопитающих. Многое стало понятным благодаря знанию процессов эволюции: функциональные части человеческого и мышиного генома весьма схожи (как и геномы всех млекопитающих), за миллионы лет с тех пор, как жил последний общий предок всех видов, они недалеко отошли друг от друга. Напротив, некодирующие области ДНК были «диким полем» эволюции: поскольку они не подпадали под естественный отбор, накопление мутаций в них ничем не сдерживалось (в отличие от кодирующих сегментов). Поэтому мутации накопились там в изобилии, и именно в некодирующих регионах геномы человека и мыши существенно различаются. Поэтому, отыскивая схожие участки в генетических последовательностях у человека и у других млекопитающих, можно эффективно обнаруживать функциональные области, то есть гены.
Борис Александрович Тураев , Борис Георгиевич Деревенский , Елена Качур , Мария Павловна Згурская , Энтони Холмс
Культурология / Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / История / Детская познавательная и развивающая литература / Словари, справочники / Образование и наука / Словари и Энциклопедии