В 1999 г. мы с бесчисленным числом соавторов опубликовали в
результаты наших исследований онкосупрессоров, которые организуют рецепторы мембраны. Один из них уехал из Цюриха домой в Австралию и добавил в список авторов еще несколько имен. Когда я выразила недовольство по этому поводу, руководитель института, в котором работал вышеупомянутый исследователь, заявил, что хотел бы пополнить этот список еще несколькими именами и счел бы это «честью» для своего университета. Мы включили в список всех этих людей, а потом еще пять человек. Я никого из них не знаю даже сейчас. До того, как этот вопрос разрешился, я получила письмо от одного адвоката, живущего на Гавайских островах. Его клиент – мой бывший студент, который в ожидании визы в США работал у меня в лаборатории, – тоже претендовал на соавторство. Он несколько лет не давал о себе знать. Как он мог узнать о том, что мы готовим статью? Это осталось для меня загадкой, и я предпочла не искать на нее ответ. Я просто включила его имя в список авторов.Онкосупрессор PDZ связывается с канцерогенным белком Src. Если на его конце отсутствует одна аминокислота, супрессорный эффект PDZ прекращается, теряются межклеточные контакты и у клетки образуются похожие на ножки псевдоподии, с помощью которых она перемещается, становясь метастазом. Совместно со специалистами группы по секвенированию Института молекулярной генетики Общества Макса Планка мы попытались найти различия между метастатическими и неметастатическими клетками путем анализа профиля экспрессии генов, то есть анализа целого набора транскриптов или «транскриптом». Мы выявили 600 генов, характеризующихся различной экспрессией. В эту цифру трудно даже поверить. Далее я расскажу о том, как мы это сделали.
«-ом» и «-омик»
Студент факультета биоинформатики в Обществе Макса Планка сидит перед компьютером, не замечая входящих и выходящих из помещения; стол усеян полупустыми упаковками из-под печенья, а под столом – куча пластиковых бутылок. Он сравнивает транскриптомы нормальных и метастатических клеток. Все, что заканчивается на «-ом», содержит все компоненты определенного образца, все мРНК (транскриптомы), все белки (протеомы), все метаболиты (метаболомы), все киназы (киномы) и т.д. В данном случае действует принцип «Исследуем всё сразу». Особенно это относится к компонентам, которые сами по себе совершенно неизвестны и их изучают не отдельно каждый, а все вместе. (
)Итак, продолжим. Во-первых, есть компьютер с прекрасным названием Illumina, на котором выполняются все эти операции, секвенирование всех РНК после транскрипции в ДНК. Это высокоскоростной компьютер, с помощью которого осуществляется секвенирование и хранение последовательностей. Сегодня такие компьютеры есть в любом институте при каждом университете. Известные гены идентифицировать легко, а секвенирование неизвестных генов нужно проводить в полном объеме, что приводит к образованию миллиардов последовательностей, называемых «секвенирование нового поколения» (СНП), означающему новую версию предыдущих последовательностей. Повторные последовательности получают, чтобы снизить вероятность статистических ошибок; это называется «покрытие» (или охват), поэтому 10 повторений соответствуют 10-кратному покрытию. Для анализа всех генов образца применяется «геномика». Для фрагментации ДНК используется «метод дробовика», а отдельные части сшиваются обратно для последовательного удлинения. В данном случае нужно выучить новые понятия. Затем новые последовательности выстраивают в один ряд, и их сопоставляют с «референсными геномами» для идентификации. Это образец или модель генома, на которой сходятся ученые. Официальный референсный геном человека получают не от какого-то одного человека, это виртуальный геном. Его собрали из ДНК последовательностей более чем 20 доноров, и его состав постоянно обновляется.