БАНК ДАННЫХ
«Синонимы»: базы данных, БД, компьютерные сводки данных, массивы данных, накопленная информация, геоинфосистема.
Для надёжного анализа генофонда необходимо большое количество данных. Для этого надо собрать воедино материалы, добытые всеми специалистами, работавшими в изучаемом регионе — как генетиками, так и представителями смежных наук.
Во-первых, это требует
Например, данные по мтДНК в популяциях Евразии сегодня рассеяны более чем в 300 статьях в различных научных журналах.
Во-вторых, возникает проблема сопоставимости данных разных авторов, необходимость
Продолжим тот же пример с мтДНК. Гаплогруппы мтДНК в разных статьях определены разными способами (маркёры ПДРФ, ГВС1, ГВС2 в разных сочетаниях). Отсутствие однозначного соответствия между этими способами считается твёрдо установленным фактом, и корректно сравнивать можно лишь гаплогруппы, определённые одинаковым способом.
В-третьих,
Например, сводка данных по частотам русских фамилий представляла бы собой таблицу с 900 столбцами и 67000 строками (изучено 900 популяций, обнаружено 67000 разных фамилий). Без использования Банка данных такую таблицу было бы затруднительно даже хранить (она превышает ограничения Excel), и тем более обрабатывать данные.
Компьютерные банки данных создаются для того, чтобы решить все эти проблемы. Информацию из конкретной публикации нужно ввести в банк данных только один раз и впоследствии её легко преобразовать в любой нужный вид (однако структура базы данных требует унификации вводимой информации). Наконец, базы данных для того и придуманы, чтобы облегчить работу с большими массивами.
Первый банк данных о генофонде СССР (БД «GENEPOOL», классические маркёры и их карты) разрабатывался коллективом программистов под руководством одного из авторов этой книги[11]
. В 1992–1994 годах был создан археологический банк данных палеолита Северной Евразии [Балановская и др., 1997]. В 2001–2005 годах под руководством другого автора был создан банк данных о русском генофонде (классические и ДНК маркёры, антропологические признаки). Нашим коллективом разрабатываются и другие специализированные базы данных, в том числе программное обеспечение для анализа разнообразия русских фамилий и ДНК маркёров. Уже много лет наша работа просто немыслима без этих баз данных. Их разделы мы постепенно будем размещать на своем сайте www.genofond.ru. Сравнение с другими базами данных (ALFRED, YHRD, HVRBASE [Osier et al., 2002; Roewer et al., 2001; Handt et al., 1998]) показывает, что все они, включая и наши БД, построены по единому плану, задаваемому спецификой популяционно-генетических задач, и стремятся реализовать одни и те же функции (в чём отечественная продукция вполне преуспевает).СИСТЕМА ПОПУЛЯЦИЙ
«Синонимы»: популяционная система, иерархия популяций, уровни организации популяционной системы.
Популяции мира в совокупности образуют то, что мы называем человечеством, а в географическом плане — ойкуменой. Однако эта совокупность — не простая сумма популяций, а сложно организованная система.
От локальных популяций мы поднимаемся к народам, от народов — к населению крупных регионов (Западной Европы, Индии или же Африки), от регионов — к ойкумене. К примеру, русский генофонд входит в состав Восточной Европы, та в свою очередь — в состав Северной Евразии, которая «вложена» в Евразию, а самой большой матрёшкой оказывается мир в целом. Возможны и другие классификации популяций: не только географическая (по географическому положению популяций), но и лингвистическая, расовая, этнографическая и прочие.