Читаем Русский генофонд на Русской равнине полностью

Атлас основан на информации базы данных «Гаплогруппы Y хромосомы» (содержит 112 записей) банка данных «Русский генофонд». Информация представляет собственные данные авторов [Balanovsky et al., in print].

Атлас основан на данных о 14 русских популяциях, обследованных в ходе экспедиционной работы по изучению русского генофонда. Картографируются 8 гаплогрупп Y хромосомы, удовлетворяющих однопроцентному критерию полиморфизма: средняя частота в 14 популяциях выше 0.01.

Перечень признаков:гаплогруппы E3b, I1а, I1b, J2, N2, N3, R1a, R1b.

«ПРОСТЫЕ» КАРТЫ. Карты восьми гаплогрупп построены в пределах «надёжного» пространства русского ареала и использованы для создания карт главных компонент. В книге вместо этих «русских» карт приводятся карты распространения гаплогрупп на всей территории Европы (включая и надёжный русский ареал, очерченный серой линией). Создание «европейских карт» описано ниже.

ОБОБЩЁННЫЕ КАРТЫ. Синтетические карты главных компонент построены по восьми картам гаплогрупп в пределах надёжно изученного русского ареала. Приводится трендовая карта (окно 7x7).

Карта надёжности едина для всех простых и обобщённых карт (уровень строгости 0.3).

АТЛАС ФАМИЛИЙ РУССКОГО НАРОДА (рассмотрен в главе 7)

Атлас основан на информации базы данных «ONOMA». Содержится информация о фамилиях 1 201 000 человек.

Представлены 1166 популяций, относящихся к 107 районам одиннадцати административных областей. Общее число фамилий в базе данных превышает 67 тысяч. В алфавитном порядке первой стоит фамилия «Аабд», последней — «Ящуков». Исходно фамилии сгруппированы по населённым пунктам (или сельским объединениям), для которых указана их административная принадлежность. Это позволило рассчитывать частоту фамилии для любых заданных групп популяций.

ИСХОДНЫЕ ДАННЫЕ. Фамилии коренного сельского населения изучены главным образом в пределах «исконного» русского ареала. Для этого собирались данные по сельским поселениям, а также по тем небольшим городам, население которых сформировалось главным образом за счет жителей ближайших деревень. Население крупных городов игнорируется по той же причине, почему оно не изучается нами и по остальным маркёрам — чтобы минимизировать влияние недавних миграций. Единственное исключение сделано для фамилий Кемеровской области. Этот регион представляет «периферийное» русское население, далеко за пределами «исконного» ареала. И поскольку всё население — и сельское, и городское — сформировано мигрантами (из «исконного» ареала), то не было и смысла отсеивать «мигрантное» население городов.

Исходные данные представляют собой списочный состав населения изученного региона: перечень фамилий в каждом населённом пункте, где каждая фамилия соответствует одному человеку — её носителю. Очевидно, что одни и те же фамилии в этом списке могут повторяться многократно (родственники, однофамильцы). Программа «ONOMA» и создана для того, чтобы перейти от списка членов популяции к частотам фамилий в популяции, а затем провести необходимые расчёты.

Исходные данные могут дать информацию только о том, сколько раз та или иная фамилия встречена в данном населённом пункте. Этого достаточно для изучения структуры генофонда, а сама информация остаётся при этом анонимной — имеются данные не о людях, а лишь о частотах их фамилий.

Для статистического анализа использовалась вся база данных целиком, а для картографического — только данные о 75 фамилиях. Эта информация получена из двух источников.

1) Данные А. П. Бужиловой по частотам 75 русских фамилий в 55 популяциях уровня сельсоветов, представляющих 23 области Европейской части России. Средний объем выборки по масштабам, принятым в анализе фамилий, невелик — немногим более 300 человек.

2) Информация нашей базы данных «ONOMA» по тем же 75 фамилиям в 51 популяции уровня районов, представляющих 7 областей. Из 50 районов, используемых в статистическом анализе (см. табл. 7.2.1.) Репьёвский район Воронежской области не успел пока войти в картографический анализ, зато обширный Каргопольский район Архангельской области представлен как три популяции, что и дает в сумме 51 картографированную популяцию. Средняя выборка на район значительна — около 20 000 человек.

Перейти на страницу:

Похожие книги