Что же касается третьего правила (формирование выборки индивидов), то здесь мы ограничены подходом авторов, публикации которых использованы при создании Банка данных о русском генофонде. В отечественных генетических исследованиях выборка из популяции обычно составляется из неродственных лиц, которые рождены на данной территории и родители которых относятся к данному этносу. Некоторые авторы, к сожалению, определяли принадлежность к популяции и этносу лишь по происхождению самого индивида, а не его предков. Однако многие другие авторы собирали данные много тщательнее — учитывались места рождения и этническая принадлежность всех четырех бабушек и дедушек пробанда. Это позволяло избежать случайных колебаний миграционного потока и учесть в выборке только наиболее устойчивые миграции, генетический след которых сохранился в популяции и по прошествии двух поколений. Именно такие выборки дают наиболее полное представление об исторически сложившейся структуре генофонда.
§ 4. Как устроены карты?
Главным «прибором», показывающим структуру русского генофонда, служат геногеографические карты. Технология создания карт достаточно подробно описана в
СТРОИМ КАРТУ
Для построения карты используется информация об изученных русских популяциях. Каждая из этих популяций служит «опорной точкой». По совокупности опорных точек рассчитываются значения частоты аллеля в каждой точке карты. Для карт классических маркёров число изученных популяций (опорных точек — К) варьирует от 8 (локус HLA*B) до 182 (группы крови АВ0). Число же точек карты (узлов сетки) очень велико — 9064, и значение в каждой точке карты рассчитывается по данным обо всей совокупности опорных точек (К) — исходных популяций, изученных по данному маркёру.
Географическое положение опорных точек указано (тёмными кружками с белым обрамлением) на самой карте. Понятно, что в тех областях карты, где опорных точек много, можно получить надёжно прогнозируемые значения во всех узлах сетки, во всех точках этой области. А там, где опорных точек мало (например, в периферийных областях карты), рассчитанные значения в узлах сетки карты будут ненадёжны. Такие «ненадёжные» точки карты мы не анализируем. Поэтому, хотя общее число узлов сетки одинаково для всех карт русского генофонда (9064 точек), число надёжных точек намного меньше — от 895 (локус KEL) до 4355 (локус АВ0). Именно это число — число надёжных точек карты — указано в легенде карты (N). Только эти точки отображаются на карте и включаются в любые виды статистического анализа. Число опорных точек (К) также приведено в легенде карты.
Чтобы карта была информативна, важно легко на ней ориентироваться, соотносить выявляемые зоны генетического рельефа с другими географическими объектами — странами, областями, городами, реками, природными зонами, этническими ареалами и так далее. Для этого на всех картах приведены береговые линии морей и гидрографическая сеть (озера, реки), горные хребты, государственные границы, несколько крупных городов (значимых, согласно замыслу книги, скорее для средневековой, чем современной, России), а самой надёжной привязкой карты к реальному географическому пространству служит, разумеется, градусная сетка.