Этот методический вывод — о возможности адекватной характеристики генофонда только по самым частым фамилиям — оказался неожиданным, так он прост. Но он позволяет делать первые выразительные наброски «фамильных» портретов регионов, не дожидаясь завершения сложных видов анализа по полным фамильным спискам регионов.
§ 2. Редкие фамилии
К сожалению, геногеография — не кунсткамера. Мы не можем собирать редкости. Напротив, чтобы включить фамилии в изучение истории генофонда, нам необходимо избавиться от «информационных шумов» — то есть редких для данной популяции фамилий, которые в ней исторически случайны, эфемерны и потому мало информативны для изучения истории её генофонда. А для этого надо определить — что же такое «редкие» фамилии?
«ДЕМОГРАФИЧЕСКИЙ» КРИТЕРИЙ
Единственная информация, которой мы располагаем в нашей базе данных о каждом человеке, это его фамилия и его населенный пункт. Но мы также знаем, сколько его однофамильцев встречено во всех прочих изученных пунктах. Как же, пользуясь только этой информацией, отсеять «пришлое» население? Есть три способа, и все они основываются на том, что пришельцев не может быть слишком много — пришлые фамилии в среднем более редкие, чем коренные. Первый способ — исключить фамилии с частотой ниже заданной (частотный критерий). Второй способ — исключить фамилии, встречающиеся только в одном-двух пунктах (территориальный критерий). Третий способ — исключить фамилии, численность которых во всём районе меньше заданной (демографический критерий).
Мы предложили «демографический» критерий для исключения «залётных» фамилий: фамилия включается в анализ, если число носителей данной фамилии, достигших репродуктивного возраста, превышает четыре человека в районе.
Подчеркнём, что именно в районе, а не в локальной популяции (селе, сельсовете).
Это означает, что даже в том случае, если пять носителей фамилии разбросаны по разным весям одного района и в каждой из пяти отдалённых деревень есть лишь по одному носителю фамилии, то фамилия всё равно будет включена в анализ. Средняя численность сельских жителей, достигших репродуктивного возраста, в административных районах, изученных нами, составила около 25 000 человек (от 4000 до 60000). Достаточно пяти «однофамильцев» из многих тысяч сельских жителей района — и их фамилия уже включается в анализ. Таков «демографический» критерий.Мы назвали его «демографическим», так как он соответствует генетико-демографическим представлениям о расширенном воспроизводстве семьи:
двое родителей и более 2 детей, достигших репродуктивного возраста. Именно эти его свойства позволяют предположить, что этот критерий обеспечит отбор тех исторически «неслучайных» фамилий, у которых есть шанс закрепиться в данном генофонде.Подчеркнём, что предложенный «демографический» критерий не является чрезмерно строгим. Достаточно всего пяти человек с данной фамилией из десятков тысяч жителей района для того, чтобы фамилия была включена в разряд «распространённых», т. е. предположительно «коренных» фамилий. Но при этом «демографический» критерий всё же позволяет отсеять те редкие фамилии, которые занесены миграционными потоками, но ещё не успели укорениться в данной популяции. Конечно же, вместе с пришлыми, «залётными» фамилиями могут быть отсеяны и исчезающие коренные фамилии. Все мы знаем случаи, когда из-за стечения обстоятельств не осталось мужского потомства, и потому старые «родовитые» фамилии затухают и исчезают. Но обычно редкие коренные фамилии составляют едва приметную часть среди множества редких пришлых фамилий.
ИСКЛЮЧЕНИЕ «ПРИШЛЫХ» ФАМИЛИЙ
Но к нашему удивлению, несмотря на свою мягкость, «демографический» критерий позволил нам исключить огромный массив редких фамилий. Они составили три четверти от всех встреченных фамилий (