Насколько список фамилий может увеличиться? Ведь изучен только 1 млн. человек, а численность русского населения России, по данным последней переписи — в 116 раз больше. Поэтому сказать, сколько всего существует русских фамилий, пока нельзя. Однако было бы ошибкой предполагать, что их станет тоже в 116 раз больше. И не только потому, что уже изучен один миллион человек (это не так много для изменчивых фамилий), а потому, что изучено сельское население основных географических групп русского народа.
Поэтому выборка, не столь большая по общей численности, достаточно обширна в географическом измерении. Для создания полного списка фамилий это намного лучше, чем выборка пусть и большая по численности, но лишь из одного региона.Однако пока «насыщение» списка фамилий не достигнуто — так же, как и для гаплотипов митохондриальной ДНК (см.
ИСХОДНЫЕ СПИСКИ ФАМИЛИЙ
Основной источник данных о фамилиях — списки населения для каждой популяции, в которых указана фамилия каждого жителя, достигшего «официального» репродуктивного возраста (дети до 18 лет не учитываются). Эти списки «тотальные», то есть они охватывают всё население изученной популяции — населённого пункта, сельсовета, района. Эти списки населения переводятся в компьютерный вид, и на их основе рассчитывается частота каждой фамилии в каждой популяции — в каждом населённом пункте, в сельсовете, в районе, в регионе.
РАСЧЁТ ЧАСТОТ ФАМИЛИЙ
Частоты всех фамилий сначала рассчитывались для каждой группы популяций
(группа тесно связанных деревень — сельская администрация, сельсовет, волость). Её средняя численность — 1 тыс. человек (старше 18 лет). Далее усреднением данных по всем группам популяций данного района (где «весом» каждой группы популяций служила её численность) рассчитывались частоты всех фамилий в районе. Средняя численность носителей фамилий в районе — 20 тыс. человек. Далее по совокупности «районных» частот были рассчитаны невзвешенные средние частоты фамилий в регионе. Средняя численность изученного населения в регионе — 190 тыс. человек. А затем уже по совокупности региональных частот рассчитаны невзвешенные средние частоты фамилий в русском генофонде в целом. При расчёте «среднерусских» частот учитывались лишь «основные» регионы.ОСНОВНЫЕ РЕГИОНЫ
Пять регионов — Восточный, Центральный, Западный, Северный, Южный — представляют основные географические подразделения генофонда в «исконном» ареале. Они составили основу анализа русского генофонда по фамилиям и потому называются «основными».
ЮЖНЫЙ РЕГИОН.
Сразу бросается в глаза непропорционально большая численность Южного региона. Дело в том, что формированию репрезентативной выборки из него пришлось уделить особое внимание. Самый первый вариант анализа включал три региона — Восточный, Западный и Южный. Мы собрали данные о фамилиях так, что каждый регион был представлен примерно равной численностью — около 100 тысяч человек. Однако оказалось, что в Южном регионе самыми частыми оказались «местные» фамилии, а не широко распространённые в русском народе. Это было неожиданно, так как на юге миграции наиболее интенсивны, что должно было принести туда много фамилий из других регионов. Поэтому мы предположили, что наша выборка неадекватна — представленные фамилии характерны лишь для конкретных изученных популяций и не отражают регион в целом. Чтобы избежать этого, мы резко (в шесть раз!) увеличили число изученных индивидов и районов на юге русского ареала (точнее — на юго-западе, который отражает наиболее древние пласты в сложении русского народа и надёжнее представляет юг Руси, чем юго-восточные популяции). Причём, в отличие от других регионов, Южный регион включил данные не по одной, а по трём областям. Однако, как мы увидим ниже, своеобразие Южного региона при этом не исчезло: оно оказалось его реальной особенностью.ЗАПАДНЫЙ И ВОСТОЧНЫЙ РЕГИОНЫ
представлены и равным числом популяций (≈160 популяций), и равной численностью (фамилии ≈100 тысяч человек).