Эти опасения не случайны. Они вызваны «гипервариабельностью» фамилий. В терминах генетики фамилии предстают как один ген с чрезвычайно большим числом аллелей (сколько фамилий — столько и «аллелей» в этом «гене») и высокой скоростью их мутаций. Средняя частота каждого фамильного «аллеля» редко достигает даже 1 % уровня полиморфизма. Например, в выборке 200 тысяч жителей Санкт-Петербурга (на 1910 год) даже самая распространённая фамилия Иванов наблюдалась с частотой р=0.0095; а список из ста наиболее распространённых в Питере фамилий замыкал Наумов с частотой р=0.0006 [Суперанская и др., 1984].
При такой вариабельности фамилий для их достоверной оценки необходимо изучать большие популяции численностью в несколько тысяч, а не в несколько сотен человек.
Половина популяций — 50 районов — соответствуют этим требованиям. Но когда мы используем в качестве опорных популяций 50 сельсоветов, то мы ожидаем встретить резкие флуктуации в частотах фамилий: даже соседние сельсоветы могут резко различаться по частоте одной и той же фамилии. Дрейф генов («дрейф фамилий») вызывает случайные изменения частот фамилий в малых популяциях. Например, в одном сельсовете будет множество Смирновых, а в соседнем — множество Поповых, в то время как в исходной для них «прапопуляции» Смирновых и Поповых было поровну. Поэтому надо охватить много таких малых популяций в районе, чтобы правильно оценить среднюю частоту встречаемости и той, и другой фамилии в изучаемой части русского ареала.Первый вариант анализа мы провели по данным только о сельсоветах [Балановский и др., 2001]. Честно говоря, мы собирались анализировать по ним лишь обобщённые карты. Мы были уверены, что на картах отдельных фамилий увидим лишь «лоскутное одеяло» — слишком малые размеры сельсоветов дадут слишком хаотичную картину изменчивости отдельной фамилии. Это не препятствовало бы эффективности обобщённого анализа. Так, для генов наследственной патологии характерна чрезвычайно низкая частота (и «простые» карты строить для нет смысла), но их обобщённый картографический анализ оказался высоко эффективным [Наследственные болезни в популяциях человека, 2002; Зинченко и др., 2000].
Каково же было наше изумление, когда не только на обобщённых картах, но и на большинстве карт отдельных фамилий вместо «лоскутного одеяла» мы увидели ярко выраженные тренды (см. карты в [Балановский и др., 2001]). Насколько эти тренды должны быть сильны, что они сумели пробиться сквозь все случайности «дрейфа фамилий»! Видимо, благодаря тому, что ареал русского народа велик, мы можем охватить взглядом эти тренды вопреки случайным биениям (случайным всплескам или падениям) частоты отдельной фамилии. Такие тренды можно увидеть с высоты птичьего полёта, а не из мышиной норки (JT. Н. Гумилев). Такую высоту и даёт нам охват всего «исконного» русского ареала. Так, вопреки эффектам «дрейфа фамилий», карты отдельных фамилий оказались способными выявлять пространственные закономерности в масштабе «исконного» русского ареала. Это прямо свидетельствует в пользу пригодности русских фамилий для анализа генофонда.
Поэтому в том виде анализа, который мы приводим здесь, мы включили оба типа популяций — сельсоветы и районы. И получили редкую возможность сравнить их с картами, построенными нами ранее — только по данным о сельсоветах. Это даёт возможность ответить на вопрос — насколько верны закономерности, выявленные на «сельсоветных» картах? Не исчезнут ли они, если мы введём ещё столько же популяций, полученных по много более надёжным популяциям — районам? Эти новые карты охватывают в два раза больше популяций и в тридцать раз больше обследованных (почти 1 млн. человек). И вновь — вопреки нашим опасениям — оказалось, что новые карты нигде не нарушают обнаруженные ранее на «сельсоветном» уровне [Балановский и др., 2001] основные закономерности, но уточняют и детализируют их.
Этот вывод — один из важнейших методических выводов проведённой работы. Он свидетельствует о парадоксальной надёжности фамилий в качестве квазигенетического маркёра.
КАРТЫ РАЗНЫХ ФАМИЛИЙ