Читаем Русский генофонд на Русской равнине полностью

где qaконстанта, соответствующая заданному средне региональному значению частоты гена а; qanзначение частоты гена а в n-ном узле (с координатами i,j) сетки карты, где n принимает значения от 1 до N (общего числа узлов карты).

Помещая каждое из полученных значений θ2 в соответствующий n-ный узел новой карты, мы картографируем генетические расстояния и получаем искомую карту генетической удаленности каждой из точек карты от реперных частот. Усреднением карт по всем анализируемым генам получаются средние карты генетических расстояний, которые и используются как окончательный результат анализа.

Располагая достаточно большой выборкой генов и популяций, можно с помощью описанного инструментария — картографирования генетических расстояний — исследовать историю генофонда в целом, обнаруживать генетические следы исторических событий [Рычков, Батсуурь, 1987; Рычков, Балановская, 1988; Балановская и др., 1997, 1998; Кравчук и др., 1998, Почешхова, 1998]. Принципиально важно, что, создавая серии карт генетических расстояний, мы можем последовательно формулировать и проверять гипотезы о сходстве и генетических различиях между любыми группами народонаселения. Это позволяет перейти от картографического моделирования к картографическому эксперименту и открывает чрезвычайно широкие перспективы для геногеографии. В целом, инструментарий генетических расстояний является много более мощным и перспективным, чем методы главных компонент, автокорреляций, «wombling»-анализа и другие, используемые ныне мировым научным сообществом для описания генофондов.

§ 8. «Синтетические» карты главных компонент

Карты главных компонент представлять не надо, как и их аналог для признаков с внутригрупповой корреляцией — канонические переменные. Эти методы уже давно стали традиционными как в антропологии, так и в генетике.

СУТЬ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ

Метод главных компонент относится к группе методов снижения размерности, наряду с многомерным шкалированием, факторным анализом, анализом канонических переменных, методом экстремальной группировки признаков и другими [Айвазян и др., 1989]. Снижение размерности представляет собой переход от исходного набора многих показателей к небольшому числу вспомогательных переменных, на основании которых можно достаточно точно воспроизвести свойства анализируемого массива данных [Айвазян и др., 1989].

Первой главной компонентой исследуемой системы показателей называется такая нормированно-центрированная линейная комбинация этих показателей, которая среди всех прочих нормированно-центрированных линейных комбинаций обладает наибольшей дисперсией. Любой k-той главной компонентой называется такая нормированно-центрированная линейная комбинация, которая некоррелирована с предыдущими главными компонентами и среди всех прочих нормированно-центрированных и некоррелированных с предыдущими линейными комбинациями обладает наибольшей дисперсией [Айвазян и др., 1989].

Главные компоненты обладают следующими основными свойствами [Айвазян и др., 1989; Дерябин, 2001]:

1. Первые главные компоненты характеризуются наибольшей информативностью, которая определяется величиной их дисперсии (долей от общей суммарной дисперсии всех исходных признаков).

2. Все главные компоненты нескоррелированы и поэтому представляют собой независимые признаки.

Таким образом, анализ главных компонент представляет собой процедуру для упрощения многомерных данных с минимальной потерей информации [Cavalli-Sforza et al., 1994].

КАРТОГРАФИРОВАНИЕ-ГЛАВНЫХ КОМПОНЕНТ

Геногеография позволяет не только провести стандартную процедуру анализа главных компонент, но и увидеть их распределение в географическом пространстве. Каждая из карт главных компонент отражает динамику новых обобщённых признаков генофонда, имеет свой генетический ландшафт и выдвигает на первый план особый исторический сценарий [Cavalli-Sforza, Piazza, 1993] развития генофонда. Карты главных компонент уже не раз публиковались и демонстрировались для самых разных генофондов — Восточной Европы, Европы, Евразии, мира [Menozzi et al., 1978; Ammerman, Cavalli-Sforza, 1984; Rendine et al., 1986; Рычков, Балановская 1992; Cavalli-Sforza et al., 1995; Балановская, Нурбаев, 1997; Рычков и др., 1997, 1998].

Перейти на страницу:

Похожие книги