Читаем Русский генофонд на Русской равнине полностью

Одним из инструментов является корреляционно-регрессионный анализ. В методы статистической трансформации карт входят алгоритмы расчёта различных показателей связей между геногеографическими картами: парной, ранговой, частной и множественной корреляции, коэффициентов регрессии. Для оценки связи между признаками рассчитываются корреляции между цифровыми моделями (ЦМ) карт соответствующих признаков. Чаще всего в геногеографии используются два показателя связи — коэффициент ранговой корреляции Спирмена и коэффициент частной корреляции [Айвазян и др., 1989]. Оба этих показателя, в отличие от наиболее известного коэффициента парной корреляции Пирсона, используются в тех случаях, когда необходимо определить взаимозависимость между рядами, распределенными не по нормальному закону (распределение частот аллелей в большинстве случаев отличается от нормального).

Для многих разделов, например, экологической генетики, чрезвычайно важно получить не общую на весь ареал оценку связи, а карту, которая позволяет видеть географию связи. Такая карта, показывающая тесноту связи на разных территориях, является уникальным инструментом для оценки пространственной изменчивости самих связей [Балановская, Нурбаев, 1999].

Традиционно исследователь использует для анализа единственный коэффициент корреляции на весь ареал. Такие «валовые» коэффициенты корреляции позволяют оценить степень связи в анализируемой системе в целом (например, степень связи мёж-ду частотой гена и климатическими факторами среды, широтой и долготой местности [Spitsyn et al., 1998; Кравчук и др., 1998]). Однако гетерогенность среды и генофонда приводят к тому, что такая связь может различаться в различных частях ареала, причём не только по величине, но даже и по знаку. Поэтому наиболее полный и корректный анализ можно провести при картографировании самих корреляций, когда карта демонстрирует степень связи между анализируемыми параметрами в различных частях ареала.

Использование технологии «плывущего окна» позволяет создавать принципиально новые карты связей и зависимостей. В общем виде подход реализован нами следующим образом. На одной картографической основе строятся компьютерные интерполяционные карты всех анализируемых признаков (например, карта одного гена и карта средового параметра). Пункты изучения признаков не обязательно должны совпадать в пространстве, поскольку при переходе от исходных значений к карте интерполяция будет проведена на узлы густой равномерной сети. А уже сами картографические основы, сами сети карт должны быть идентичны. Далее используется процедура «плывущего окна»: в пределах части ареала («окна» заданного размера — постоянного или меняющегося) рассчитывается коэффициент корреляции (непараметрический), значение которого заносится в центральный узел «окна». Далее окно скользит на один узел, и вся процедура повторяется до тех пор, пока в каждый узел карты не будет занесено соответствующее ему значение корреляции. В результате этой процедуры получаем карту корреляций, демонстрирующую их гетерогенность в пространстве ареала. Размер окна (выбираемый в зависимости от задачи и масштаба исследований) может быть постоянным в пространстве карты, либо меняющимся, например, в зависимости от изученности частей ареала. Расчёт можно провести с учетом надёжности картографирования: части ареала с низкой достоверностью картографического прогноза не включаются в анализ корреляций.

Карта демонстрирует интенсивность связи в каждой точке пространства и позволяет анализировать пространственную изменчивость связей. Приведём распространённый пример. Коэффициент корреляции между картами двух признаков близок к 0. из чего делается вывод об отсутствии связи между признаками. Карта корреляций обнаруживает ошибочность этого вывода: половина ареала занята значениями корреляций r≈-1, другая половина — значениями r≈+1, и лишь узкий коридор между ними — промежуточными значениями r≈0. То есть карта обнаруживает не только высокую связь между признаками, но и её пространственную изменчивость: наличие двух областей с противоположным направлением связи, что позволяет искать факторы, определяющие взаимодействие признаков, формулировать гипотезы, которые можно проверять с помощью дальнейшего картографо-статистического анализа.

Таким образом, карты корреляций позволяют корректно анализировать связь как между параметрами среды и структурой популяции, так и между любыми другими признаками, гетерогенными в пространстве.

Корреляционные карты подразделяются на два основных типа: 1) картографирование связей между геногеографическими картами; 2) картографирование корреляций между картой частоты признака и географическими координатами местности — широтой и долготой.

Перейти на страницу:

Похожие книги