При интерполяции ортогональными полиномами нулевой степени узлы сетки могут содержать только значения частот аллеля, промежуточные между значениями в опорных точках. Например, узлы сетки, расположенные вокруг исходных популяций с частотами 0.2 и 0.6, будут нести только промежуточные значения — 0.21, 0.30, 0.40, 0.50, 0.59. Это уменьшает дисперсию (и GST
) при переходе от таблиц к карте. Однако при интерполяции ортогональными полиномами первой степени картина иная. При продолжении географического тренда признака на области, не обеспеченные опорными точками, в этих областях формируются значения не промежуточные, а соответствующие продолжению тренда. Например, увеличение частоты аллеля от 0.2. до 0.6 может сопровождаться продолжением тренда в узлах сетки — частотами 0.70,0.80, 0.90. Это увеличивает дисперсию карты (GST).Рассмотрим действие первых двух факторов в наших модельных регионах.
Действие первого фактора ярко проявляется для населения Белоруссии и Западного региона (
Иной случай отражён на карте распределения частоты гена RH*d
в Северной Евразии (табл. 5.1.1.), где большое число европейских и кавказских популяций с высокими значениями частоты гена обладает малыми ареалами, в то время как для популяций Сибири и Казахстана характерны низкие значения признака при обширных популяционных ареалах. Поскольку задача карты — представить распределение признака по всему географическому пространству, «вес» азиатских популяций при построении карты настолько выше, насколько больше их ареал. Именно это отражено и в различной форме гистограмм карты RH*d (двухвершинной для таблиц, одновершинной для карт), и в увеличении (по сравнению с табличным) разнообразия карты (GST), и в изменении среднего значения (М) в сторону сибирских величин.Если задать вопрос: а какие значения «правильней»? То ответ будет однозначным — конечно, значения карт. Табличные значения вынужденно «забывают» о популяционных ареалах и потому игнорируют различия в них. Кроме того, европейские популяции с высокими частотами RH*d
изучены намного более подробно, чем азиатские, и потому резко «перевешивали» при прямом анализе табличных данных. Возвращение к географическому пространству карт восстанавливает равновесие и справедливость.Подобное моделирование позволило ответить на вопрос: что происходит с информацией, когда мы картографируем исходные данные? Зная ареалы и частоты, параметры интерполяции, можно предсказать, как изменятся статистические параметры признаков (средние частоты, разнообразие) при построении карты. При этом статистические показатели карты, как мы видели, более точны и справедливы.
МЕНЯЮТСЯ ЛИ ИСХОДНЫЕ ЧАСТОТЫ В
ИЗУЧЕННЫХ ПОПУЛЯЦИЯХ?
Но остался ещё один вопрос, который всегда нам задают: что происходит с исходными популяционными данными? Меняются ли при переходе от таблицы к карте частоты генов в самих изученных популяциях? Здесь ответ всегда однозначен — нет!
При любых параметрах интерполяция всегда затрагивает только промежуточные точки пространства (картографический прогноз), а сами изученные популяции (опорные точки) всегда сохраняют на карте ту частоту, которая была указана в таблице. Это одно из основных условий алгоритма построения карты. А вот последующие трансформации карты уже могут затрагивать исходные популяционные частоты, поскольку при всех последующих операциях все узлы карты равноправны — как те, которые были изучены при экспедиционном обследовании, так и узлы с интерполированными значениями. Например, при создании «сглаженных» карт для выявления трендов (основных направлений изменчивости) происходит усреднение в пределах заданного окна карты. Это помогает найти «золотую середину», когда соседние популяции из-за ошибок выборки дают разные показания, при этом значения в опорных точках немного сдвигаются в сторону среднего значения.
ЕСТЕСТВЕННЫЙ ОТБОР
Теперь зададимся иным вопросом. В какой степени карты классических маркёров могут отражать действие естественного отбора в популяциях?