В случае существования линейной связи r
по модулю близко к единице, в обратном случае — к нулю. Важно, что коэффициент имеет уровень значимости, т.е. такое значение, начиная с которого можно уверенно говорить о существовании корреляции:
где n
— число членов рядов Xi и Yi, а число t определяется вероятностью, с которой мы хотим быть уверены в значимости корреляции (например, для 50% уверенности в существовании связи t = 0.6, для 99% — t = 3).Коэффициент регрессии
по своему смыслу — это угловой коэффициент прямой, которая наиболее близко проходит через точки с координатами (Xi, Yi). Когда все n точек не лежат на одной прямой, ее проводят так, чтобы сумма квадратов расстояний от этих точек до прямой была минимальной. Формула для коэффициента регрессии более сложна, чем для линейной корреляции, поэтому мы ее не приводим, подчеркнем только, что и здесь важна мера ошибки коэффициента регрессии, т.е. насколько хорошо указанные точки «ложатся» на прямую линию. Значения коэффициентов регрессии и линейной корреляции хорошо согласуются между собой — если коэффициент корреляции показывает наличие линейной связи переменных, то и ошибка коэффициента регрессии мала и наоборот.Почему же автор не использует эти или иные статистические коэффициенты для оценки связи (1)
? Мы не найдем в его книге ответа на этот вопрос. Вместо известных коэффициентов А. Т. Фоменко вводит свою собственную меру близости для рядов максимумов Л(X, Y). С его точки зрения, эта мера носит вероятностный характер, т.е. определяет «вероятность случайного совпадения лет» в сравниваемых рядах (мы чуть ниже проанализируем это утверждение). Впрочем, чем бы она ни была, если эта мера вводится корректно, то ее результаты должны согласовываться с приведенными выше коэффициентами. Коэффициент Л
(X, Y) и его свойстваЧтобы это проверить, опишем, как вычисляется Л
(X, Y). Идея получения этого коэффициента состоит в сравнении некоторых объемов в n-мерном пространстве, где размерность пространства n совпадает с наибольшей из длин рядов Xi и Yi. Данным рядам сопоставляются соответственно две точки n-мерного пространства X (X1, X2, … , Xn) и Y (Y1, Y2, … , Yn). Между этими точками (как и в обычном двух и трехмерном пространстве) определяется декартово расстояние
Сразу же обращает на себя внимание вопрос — как быть в случае, если число максимумов в анализируемых хрониках различно? Корректная статистическая процедура требовала бы, чтобы сравнивались ряды с наименьшей
из двух длин, т.е. из большего ряда выбирались бы последовательности чисел с длиной равной длине меньшего ряда, затем для каждой пары вычислялся бы коэффициент корреляции и делались бы соответствующие выводы о возможности линейной связи. Однако, автор идет по совершенно иному пути (ничем это не мотивируя) — выбирает наибольшую длину и предлагает считать в меньшем из рядов некоторые максимумы кратными, т.е. слившимися в одну точку, а соответствующие недостающие координаты Xi — равными 0. Ясно, что никакого исторического смысла такой кратный максимум не имеет, что же касается математической стороны, то очевидна неоднозначность процедуры выбора кратных максимумов, которая существенно влияет на подсчет Л(X, Y), о чем мы еще скажем ниже.Таким образом, координаты точек X
и Y являются целыми положительными числами или нулями, и при этом удовлетворяют условию
где А
— полная длина хронологического отрезка, который описывают хроники. Напомним, что по условию, обе хроники описывают одинаковые по продолжительности промежутки времени. Поскольку числа Xi являются расстояниями между соседними максимумами хроники, их полная сумма и должна равняться полной временной протяженности хроники, т.е. А. То же справедливо и для второй хроники Yi.Множество точек с целочисленными неотрицательными координатами, удовлетворяющими условию (4)
, автор обозначает Ш и придает ему смысл полного набора всех возможных хроник, которые описывают хронологический промежуток длины A. Каждой точке множества Ш соответствует некоторый набор максимумов, а ему, в свою очередь, некоторая «виртуальная» хроника, что и позволяет автору придать вводимому ниже коэффициенту вероятностную интерпретацию.