Мы, однако, будем работать с углом γ. Он имеет содержательный смысл: это — ошибка в определении угла наклона между плоскостями экватора и эклиптики. Заметим, что этот угол фиксируется, например, в армиллярной сфере. Следовательно, ошибка γ, допущенная в этом угле, может являться инструментальной ошибкой армиллярной сферы. См. главу 1. Таким образом, ошибка γ естественным образом возникает при астрономических измерениях. Кроме того, выбор γ в качестве параметра будет нами далее обоснован и со статистической точки зрения.
5. Статистические свойства оценок γstat
и φstatСейчас мы подойдем к задаче оценки параметров γ и φ, задающих систематическую ошибку каталога, как к задаче статистической. Для этого поступим так. Пусть составитель каталога в момент времени tА
совершил систематическую ошибку, задаваемую параметрами γА и φА. Пусть, кроме того, широта каждой измеренной им звезды подвергалась, — вследствие ошибки наблюдения, — случайному возмущению ξ имеющему нулевое среднее, то есть Eξi = 0. Предполагается, что случайные погрешности ξi, отвечающие различным звездам, независимы и имеют одно и то же распределение. Пусть σ2 = Еξ2i — дисперсия случайной величины ξi. Эта дисперсия нам, вообще говоря, неизвестна.В этих предположениях широта i-той звезды в каталоге будет иметь вид
bi
= Вi(tA) — γА sin (Li(tА) + φA) + ξi.Со статистической точки зрения мы имеем выборку, состоящую из N реализаций случайных величин {bi
}Ni=1, вида (5.5.1). По этой выборке требуется определить статистические оценки γ' и φ' параметров γА и φА, а также оценить величину σ, представляющую собой среднеквадратичную ошибку наблюдения. Мы сразу ограничим задачу и будем изучать оценки φ' = φstat и γ' = γstat, получаемые методом наименьших квадратов. Эти оценки имеют вид (5.3.6), (5.3.7). Основное внимание будет уделено оценке величины γА по причинам, объясненным в конце раздела 4.Равенство (5.5.1) имеет вид, традиционный для регрессионного анализа. В самом деле, это равенство утверждает, что ошибка наблюдения Δbi
= Bi(tA) — bi является случайной величиной со средним γА sin (Li(tA) + φА), зависящим от неизвестных параметров γА и φА, и дисперсией σ2. Требуется оценить значения неизвестных параметров методом наименьших квадратов и установить статистические свойства полученных оценок. В такой постановке кривую Y(x) = γA sin (x + φА) обычно называют линией регрессии.Определим величины φ и γ с помощью соотношений (5.3.6) и (5.3.7). Отклонения Δbi
случайны по предположению. Поэтому и получаемые из соотношений (5.3.6) и (5.3.7) оценки φstat и γstat, также являются случайными величинами. Изучим их статистические свойства и рассмотрим, как они связаны с истинными, но неизвестными нам, значениями φА и γА.Подставим в приведенные выше формулы для sb
и cb вместо Δbi разность γА × sin (Li(tA) + φА) — ξi и используем эту подстановку в формулах (5.3.6), (5.3.7). Получим следующие выражения для величин φstat и γstat:Введем величину R = (γA
(d2 — s2 c2) cos φА)-1Тогда (5.5.2) можно записать в виде
Из условия Eξi
= 0 находим, что полученная оценка параметра γstat является несмещенной, то есть Eγstat = γA.Дисперсия же оценки γstat
, обозначаемая Dγ, имеет видЕсли ошибки наблюдения ξi
нормально распределены, то и величина γstat является нормально распределенной, и первые два момента (5.5.5) и (5.5.6) полностью определяют ее распределение. Этот факт даст нам возможность построить доверительный интервал для значения γА. Анализ оценки φstat несколько более сложен. Воспользуемся следующим равенством, получаемым из (5.5.4):и тем фактом, что при больших N второе слагаемое в знаменателе правой части (5.5.7) — величина малая. В самом деле, эта величина — случайная с нулевым средним и дисперсией
Если ξi
нормально распределены, то и рассматриваемая величина также нормально распределена. Из этого факта для каталога Альмагеста следует, что уже для N = 30 вероятность pn того, что знаменатель правой части (5.5.7) будет отрицательным, не превосходит 5 × 10-3. С ростом N данная вероятность быстро убывает: p50 ≤ 2,5 × 10-4, p80 ≤ 4 × 10-6, p100 ≤ 3 × 10-7, p200 ≤ 8 × 10-13, р300 ≤ 2,5 × 10-18.Из формулы (5.5.7) следует, что, вообще говоря, E tan φstat
tan φA. Однако из этой формулы легко получить функцию распределения F(x) случайной величины tan φstat — tan φA, необходимую при нахождении доверительного интервала для φА. В самом деле, если пренебречь тем маловероятным случаем, что знаменатель в (5.5.7) становится отрицательным, то из этой формулы получается выражение для F(x):F(x) = P(tan φstat
— tan φA < x) = Р(ηx < x),где случайная величина ηх
имеет видСледовательно, если величины ξi
нормально распределены с дисперсией σ2, то и величина ηx имеет гауссовское распределение со средним, равным нулю, и дисперсиейСледовательно,
где