Читаем Большая Советская Энциклопедия (КО) полностью

  Обратное заключение не всегда справедливо. Для выяснения вопроса, насколько хорошо регрессия передаёт изменение Y при изменении X, используется условная дисперсия Y при данном значении Х = х или её средняя величина — дисперсия Y относительно линии регрессии (мера рассеяния около линии регрессии):

2.

При строгой функциональной зависимости величина Y при данном Х = х принимает лишь одно определенное значение, то есть рассеяние около линии регрессии равно нулю.

  Линия регрессии может быть приближённо восстановлена по достаточно обширной корреляционной таблице: за приближённое значение у (х) принимают среднее из тех наблюдённых значений Y, которым соответствует значение Х = х. На рисунке изображена приближённая линия регрессии для зависимости среднего диаметра сосен от высоты в соответствии с таблицей. В средней части эта линия, по-видимому, хорошо выражает действительная закономерность. Если число наблюдений, соответствующих некоторым значениям X , недостаточно велико, то такой метод может привести к совершенно случайным результатам. Так, точки линии, соответствующие высотам 29 и 30 м, ненадёжны ввиду малочисленности материала. См. Регрессия .

  В случае К. двух количественных случайных признаков обычным показателем концентрации распределения вблизи линии регрессии служит корреляционное отношение

,

где   — дисперсия Y (аналогично определяется корреляционное отношение , но между  и  нет какой-либо простой зависимости). Величина , изменяющаяся от 0 до 1, равна нулю тогда и только тогда, когда регрессия имеет вид у (x) = mY , в этом случае говорят, что Y некоррелирована с X,   равняется единице в случае точной функциональной зависимости Y от X. Наиболее употребителен при измерении степени зависимости коэффициент корреляции между Х и Y

всегда —1 £ r £ 1. Однако практическое использование коэффициента К. в качестве меры зависимости оправдано лишь тогда, когда совместное распределение пары (X, Y) нормально или приближённо нормально (см. Нормальное распределение ); употребление r как меры зависимости между произвольными Y и Х приводит иногда к ошибочным выводам, т. к. r может равняться нулю даже тогда, когда Y строго зависит от X . Если двумерное распределение Х и Y нормально, то линии регрессии Y по Х и Х по Y суть прямые у = mY + bY (x — mx) и х = mx+ bx (у — mY ), где  и ; bY и bX именуются коэффициентами регрессии, причём

.

  Так как в этом случае

Е (Y - y (x))2 = s2Y ( 1 - r2 )

и

Е (Y - x (y))2 = s2X ( 1 - r2 )

  то очевидно, что r (корреляционные отношения совпадают с r2 полностью определяет степень концентрации распределения вблизи линий регрессии: в предельном случае r = ± 1 прямые регрессии сливаются в одну, что соответствует строгой линейной зависимости между Y и X , при r = 0 величины не коррелированы.

Корреляция между диаметрами и высотами 624 стволов северной сосны

Диаметр, см Высота, м Итого
17 18 19 20 21 22 23 24 25 26 27 28 29 30
14-17 2 2 5 1 10
18-21 1 3 3 12 15 9 4 47
22-25 1 1 1 3 18 24 29 14 7 98
26-29 7 18 30 43 31 3 2 134
30-33 1 5 18 29 35 18 7 1 114
34-37 1 3 17 33 26 12 6 98
38-41 2 2 10 19 16 4 53
42-45 4 13 6 8 1 32
46-49 3 3 7 6 2 1 22
50-53 1 4 4 2 1 12
54-57 1 1 1 3
58 и более 1 1
Итого 4 6 9 16 41 57 86 108 124 91 55 24 2 1 624
Средний диаметр 18,5 18,6 17,7 20,0 22,9 25,0 27,2 30,1 32,7 38,3 40,0 41,8 49,5 43,5 31,2

При изучении связи между несколькими случайными величинами X1 ,..., Xn пользуются множественными и частными корреляционными отношениями и коэффициентами К. (последними по-прежнему в случае линейной связи). Основной характеристикой зависимости являются коэффициенты rij — простые коэффициенты К. между Xi и Xj , в совокупности образующие корреляционную матрицу (rij ) (очевидно, rij = rji и rkk = 1). Мерой линейной К. между X1 и совокупностью всех остальных величин X2 ,..., Xn служит множественный коэффициент К., равный при n = 3

.

Если предполагается, что изменение величин X1 и X2 определяется в какой-то мере изменением остальных величин X3 , ..., Xn , то показателем линейной связи между X1 и X2 при исключении влияния X3, ..., Xn ; является частный коэффициент К. X1 и X2 относительно X3 ,..., Xn , равный в случае n= 3

Множественные и частные корреляционные отношения выражаются несколько сложнее.

  В математической статистике разработаны методы оценки упомянутых выше коэффициентов и методы проверки гипотез об их значениях, использующие их выборочные аналоги (выборочные коэффициенты К., корреляционные отношения и т. п.). См. Корреляционный анализ .

Перейти на страницу:

Похожие книги

100 великих кладов
100 великих кладов

С глубокой древности тысячи людей мечтали найти настоящий клад, потрясающий воображение своей ценностью или общественной значимостью. В последние два столетия всё больше кладов попадает в руки профессиональных археологов, но среди нашедших клады есть и авантюристы, и просто случайные люди. Для одних находка крупного клада является выдающимся научным открытием, для других — обретением национальной или религиозной реликвии, а кому-то важна лишь рыночная стоимость обнаруженных сокровищ. Кто знает, сколько ещё нераскрытых загадок хранят недра земли, глубины морей и океанов? В историях о кладах подчас невозможно отличить правду от выдумки, а за отдельными ещё не найденными сокровищами тянется длинный кровавый след…Эта книга рассказывает о ста великих кладах всех времён и народов — реальных, легендарных и фантастических — от сокровищ Ура и Трои, золота скифов и фракийцев до призрачных богатств ордена тамплиеров, пиратов Карибского моря и запорожских казаков.

Андрей Юрьевич Низовский , Николай Николаевич Непомнящий

История / Энциклопедии / Образование и наука / Словари и Энциклопедии