всегда —1 ? r ? 1. Однако практическое использование коэффициента К. в качестве меры зависимости оправдано лишь тогда, когда совместное распределение пары (X, Y) нормально или приближённо нормально (см. Нормальное распределение ); употребление r как меры зависимости между произвольными Y и Х приводит иногда к ошибочным выводам, т. к. r может равняться нулю даже тогда, когда Y строго зависит от X . Если двумерное распределение Х и Y нормально, то линии регрессии Y по Х и Х по Y суть прямые у = mY + bY (x — mx) и х = mx+ bx (у — mY ), где
и ; bY и bX именуются коэффициентами регрессии, причём.Так как в этом случае
Е (Y - y (x))2 = s2 Y ( 1 - r2 )
и
Е (Y - x (y))2 = s2 X ( 1 - r2 )
то очевидно, что r (корреляционные отношения совпадают с r2 полностью определяет степень концентрации распределения вблизи линий регрессии: в предельном случае r = ± 1 прямые регрессии сливаются в одну, что соответствует строгой линейной зависимости между Y и X , при r = 0 величины не коррелированы.
Корреляция между диаметрами и высотами 624 стволов северной сосны
см | м | Итого | |||||||||||||
17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | ||
14-17 | 2 | 2 | 5 | 1 | 10 | ||||||||||
18-21 | 1 | 3 | 3 | 12 | 15 | 9 | 4 | 47 | |||||||
22-25 | 1 | 1 | 1 | 3 | 18 | 24 | 29 | 14 | 7 | 98 | |||||
26-29 | 7 | 18 | 30 | 43 | 31 | 3 | 2 | 134 | |||||||
30-33 | 1 | 5 | 18 | 29 | 35 | 18 | 7 | 1 | 114 | ||||||
34-37 | 1 | 3 | 17 | 33 | 26 | 12 | 6 | 98 | |||||||
38-41 | 2 | 2 | 10 | 19 | 16 | 4 | 53 | ||||||||
42-45 | 4 | 13 | 6 | 8 | 1 | 32 | |||||||||
46-49 | 3 | 3 | 7 | 6 | 2 | 1 | 22 | ||||||||
50-53 | 1 | 4 | 4 | 2 | 1 | 12 | |||||||||
54-57 | 1 | 1 | 1 | 3 | |||||||||||
58 и более | 1 | 1 | |||||||||||||
Итого | 4 | 6 | 9 | 16 | 41 | 57 | 86 | 108 | 124 | 91 | 55 | 24 | 2 | 1 | 624 |
Средний диаметр | 18,5 | 18,6 | 17,7 | 20,0 | 22,9 | 25,0 | 27,2 | 30,1 | 32,7 | 38,3 | 40,0 | 41,8 | 49,5 | 43,5 | 31,2 |
При изучении связи между несколькими случайными величинами X1 ,..., Xn пользуются множественными и частными корреляционными отношениями и коэффициентами К. (последними по-прежнему в случае линейной связи). Основной характеристикой зависимости являются коэффициенты rij — простые коэффициенты К. между Xi и Xj , в совокупности образующие корреляционную матрицу (rij ) (очевидно, rij = rji и rkk = 1). Мерой линейной К. между X1 и совокупностью всех остальных величин X2 ,..., Xn служит множественный коэффициент К., равный при n = 3
.Если предполагается, что изменение величин X1 и X2 определяется в какой-то мере изменением остальных величин X3 , ..., Xn , то показателем линейной связи между X1 и X2 при исключении влияния X3, ..., Xn ; является частный коэффициент К. X1 и X2 относительно X3 ,..., Xn , равный в случае n= 3
Множественные и частные корреляционные отношения выражаются несколько сложнее.
В математической статистике разработаны методы оценки упомянутых выше коэффициентов и методы проверки гипотез об их значениях, использующие их выборочные аналоги (выборочные коэффициенты К., корреляционные отношения и т. п.). См. Корреляционный анализ .
Лит.: Дунин- Барковский И. В., Смирнов Н. В., Теория вероятностей и математическая статистика в технике (Общая часть), М., 1955; Крамер Г., Математические методы статистики, пер. с англ., М., 1948; Хальд А., Математическая статистика с техническими приложениями, пер. с англ., М., 1956; Ван дер Варден Б. Л., Математическая статистика, пер. с нем., М., 1960; Митропольский А. К., Техника статистических вычислений, 2 изд., М., 1971.
А. В. Прохоров.
Приближённая линия регрессии для зависимости среднего диаметра северной сосны от высоты.