Коррелятивное преобразование

Корреляти'вное преобразова'ние (от позднелат. correlatio — соотношение), взаимно однозначное соответствие между множеством всех точек проективной плоскости и множеством всех прямых этой плоскости, при котором любым трём точкам, лежащим на одной прямой, соответствуют три прямые, проходящие через одну точку, а любым трём прямым, проходящим через одну точку, соответствуют три точки, лежащие на одной прямой.

Корреляционный анализ

Корреляцио'нный ана'лиз, совокупность основанных на математической теории корреляции методов обнаружения корреляционной зависимости между двумя случайными признаками или факторами. К. а. экспериментальных данных заключает в себе следующие основные практические приёмы: 1) построение корреляционного поля и составление корреляционной таблицы; 2) вычисление выборочных коэффициентов корреляции или корреляционного отношения; 3) проверка статистической гипотезы значимости связи. Дальнейшее исследование заключается в установлении конкретного вида зависимости между величинами (см. Регрессионный анализ ). Зависимость между тремя и большим числом случайных признаков или факторов изучается методами многомерного К. а. (вычисление частных и множественных коэффициентов корреляции и корреляционных отношений).

  Корреляционное поле и корреляционная таблица являются вспомогательными средствами при анализе выборочных данных. При нанесении на координатную плоскость выборочных точек получают корреляционное поле. По характеру расположения точек поля можно составить предварительное мнение о форме зависимости случайных величин (например, о том, что одна величина в среднем возрастает или убывает при возрастании другой). Для численной обработки результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке корреляционной таблицы (см. в ст. Корреляция в математической статистике) приводятся численности гц; тех пар (х, у), компоненты которых попадают в соответствующие интервалы группировки по каждой переменной.

  Предполагая длины интервалов группировки (по каждому из переменных) равными между собой, выбирают центры xi (соответственно yj ) этих интервалов и числа nij в качестве основы для расчётов.

  Коэффициент корреляции и корреляционное отношение дают более точную информацию о характере и силе связи, чем картина корреляционного поля. Выборочный коэффициента корреляции определяют по формуле:

Большая Советская Энциклопедия (КО) - i-images-115061557.png
,

где

Большая Советская Энциклопедия (КО) - i-images-137364808.png
,
Большая Советская Энциклопедия (КО) - i-images-144331684.png
,

Большая Советская Энциклопедия (КО) - i-images-129731080.png
,
Большая Советская Энциклопедия (КО) - i-images-116863343.png
.

  При большом числе независимых наблюдений, подчиняющихся одному и тому же распределению, и при надлежащем выборе интервалов группировки коэффициент

Большая Советская Энциклопедия (КО) - i-images-101946980.png
 близок к истинному коэффициенту корреляции r. Поэтому использование
Большая Советская Энциклопедия (КО) - i-images-108755039.png
 как меры связи имеет четко определённый смысл для тех распределений, для которых естественной мерой зависимости служит r (т. е. для нормальных или близких к ним распределений). Во всех др. случаях в качестве характеристики силы связи рекомендуется использовать корреляционное отношение h , интерпретация которого не зависит от вида исследуемой зависимости.

  Выборочное значение

Большая Советская Энциклопедия (КО) - i-images-178947884.png
y |x вычисляется по данным корреляционной таблицы:

Большая Советская Энциклопедия (КО) - i-images-164972482.png
2 y |x =
Большая Советская Энциклопедия (КО) - i-images-115504369.png

где числитель характеризует рассеяние условных средних значений

Большая Советская Энциклопедия (КО) - i-images-191801734.png
  около безусловного среднего
Большая Советская Энциклопедия (КО) - i-images-165227526.png
(аналогично определяется выборочное значение
Большая Советская Энциклопедия (КО) - i-images-163151410.png
x |y ). Величина
Большая Советская Энциклопедия (КО) - i-images-124086364.png
y |x
Большая Советская Энциклопедия (КО) - i-images-108799750.png
используется в качестве меры отклонения зависимости от линейной, т. к. обычно
Большая Советская Энциклопедия (КО) - i-images-119446466.png
2 y |x >r2 ,
Большая Советская Энциклопедия (КО) - i-images-117102670.png
x |y >r2 и лишь в случае линейной зависимости r2 =
Большая Советская Энциклопедия (КО) - i-images-131930998.png
2 y |x =
Большая Советская Энциклопедия (КО) - i-images-180249815.png
x |y . Так, при анализе корреляции между высотой и диаметром северной сосны было обнаружено, что условные средние значения высоты сосны для заданного диаметра связаны нелинейной зависимостью. Корреляционное отношение (высоты к диаметру) в этом случае равно 0,813, а коэффициент корреляции равен 0,762.

  Проверка гипотезы значимости связи основывается на знании законов распределения выборочных корреляционных характеристик. В случае нормального распределения величина выборочного коэффициента корреляции

Большая Советская Энциклопедия (КО) - i-images-100331573.png
 считается значимо отличной от нуля, если выполняется неравенство

Большая Советская Энциклопедия (КО) - i-images-123859220.png
,

где ta есть критическое значение t-распределения Стьюдента с (n— 2) степенями свободы, соответствующее выбранному уровню значимости a (см. Стьюдента распределение ). Если же известно, что r ¹ 0, то необходимо воспользоваться z -преобразованием Фишера (не зависящим от r и n ):

Большая Советская Энциклопедия (КО) - i-images-112404622.png
.

Исходя из приближённой нормальности z, можно определить доверительные интервалы для истинного коэффициента корреляции r .

  В случае когда изучаются не количественные признаки, а качественные, обычные меры зависимости не годятся. Однако, если удаётся каким-либо образом упорядочить изучаемые объекты в отношении некоторого признака, т. е. прописать им порядковые номера — ранги (по два номера в соответствии с двумя признаками), то в качестве выборочной характеристики связи можно воспользоваться, например, т. н. коэффициентом ранговой корреляции:

Большая Советская Энциклопедия (КО) - i-images-152557024.png
,

где di разность рангов по обоим признакам для каждого объекта. По степени уклонения R от нуля можно сделать некоторое заключение о степени зависимости качественных признаков. Проверка гипотезы независимости признаков при небольшом объёме выборки производится с помощью специальных таблиц, а при n > 10 для вычисления критических значений выборочных коэффициентов пользуются тем, что эти величины распределены приближённо нормально.

  Лит. см. при ст. Корреляция .