§ 9. ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИЙ.
9.4. Анализ линейной корреляции по опытным данным.
Одной из задач математической статистики является исследование корреляционной зависимости между случайными величинами.
Пусть проведено n опытов, в результате которых получены следующие значения системы величин :
(x1, y1), (x2, y2), ..., (xi, yi), ..., (xn, yn).
За приближенные значения ,
,
и
принимают их выборочные
значения
,
,
и
[см. формулы (66) и (67)]:
![]() |
(78) |
![]() |
(79) |
Выборочными коэффициентами корреляции называют число , определяемое соотношением:
![]() |
(80) |
Можно показать, что сходится по вероятности к коэффициенту корреляции
.
Заменяя в соотношениях (76) величины ,
и
их
выборочными значениями
,
и
[см. формулы (79) и (80)], получим приближенные
значения коэффициентов регрессии:
![]() |
(81) |
Подставляя в уравнения (74) и (75) приближенные значения коэффициентов регрессии и используя соотношения (78) и (81), получим уравнения эмпирических прямых регрессий:
![]() |
(82) |
![]() |
(83) |
При большом числе опытов для упрощения подсчета значений ,
,
,
и коэффициента корреляции
поступим следующим образом (см. § 9, п. 2, замечание).
Диапазоны изменения наблюдаемых значений случайных величин и
разобьем соответственно на интервалы
]X0, X1[, ]X1, X2[, ..., ]Xi-1, Xi[, ..., ]Xk-1, Xk[
и]Y0, Y1[, ]Y1, Y2[, ..., ]Yj-1, Yj[, ..., ]Ys-1, Ys[
Каждое из наблюдаемых значений , попавших в i-й (j-й) интервал, считаем приближенно равным середине этого интервала ci (dj).
Пусть
(
) - число значений
, попавших в в i-й (j-й) интервал, а x0 и y0 - произвольные
числа, близкие к серединам диапазонов изменения значений
и
. Полагая ui=ci-x0 и vj=dj-y0
и используя формулы (70) и (71), получим:
![]() |
(84) |
Для подсчета выборочного коэффициента корреляции по формуле (80) сначала запишем выражение
в новых переменных ui=ci-x0 и vj=dj-y0. Обозначим через mij число наблюдаемых значений пар
,
у которых значения
попали в i-й интервал ] Xi-1,Xi [, а значения
- в j-й интервал ] Yj-1,Yj [.
Каждое из этих значений
и
заменим соответствующими серединами ci и dj
интервалов ] Xi-1,Xi [ и ] Yj-1,Yj [. Тогда
где сумма в правой части равенства распространена на все возможные пары чисел (i,j), причем i пробегает значения от 1 до k, а j - от 1 до s. После преобразований в результате получим
Итак, окончательная расчетная формула для выборочного коэффициента корреляции имеет вид
![]() |
(85) |
Пример. Для выяснения зависимости между диаметром ствола () сосны и ее высотой (
) было исследовано 26 сосен.
Наблюдаемые значения высоты сосен колеблются в границах от 22,5 до 28,5 м,
диаметр ствола - от 20 до 48 см. (>>)