Двумерная корреляционная модель

Рассмотрим случай изучения корреляционной зависимости между двумя случайными величинами Y и X. Построение двумерной корреляционной модели предполагает, й коэффициент корреляции.
В двумерной корреляционной модели используется так же, как мера тесноты связи, ρ2 - коэффициент детерминации, указывающий долю дисперсии одной случайной величины, обусловленную вариацией другой.
Для получения точечных оценок параметров двумерной корреляционной модели расчеты производят в соответствии со следующими формулами:

- оценка для μx

- оценка для μу

- оценка для σx

-оценка для σу

- оценка для ρ
данные наблюдения лежат на прямой с положительным углом наклона в плоскости ху и с увеличением х растет у. Когда х уменьшается, то у уменьшается. Отрицательный знак коэффициента свидетельствует об отрицательной корреляции. Чем ближе значение |r| к единице, тем связь теснее, приближение |r| к нулю означает ослабление линейной зависимости между переменными. При |r|=1 корреляционная связь перерождается в функциональную.
На практике при изучении зависимости между двумя случайными величинами используют поле корреляции, которое представляет собой диаграмму, на которой изображается совокупность значений двух признаков. Каждая точка этой диаграммы в пространстве (ХУ) свидетельствует об отсутствии корреляционной зависимости.
y y y

x x x

Рис.1 Рис.2 Рис.3

В двумерном корреляционном анализе, обычно строят поле корреляции и рассчитывают точечные оценки параметров корреляционной модели по результатам выборки, проверяют значимость коэффициента корреляции. Проверяется гипотеза Н0: ρ=0. Если на уровне значимости α гипотеза отвергнется, то коэффициент корреляции считается значимым и рассчитанное по выборке значение r может быть использовано в качестве его точечной оценки. Если коэффициент корреляции оказывается незначимым, то гипотеза не отвергается и на практике коэффициента корреляции имеет сложный вид, поэтому используют специально подобранные функции от выборочного коэффициента корреляции, которые подчиняются хорошо изученным законам, например нормальному или Стьюдента.
При нахождении доверительного интервала для коэффициента корреляции ρ чаще используют преобразование Фишера:


По таблице z - преобразования Фишера для выборочного коэффициента r находят соответствующее ему zr и находят интервальную оценку для M(z) из условия:

= γ=Ф(tγ),

где tγ находят по таблице интегральной функции Лапласа для данного γ = 1 – α.
Получив доверительный интервал: zmin ≤ M(z) ≤ zmax с помощью таблицы z - преобразования Фишера получают интервальную оценку: rmin ≤ ρ ≤ rmax, где rmin и rmax выбираются с учетом того, что z - функция нечетная.
Пример 1. На основании выборочных данных о производительности труда (х) и себестоимости продукции (у), полученных с однотипных предприятий за месяц и представленных в таблице 1, себестоимость продукции у 7 10 12 2 5 4

Решение
Составим вспомогательную таблицу 2
Таблица 2
xi yi xiyi xi2 yi2
5 7 35 25 49
4 10 40 16 100
3 12 36 9 144
20 2 40 400 4
10 5 50 100 25
15 4 60 225 9
Σ 57 40 261 775 331

Выборочный парный коэффициент корреляции рассчитывается по формуле

=
где





Для проверки значимости коэффициента корреляции сформулируем статистическую гипотезу Н0: ρ=0. По таблице Фишера-Йейтса находим rтабл (α=0,05; υ=n-2=4)=0,811. Сравнение rнабл =0,97 с rтабл=0,811 свидетельствует о том , что нулевая гипотеза отвергается и, следовательно, коэффициент корреляции ρ значим.
Интервальную оценку для ρ рассчитаем с помощью z - преобразований Фишера. По таблице значений статистики zr находим zr=0,97. Из условия, что γ=Ф(tγ)=0,95, находим по таблице интегральной функции Лапласа tγ=1,96. Тогда интегральная оценка для MZr определяется:


Воспользовавшись таблицей z - преобразования Фишера, перейдем от z к ρ и найдем интегральную оценку с надежностью γ=0,95:
-0,994 ≤ ρ ≤ -0,86.

Powered by Drupal - Design by artinet