Rabota

  • 13 апр. 2012 г.
  • 1085 Слова
ISMA

ISMA


Корреляционно-регрессионный анализ
“Оценкапараметров регрессионных моделей в Microsoft Exel”



Студентка: Анна Гаранина

Группа:6393

2012
Оценка параметров регрессионных моделей в пакетах MS Excel

1. Постановка задачи.

Оценивание параметров уравнениярегрессии при помощи:
* метода наименьших квадратов (МНК),
* через готовые формулы (определители) регрессионного анализа.
* различные методы, представленные в пакетах MS Excel.
* Расчет линейной регрессионной модели в пакетах MS Excel будем осуществлять по стандартной функции LINESTиз группы Statistical.
2. Проверить гипотезу о значимости регрессии и оценить степень адекватностимодели с помощью следующих коэффициентов:

* - коэффициент корреляции - R(r)
* - коэффициент детерминации – R2(η2)
* - коэффициент Фишера F.
3. Математическое решение задачи

Найдем зависимость между парой переменных Х и Y.
В моем случае X-это число холодильников ,а Y-это число домохозяйства.
Переменная Х носит название независимой переменной, переменная Y называется зависимойпеременной. Мы хотим определить именно зависимость Y от Х или предсказать какими будут Y при данных значениях Х.

Цель работы.

Мы хотим определить именно зависимость Y от Х или предсказать какими будут Y при данных значениях Х.
Мы будем рассматривать самую простую регрессионную модель – линейную
Постулируем, что наблюдаемые величины связаны между собой регрессионной зависимостью вида:

Y(i) = B1*X(i) + B0 +e(i),

Задача

Предположим, что мы имеем случайную выборку из 10 домохозяйств для улучшения связи между числом холодильников (Х) в домохозяйстве и числом членов домохозяйства(Y).

(Х) число холодильников | 6 | 2 | 4 | 3 | 4 | 4 | 6 | 3 | 2 | 2 |
(Y) число домохозяйства | 4 | 1 | 3 | 2 | 2 | 3 | 4 | 1 | 2 | 2 |

Решение задачи

Вычислим суммы, необходимые для расчета коэффициентовуравнения линейной регрессии и коэффициентадетерминации с помощью вспомогательной таблицы.

Таблица 1
№ | число холодильников | число членов домохоз. | x2 | xy | y2 | Ῡ | yx-y | (yx-y)2 |
1 | 6 | 4 | 36 | 24 | 16 | 3,9 | 20 | 400 |
2 | 2 | 1 | 4 | 2 | 1 | 1,4 | 1 | 1 |
3 | 4 | 3 | 16 | 12 | 9 | 2,65 | 9 | 81 |
4 | 3 | 2 | 9 | 6 | 4 | 2,025 | 4 | 16 |
5 | 4 | 2 | 16 | 8 | 4 | 2,65 | 6| 36 |
6 | 4 | 3 | 16 | 12 | 9 | 2,65 | 9 | 81 |
7 | 6 | 4 | 36 | 24 | 16 | 3,9 | 20 | 400 |
8 | 3 | 1 | 9 | 3 | 1 | 2,025 | 2 | 4 |
9 | 2 | 2 | 4 | 4 | 4 | 1,4 | 2 | 4 |
10 | 2 | 2 | 4 | 4 | 4 | 1,4 | 2 | 4 |
Итого | 36 | 24 | 150 | 99 | 68 | 24 | 75 | 1027 |

Построим диаграмму рассеяния (тип используемой диаграммы XY Scatter).Рис.1

I способ

Найдем параметры a и b. Прямая регрессии имеет вид y = a + b·x.
Применяя метод наименьших квадратов, получаем систему нормальных уравнений для оценки параметров:

10a+36b=24 /10
36a+150b=99 /36

a+3.6b=2.4
a+4.16b=2.75

0.56b=0.35
b=0.625

10a+36*0.625=24
10a+22.5=24
10a=1.5
a=0.15Искомое уравнение имеет свой вид :

Ȳx=0.15+0.625x

II способ
Найдем а и b через готовые формулы
(вытекает из 1 –го уравнения системы нормальных уравнений, если все его члены разделены на n).
, где cov(x, y) – ковариация признаков, - дисперсия признака х.

Таким образом, получаем формулу расчета оценки параметра b:
, где

X=36/10=3.6
Ȳ=24/10=2.4
X2=150/10=15
(X)2=(36/10)2=12.96X*Y=99/10=9.9

Сделаем расчет оценки параметра B:

B=9.9-(3.6*2.4)/15-12.96=9.9-8.64/2.04=1.26/2.04=0.62

Сделаем расчет оценки параметра А :

A=2.4-0.62*3.6=2.4-2.232=0.16

Ископаемое уравнение регрессии имеет вид:

Yx=0.16-0.62x

Коэффициент эластичности:

Э = b*x / y =0.62*3.6/2.4=0.93

Вывод :Коэффициент эластичности показывает изменение результативного...
tracking img