Примеры --- Математическая статистика -- Однофакторная линейная регрессия

Скачать в формате Word

На базі  статистичних даних певного регіону:

1

2

3

4

5

1

6,05

9,91

7,85

16,85

2

12,04

14,37

9,48

19,48

3

17,07

14,81

10,37

20,86

4

19,55

18,09

10,91

30,47

5

22,58

20,38

12,35

32,35

6

25,38

21,87

14,11

34,81

7

27,89

23,27

16,17

36,15

8

32,56

25,48

17,81

36,81

9

36,74

26,55

20,47

39,34

10

39,37

27,85

22,72

42,72

11

42,27

31,67

25,88

44,07

 

1)    Визначити параметри лінійної моделі залежності витрат на споживання ()  від рівня доходів (),  збережень () і заробітної плати ()

2)    Оцінити коефіцієнт детермінації

3)    Перевірити наявність автокореляції залишків

4)    Дослідити мультиколінеарність між факторами

Розв’язок

Матриця незалежних змінних

Вектор залежної змінної

Коефіцієнти регресії

Таким чином,

2) Коефіцієнт детермінації розраховуємо за формулою

Складемо таблицю відхилень , де  - значення витрат на споживання, яке спостерігається для  - ого регіону,  - значення витрат за моделлю регресії

1

6,05

7,30

1,25

2

12,04

13,16

1,12

3

17,07

14,35

-2,72

4

19,55

19,47

-0,08

5

22,58

22,93

0,35

6

25,38

25,87

0,49

7

27,89

28,72

0,83

8

32,56

32,03

-0,53

9

36,74

35,10

-1,64

10

39,37

38,29

-1,08

11

42,27

44,23

1,96

 

Тепер можемо розрахувати коефіцієнт детермінації

Таким чином, функціональний зв’язок значно високий.

3) Для перевірки наявності автокореляції застосуємо критерій Дарбіна-Уотсона

Складемо таблицю значень

1

1,25

 

2

1,12

-0,13

3

-2,72

-3,84

4

-0,08

2,64

5

0,35

0,43

6

0,49

0,14

7

0,83

0,34

8

-0,53

-1,36

9

-1,64

-1,11

10

-1,08

0,56

11

1,96

3,04

 

Тепер можемо розрахувати величину

З таблиць знаходимо значення верхньої та нижньої меж критерію для  (кількість незалежних змінних)  (об’єм вибірки)   

Оскільки  то за критерієм Дарбіна-Уотсона не можливо визначити наявність автокореляції, необхідні додаткові дослідження

4) Застосуємо алгоритм Феррара - Глобера (Розрахунки зроблені за допомогою MathCad 2002 тому хід обчислень не приводиться)

1. Нормалізуємо дані досліджень.

Для цього розрахуємо середнє арифметичне та дисперсію для кожної змінної

Змінна

21,2955

39,15522

15,2836

31,25875

32,1736

79,56708

 

Перерахуємо матрицю параметрів незалежних змінних економетричної моделі

За формулою

Отримаємо матрицю

2. Обчислюємо кореляційну матрицю за формулою

3. Визначник матриці кореляцій

Визначаємо величину  

Оскільки в задачі не визначений рівень значущості, приймемо його за . Кількість ступенів свободи  з таблиці квантилів розподілу , оскільки , робимо висновок, що в масиві незалежних змінних існує мільтиколінеарність

4. Визначаємо матрицю помилок

5. За допомогою діагональних елементів матриці розраховуємо  критерії

Отримані значення порівнюємо з табличним значенням квантилів розподілу , для рівня значущості 0,05 та кількості ступенів свободи  та . , Оскільки , то  всі змінні мультиколінеарні між собою

Розраховуємо коефіцієнт детермінації

6. Розраховуємо часткові коефіцієнти кореляції за формулою

7. Розраховуємо  критерії

Порівнюємо значення з табличним значенням квантилів розподілу -Стюдента при рівні значущості 0,05 та кількості ступенів свободи   , бачимо, що всі .

Висновки:

1.         Аналіз масиву незалежних змінних загалом  показав наявність мультиколінеарності факторів

2.         Аналіз незалежних змінних з усіма іншими показав, що кожна змінна залежить від інших, отже, з масиву факторів необхідно виключити будь-які дві змінні та в подальшому розглядати модель однофакторної лінійної регресії

3.         Аналіз попарної залежності змінних показав, що будь – які два фактори є залежними між собою

 

Hosted by uCoz