Примеры --- Математическая статистика -- Однофакторная линейная регрессия
На базі
статистичних даних
певного регіону:
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
|
1 |
6,05 |
9,91 |
7,85 |
16,85 |
|
2 |
12,04 |
14,37 |
9,48 |
19,48 |
|
3 |
17,07 |
14,81 |
10,37 |
20,86 |
|
4 |
19,55 |
18,09 |
10,91 |
30,47 |
|
5 |
22,58 |
20,38 |
12,35 |
32,35 |
|
6 |
25,38 |
21,87 |
14,11 |
34,81 |
|
7 |
27,89 |
23,27 |
16,17 |
36,15 |
|
8 |
32,56 |
25,48 |
17,81 |
36,81 |
|
9 |
36,74 |
26,55 |
20,47 |
39,34 |
|
10 |
39,37 |
27,85 |
22,72 |
42,72 |
|
11 |
42,27 |
31,67 |
25,88 |
44,07 |
1) Визначити параметри лінійної моделі залежності витрат на
споживання (
) від рівня доходів
(
), збережень (
)
і заробітної плати (
)
2) Оцінити коефіцієнт детермінації
3) Перевірити наявність автокореляції залишків
4) Дослідити мультиколінеарність між факторами
Розв’язок
Матриця незалежних змінних

Вектор залежної змінної

Коефіцієнти регресії
![]()



Таким чином, ![]()
2) Коефіцієнт детермінації розраховуємо за формулою


Складемо
таблицю відхилень
, де
-
значення витрат на споживання, яке спостерігається для
- ого
регіону,
- значення витрат за
моделлю регресії
|
|
|
|
|
|
1 |
6,05 |
7,30 |
1,25 |
|
2 |
12,04 |
13,16 |
1,12 |
|
3 |
17,07 |
14,35 |
-2,72 |
|
4 |
19,55 |
19,47 |
-0,08 |
|
5 |
22,58 |
22,93 |
0,35 |
|
6 |
25,38 |
25,87 |
0,49 |
|
7 |
27,89 |
28,72 |
0,83 |
|
8 |
32,56 |
32,03 |
-0,53 |
|
9 |
36,74 |
35,10 |
-1,64 |
|
10 |
39,37 |
38,29 |
-1,08 |
|
11 |
42,27 |
44,23 |
1,96 |
Тепер можемо розрахувати коефіцієнт детермінації
![]()
Таким чином, функціональний зв’язок значно високий.
3) Для перевірки наявності автокореляції застосуємо критерій Дарбіна-Уотсона

Складемо
таблицю значень ![]()
|
|
|
|
|
1 |
1,25 |
|
|
2 |
1,12 |
-0,13 |
|
3 |
-2,72 |
-3,84 |
|
4 |
-0,08 |
2,64 |
|
5 |
0,35 |
0,43 |
|
6 |
0,49 |
0,14 |
|
7 |
0,83 |
0,34 |
|
8 |
-0,53 |
-1,36 |
|
9 |
-1,64 |
-1,11 |
|
10 |
-1,08 |
0,56 |
|
11 |
1,96 |
3,04 |
Тепер
можемо розрахувати величину ![]()

З
таблиць знаходимо значення верхньої та нижньої меж критерію для
(кількість
незалежних змінних)
(об’єм вибірки)
![]()
Оскільки
то
за критерієм Дарбіна-Уотсона не можливо визначити наявність автокореляції,
необхідні додаткові дослідження
4) Застосуємо алгоритм Феррара - Глобера (Розрахунки зроблені за допомогою MathCad 2002 тому хід обчислень не приводиться)
1. Нормалізуємо дані досліджень.
Для цього розрахуємо середнє арифметичне та дисперсію для кожної змінної
|
Змінна |
|
|
|
|
21,2955 |
39,15522 |
|
|
15,2836 |
31,25875 |
|
|
32,1736 |
79,56708 |
Перерахуємо матрицю параметрів незалежних змінних економетричної моделі

За
формулою 
Отримаємо матрицю

2. Обчислюємо кореляційну матрицю за формулою
![]()

3. Визначник матриці кореляцій
![]()
Визначаємо
величину
![]()
Оскільки
в задачі не визначений рівень значущості, приймемо його за
. Кількість
ступенів свободи
з таблиці квантилів
розподілу
, оскільки
,
робимо висновок, що в масиві незалежних змінних існує мільтиколінеарність
4.
Визначаємо матрицю помилок ![]()

5.
За допомогою діагональних елементів матриці розраховуємо
критерії
![]()
![]()
![]()
Отримані значення порівнюємо
з табличним значенням квантилів розподілу
, для рівня
значущості 0,05 та кількості ступенів свободи
та
.
,
Оскільки
, то всі змінні
мультиколінеарні між собою
Розраховуємо коефіцієнт детермінації
![]()
![]()
![]()
6. Розраховуємо часткові коефіцієнти кореляції за формулою


7. Розраховуємо
критерії

Порівнюємо
значення з табличним значенням квантилів розподілу
-Стюдента
при рівні значущості 0,05 та кількості ступенів свободи
,
бачимо, що всі
.
Висновки:
1. Аналіз масиву незалежних змінних загалом показав наявність мультиколінеарності факторів
2. Аналіз незалежних змінних з усіма іншими показав, що кожна змінна залежить від інших, отже, з масиву факторів необхідно виключити будь-які дві змінні та в подальшому розглядати модель однофакторної лінійної регресії
3. Аналіз попарної залежності змінних показав, що будь – які два фактори є залежними між собою