8. Определить наличие мультиколлинеарности, рассчитав частные коэффициенты корреляции и оценив их по критерию Стьюдента.
Корреляционная матрица
|
|
X1 |
X2 |
X3 |
X4 |
Y |
|
|
X1 |
1 |
0,446128 |
0,680316 |
0,045545 |
0,662025 |
|
|
X2 |
0,4461 |
1 |
0,586176 |
-0,282 |
0,752361 |
|
|
X3 |
0,6803 |
0,586176 |
1 |
-0,1824 |
0,664143 |
|
|
X4 |
0,0455 |
-0,282 |
-0,1824 |
1 |
-0,24729 |
|
|
Y |
0,662 |
0,752361 |
0,664143 |
-0,24729 |
1 |
Обратная корреляционная матрица
|
|
X1 |
X2 |
X3 |
X4 |
Y |
|
|
X1 |
2,52036 |
0,4145 |
-1,16689 |
-0,54197 |
-1,33945 |
|
|
X2 |
0,414509 |
2,4994 |
-0,56034 |
0,152202 |
-1,74506 |
|
|
X3 |
-1,16689 |
-0,5603 |
2,386395 |
0,24899 |
-0,32925 |
|
|
X4 |
-0,54197 |
0,1522 |
0,24899 |
1,206309 |
0,377236 |
|
|
Y |
-1,33945 |
-1,7451 |
-0,32925 |
0,377236 |
3,511615 |
Оценка частных коэффициентов корреляции
Оценка частных коэффициентов корреляции показала, что мультиколлинеарность между факторными признаками отсутствует, т.к. уровень значимости по критерию Стьюдента больше 5%. Годовая прибыль наиболее тесно связана со вторым факторным признаком (страховыми резервами), что подтверждает уровень значимости по критерию Стьюдента в 2,67%.
9. Оценить наличие автокорреляции ошибок модели множественной регрессии.
Y = 0,006917 * X1 + 0,014167 * X2 + 0,00144 * X3 - 0,00245 * X4 - 65,2964
|
№ |
Годовая |
Регрессионное значение |
Ошибка регрессии |
Остатки с единичным лагом |
|
|
п/п |
прибыль |
||||
|
|
(тыс. руб) |
||||
|
|
Y |
Yi |
?i |
?i-1 |
|
|
1 |
92 |
106,437 |
14,437 |
|
|
|
2 |
42 |
44,233 |
2,233 |
14,437 |
|
|
3 |
186 |
154,774 |
-31,226 |
2,233 |
|
|
4 |
48 |
50,683 |
2,683 |
-31,226 |
|
|
5 |
38 |
48,968 |
10,968 |
2,683 |
|
|
6 |
74 |
36,901 |
-37,099 |
10,968 |
|
|
7 |
48 |
65,622 |
17,622 |
-37,099 |
|
|
8 |
82 |
58,787 |
-23,213 |
17,622 |
|
|
9 |
45 |
57,388 |
12,388 |
-23,213 |
|
|
10 |
46 |
45,906 |
-0,094 |
12,388 |
|
|
11 |
65 |
41,280 |
-23,720 |
-0,094 |
|
|
12 |
29 |
53,518 |
24,518 |
-23,720 |
|
|
13 |
34 |
32,472 |
-1,528 |
24,518 |
|
|
14 |
66 |
97,607 |
31,607 |
-1,528 |
Сумма квадратов разности между остатками i i-12 = 15543,8776
Сумма квадратов остатков регрессии i 2 = 5860,259
Критерий Дарбина-Уотсона = 2,652
Воспользовавшись статистической таблицей Распределения Дарбина-Уотстона при уровне значимости б = 5%, определим критические точки dl и du для нашей модели, которая содержит 4 объясняющих переменных без учёта свободного члена k = 4 и для количества наблюдений n = 14.
dl = 0,632 и du = 2,030.
Коэффициент автокорреляции с
с<0 следовательно автокорреляция негативная.
10. Оценить наличие гетероскедастичности модели по первому фактору.
|
№ |
Годовая |
Собственные |
|
|
п/п |
прибыль |
средства, Х1, руб. |
|
|
|
(тыс. руб) |
|
|
|
№ |
Y |
Х1 |
|
|
6 |
45 |
2226 |
|
|
12 |
74 |
2248 |
|
|
2 |
29 |
2463 |
|
|
10 |
65 |
2635 |
|
|
5 |
42 |
2658 |
|
|
3 |
34 |
3265 |
|
|
1 |
92 |
3444 |
|
|
7 |
46 |
3654 |
|
|
13 |
82 |
4312 |
|
|
8 |
48 |
4526 |
|
|
4 |
38 |
5369 |
|
|
9 |
48 |
5671 |
|
|
11 |
66 |
7546 |
|
|
14 |
186 |
9723 |
|
Последняя часть |
||
|
0,026851 |
-99,1320877 |
|
|
0,007229 |
49,34057434 |
|
|
0,821406 |
30,08589437 |
|
|
13,79789 |
3 |
|
|
12489,32 |
2715,483119 |
|
Первая часть |
||
|
-0,01702678 |
92,64750412 |
|
|
0,050255405 |
123,2705521 |
|
|
0,036852835 |
20,63276634 |
|
|
0,114788797 |
3 |
|
|
48,86685889 |
1277,133141 |
|
Дисперсионная оценка |
||||||
|
|
ESS |
df |
MSR |
F |
б |
|
|
Первая часть |
1277,133141 |
3 |
16,28895 |
255,578467 |
0,0039 |
|
|
Последняя часть |
2715,483119 |
3 |
4163,106 |
|
|
Имеет место гетероскедастичность, т.к. уровень значимости по критерию Фишера менее 5% (0,39%). Тест Голфелда-Квандта показал, что с ростом значений собственных средств увеличивается дисперсия остатков, т.е. они уже не могут представлять собой случайные величины, а это есть нарушение второго условия Гаусса-Маркова.
11. Сравните модели простой и множественной регрессии.
Уравнение простой регрессии Y = 0,0214*X - 89,504
Уравнение множественной регрессии Y = 0,006917 * X1 + 0,014167 * X2 + 0,00144 * X3 - 0,00245 * X4 - 65,2964
Уравнение простой регрессии описывает зависимость результативного признака от наиболее тесно связанного с ним факторного признака. Уравнение множественной регрессии учитывает влияние всех 4-х факторных признаков. Модель множественной регрессии в данном случае является более точной, т.к. её коэффициент детерминации R2 = 0,715, а коэффициент детерминации простой регрессии равен R2 = 0,566. Следовательно, модель множественной регрессии обладает большей прогностической силой, чем модель парной регрессии. корреляционный регрессия детерминация прибыль
Задача 2 Данные таблицы увеличены на 50%, согласно варианту № 5.
|
День |
Цена акции, руб. |
||||
|
Фирма 1 |
Фирма 2 |
Фирма 3 |
Фирма 4 |
||
|
1 |
100,5 |
45 |
88,5 |
112,5 |
|
|
2 |
94,5 |
40,5 |
82,5 |
102 |
|
|
3 |
87 |
33 |
78 |
117 |
|
|
4 |
99 |
40,5 |
82,5 |
90 |
|
|
5 |
94,5 |
27 |
117 |
108 |
|
|
6 |
100,5 |
49,5 |
102 |
109,5 |
|
|
7 |
105 |
48 |
108 |
106,5 |
|
|
8 |
94,5 |
36 |
112,5 |
117 |
|
|
9 |
90 |
43,5 |
84 |
108 |
|
|
10 |
96 |
40,5 |
118,5 |
97,5 |
|
|
11 |
84 |
48 |
93 |
123 |
|
|
12 |
102 |
48 |
118,5 |
106,5 |
|
|
13 |
106,5 |
84 |
112,5 |
108 |
|
|
14 |
93 |
60 |
108 |
117 |
|
|
15 |
96 |
55,5 |
102 |
112,5 |
Требуется:
1. Проверить наличие аномальных наблюдений во временных рядах признаков (использовать графический и аналитический методы).
Найдём табличное значение критерия Ирвина для уровня значимости б = 5 %
лтабл. = = 1,4
Рассчитаем критерий Ирвина для каждого значения временного ряда Фирма1
|
Фирма 1 |
100,5 |
94,5 |
87 |
99 |
94,5 |
100,5 |
105 |
94,5 |
90 |
96 |
84 |
102 |
106,5 |
93 |
|
|
лрасч. |
0 |
0,95 |
1,19 |
1,91 |
0,72 |
0,95 |
0,72 |
1,67 |
0,72 |
0,95 |
1,91 |
2,86 |
0,72 |
2,15 |
Из графика и из таблицы видно, что во временном ряде Фирма 1 есть четыре аномальных наблюдения.
Рассчитаем критерий Ирвина для каждого значения временного ряда Фирма 2
|
Фирма 2 |
45 |
40,5 |
33 |
40,5 |
27 |
49,5 |
48 |
36 |
43,5 |
40,5 |
48 |
48 |
84 |
60 |
|
|
лi |
0 |
0,34 |
0,56 |
0,56 |
1,01 |
1,69 |
0,11 |
0,90 |
0,56 |
0,23 |
0,56 |
0,00 |
2,71 |
1,80 |
Во временном ряде Фирма 2 имеются 3 аномальных наблюдения.
Рассчитаем критерий Ирвина для каждого значения временного ряда Фирма3
|
Фирма 3 |
88,5 |
82,5 |
78 |
82,5 |
117 |
102 |
108 |
112,5 |
84 |
118,5 |
93 |
118,5 |
112,5 |
108 |
|
|
лi |
0 |
0,41 |
0,31 |
0,31 |
2,38 |
1,03 |
0,41 |
0,31 |
1,96 |
2,38 |
1,76 |
1,76 |
0,41 |
0,31 |
Рассчитаем критерий Ирвина для каждого значения временного ряда Фирма3
Во временном ряду Фирма 3 выявлено 5 аномальных наблюдений.
|
Фирма 4 |
112,5 |
102 |
117 |
90 |
108 |
109,5 |
106,5 |
117 |
108 |
97,5 |
123 |
106,5 |
108 |
117 |
|
|
лi |
0 |
1,26 |
1,80 |
3,24 |
2,16 |
0,18 |
0,36 |
1,26 |
1,08 |
1,26 |
3,06 |
1,98 |
0,18 |
1,08 |
Во временном ряду Фирма 4 выявлено 5 аномальных наблюдений.
2. Для каждого признака построить уравнение нелинейной регрессии за первые пять месяцев для следующих спецификаций: 1. экспоненциальную, 2. полиномиальную (квадратическую), 3. степенную.
В данных временных рядах 1 период равен 1 дню. Следовательно, чтобы построить уравнение нелинейной регрессии за первые пять месяцев, нужно сделать прогноз на 152 периода (дня).
Построим зависимости для временного ряда Фирма 2 с прогнозом на 5 месяцев (152 периода).
Построим зависимости для временного ряда Фирма 3 с прогнозом на 5 месяцев (152 периода).
Построим зависимости для временного ряда Фирма 4 с прогнозом на 5 месяцев (152 периода).
3. Для каждого признака оценить качество построенных моделей, используя коэффициент детерминации. Данные представить в таблице, указав на наиболее адекватную модель.
|
Уравнение |
Коэффициент детерминации R2 |
||
|
Фирма 1 |
y = 95,691e0,0004x |
RІ = 0,0008 |
|
|
y = 0,0202x2 - 0,2756x + 96,732 |
RІ = 0,0042 |
||
|
y = 96,187x-0,001 |
RІ = 0,0001 |
||
|
Фирма 2 |
y = 33,465e0,0372x |
RІ = 0,3948 |
|
|
y = 0,2332x2 - 1,8882x + 42,429 |
RІ = 0,4744 |
||
|
y = 33,626x0,1572 |
RІ = 0,2161 |
||
|
Фирма 3 |
y = 85,633e0,0187x |
RІ = 0,3189 |
|
|
y = -0,2436x2 + 5,6872x + 75,142 |
RІ = 0,3866 |
||
|
y = 80,639x0,1129 |
RІ = 0,3539 |
||
|
Фирма 4 |
y = 104,82e0,0045x |
RІ = 0,0665 |
|
|
y = 0,0678x2 - 0,6072x + 108,26 |
RІ = 0,0851 |
||
|
y = 105,33x0,0169 |
RІ = 0,0282 |
Для временного ряда Фирма 1 наиболее точной является полиномиальная зависимость y = 0,0202x2 - 0,2756x + 96,732, т.к. коэффициент детерминации наибольший, однако, модель не обладает достаточной прогностической силой, т.к. R2 < 0,5.
Для временного ряда Фирма 2 наиболее точной является полиномиальная модель y = 0,2332x2 - 1,8882x + 42,429, т.к. коэффициент детерминации наибольший RІ = 0,4744, но модель не обладает достаточной прогностической силой, т.к. R2< 0,5.
Для временного ряда Фирма 3 наиболее точной является полиномиальная модель y = -0,2436x2 + 5,6872x + 75,142, т.к. коэффициент детерминации наибольший RІ = 0,3866, но модель не обладает достаточной прогностической силой, т.к. R2< 0,5.