На основании представленных данных рассчитать средние арифметические, дисперсию, среднее квадратическое отклонение, коэффициент вариации переменных х и у; ковариацию и линейной коэффициент корреляции. Построить поле корреляции. Найти уравнение регрессии. Проверить значимость коэффициентов регрессии (б=5%). Рассчитать коэффициент детерминации. Сделать выводы.
Решение:
С экономической точки зрения именно прибыль зависит от всех прочих факторов. дисперсия вариация квадратический корреляция
Таблица 2.1 - Расчетная таблица
|
№ |
Вложения , x |
Прибыль, y |
||||
|
1 |
2,50 |
30,1 |
75,25 |
6,25 |
906,01 |
|
|
2 |
7,50 |
8,0 |
60,00 |
56,25 |
64,00 |
|
|
3 |
10,00 |
30,4 |
304,00 |
100,00 |
924,16 |
|
|
4 |
13,00 |
20,1 |
261,30 |
169,00 |
404,01 |
|
|
5 |
20,25 |
32,2 |
652,05 |
410,06 |
1036,84 |
|
|
6 |
11,25 |
33,3 |
374,63 |
126,56 |
1108,89 |
|
|
7 |
8,75 |
14,0 |
122,50 |
76,56 |
196,00 |
|
|
8 |
15,00 |
16,0 |
240,00 |
225,00 |
256,00 |
|
|
9 |
17,75 |
38,0 |
674,50 |
315,06 |
1444,00 |
|
|
10 |
8,25 |
15,0 |
123,75 |
68,06 |
225,00 |
|
|
11 |
20,50 |
43,2 |
885,60 |
420,25 |
1866,24 |
|
|
12 |
15,00 |
29,2 |
438,00 |
225,00 |
852,64 |
|
|
13 |
19,50 |
30,7 |
598,65 |
380,25 |
942,49 |
|
|
14 |
16,75 |
37,1 |
621,43 |
280,56 |
1376,41 |
|
|
15 |
15,75 |
31,0 |
488,25 |
248,06 |
961,00 |
|
|
16 |
8,50 |
24,9 |
211,65 |
72,25 |
620,01 |
|
|
17 |
12,50 |
28,5 |
356,25 |
156,25 |
812,25 |
|
|
18 |
13,75 |
38,2 |
525,25 |
189,06 |
1459,24 |
|
|
19 |
22,50 |
28,7 |
645,75 |
506,25 |
823,69 |
|
|
20 |
23,00 |
30,2 |
694,60 |
529,00 |
912,04 |
|
|
21 |
11,75 |
39,5 |
464,13 |
138,06 |
1560,25 |
|
|
22 |
16,75 |
35,9 |
601,33 |
280,56 |
1288,81 |
|
|
23 |
25,50 |
37,8 |
963,90 |
650,25 |
1428,84 |
|
|
24 |
27,50 |
46,0 |
1265,00 |
756,25 |
2116,00 |
|
|
25 |
20,00 |
38,0 |
760,00 |
400,00 |
1444,00 |
|
|
26 |
22,50 |
41,0 |
922,50 |
506,25 |
1681,00 |
|
|
27 |
21,25 |
47,0 |
998,75 |
451,56 |
2209,00 |
|
|
28 |
27,75 |
49,1 |
1362,53 |
770,06 |
2410,81 |
|
|
29 |
23,00 |
53,0 |
1219,00 |
529,00 |
2809,00 |
|
|
30 |
21,00 |
48,1 |
1010,10 |
441,00 |
2313,61 |
|
|
Сумма: |
499,00 |
994,20 |
17920,63 |
9482,75 |
36452,24 |
|
|
ср |
16,63 |
33,14 |
597,35 |
316,09 |
1215,07 |
Средняя величина:
; ;
;
;
Дисперсия:
;
Среднее квадратичное отклонение:
;
Ковариация показателей:
Коэффициент корреляции:
.
Коэффициент детерминации:
R2 = 0,67972 = 0,462
Вывод: Так как коэффициент корреляции находится в интервале от 0,5 до 0,7, то можно сказать, что между вложениями в рекламу и прибылью существует прямая заметная связь.
Уравнение прямой Y = a + b•x
Система нормальных уравнений выглядит следующим образом:
, откуда ;
Зная коэффициент корреляции, можно определить параметры уравнения регрессии по формулам:
;
Тогда ;
а = 33,14 - 1,17 • 16,63 = 13,6792
Таким образом, факторная модель будет выглядеть:
Y = 13,6792 + 1,17х.
Подставляя исходные данные вложений в рекламу в уравнение регрессии, получим теоретические данные, которые приведены на рисунке 5.
Рисунок 5 - Зависимость прибыли от вложений в рекламу
Значимость коэффициента регрессии осуществляется с помощью t -критерия Стьюдента (при n 30):
Для параметра а:
Для параметра b:
Параметр модели признается статистически значимым, если tр tкр (определяется по таблице Стьюдента при соответствующем числе степеней свободы и уровня значимости, число степеней свободы = n - k, где к - число параметров в уравнении регрессии; n - число единиц в совокупности).
При числе степеней свободы v = 30 - 2 = 28, уровне значимости 5%, tкр = 2,048. Это значит, что ta > tкр и tb > tкр, т.е. 6,70 > 2,048 и 3,60 > 2,048. Следовательно, оба параметра статистически значимы.
Расчетная величина t-критерия
распределена по закону Стьюдента с (п - 2) степенями свободы.
В нашем случае, tрасч > tкр, т.е. 4,9 > 2,048, значит, линейный коэффициент корреляции, равный 0,6797, признается существенным и связь межу вложениями в рекламу и прибылью предприятия существует.
ОБЩИЙ ВЫВОД:
Средняя величина вложений в рекламу составляет 16,63 млн. руб. При этом средняя величина прибыли составляет 33,14 млн. руб. Среднее отклонение от средней величины вложений в рекламу составляет 6,2788 млн. руб., от суммы прибыли - 10,8081 млн. руб. Ковариация между факторами показывает направление связи. Можно сделать вывод, что между вложениями в рекламу и суммой прибыли существует прямая связь. Анализируя рисунок 5, приходим к выводу, что связь между показателями прямая, при этом слабая или заметная (точки на рисунке находятся примерно в одной области, кучно, что говорит о наличии слабой связи). Рассчитанный коэффициент корреляции подтверждает данный вывод. Он составляет 0,6797 - это свидетельствует о заметной (но не тесной) связи между показателями. Коэффициент детерминации, равный 0,462, говорит о том, что на сумму прибыли вложения в рекламу оказывают влияние всего на 46,2%, остальные 53,8% - это влияние прочих неучтенных факторов.
Уравнение регрессии имеет вид: Y = 13,679 + 1,17х.
Анализируя коэффициенты регрессии и линейный коэффициент корреляции пришли к выводу, что они статистически значимы на уровне 95%. Т.к. значимы коэффициенты регрессии и коэффициент корреляции, то, следовательно, значимо и само уравнение регрессии. Следовательно, данное уравнение можно использовать для прогнозирования.
Задача 3
Имеются следующие данные об уровне механизации работ X(%) и производительности труда Y (т/ч) для однотипных предприятий (табл.):
Необходимо:
а) оценить тесноту и направление связи между переменными с помощью коэффициента корреляции;
б) найти уравнение регрессии Y по X
в) оценить среднюю производительность труда на предприятиях с уровнем механизации работ 60% и построить для нее 95%-ный доверительный интервал;
г) аналогичный доверительный интервал найти для индивидуальных значений производительности труда на тех же предприятиях.
|
х |
8 |
10 |
11 |
9 |
8 |
8 |
7 |
7 |
|
|
у |
7 |
8 |
10 |
7 |
7 |
6 |
6 |
5 |
Решение:
а) Составим корреляционное поле и сделаем предположение о тесноте и направлении связи.
Рисунок 3.1
Данные идут из нижнего левого угла в верхний правый угол, следовательно, связь между показателями прямая.
Рассчитаем необходимые данные в таблице.
Таблица 3.1 - Расчетная таблица
|
№ |
Уровень механизации работ (%) , x |
Производительность труда (т/ч), y |
Y |
е2 |
||||
|
1 |
8 |
7 |
56,0 |
64,0 |
49,0 |
6,50 |
0,25 |
|
|
2 |
10 |
8 |
80,0 |
100,0 |
64,0 |
8,50 |
0,25 |
|
|
3 |
11 |
10 |
110,0 |
121,0 |
100,0 |
9,50 |
0,25 |
|
|
4 |
9 |
7 |
63,0 |
81,0 |
49,0 |
7,50 |
0,25 |
|
|
5 |
8 |
7 |
56,0 |
64,0 |
49,0 |
6,50 |
0,25 |
|
|
6 |
8 |
6 |
48,0 |
64,0 |
36,0 |
6,50 |
0,25 |
|
|
7 |
7 |
6 |
42,0 |
49,0 |
36,0 |
5,50 |
0,25 |
|
|
8 |
7 |
5 |
35,0 |
49,0 |
25,0 |
5,50 |
0,25 |
|
|
Сумма: |
68,0 |
56,0 |
490,0 |
592,0 |
408,0 |
56,00 |
2,00 |
|
|
Средняя: |
8,50 |
7,00 |
61,25 |
74,00 |
51,00 |
Дисперсия:
;
Среднее квадратичное отклонение:
;
Ковариация показателей:
Коэффициент корреляции:
.
Коэффициент детерминации:
R2 = 0,93542 = 0,875
Так как коэффициент корреляции находится в интервале от 0,8 до 1,0, то можно сказать, что между механизацией работ и производительностью труда существует прямая тесная связь.
б) Уравнение прямой Y = a + b•x
Определим параметры уравнения регрессии:
;
Тогда ; а = 7,00 - 1 • 8,5 = - 1,5
Таким образом, факторная модель будет выглядеть: Y =х - 1,5
в) Подставляем х = 60 в уравнение:
Y (х = 60) = 60 - 1,5 = 58,5 (т/ч)
Остаточная дисперсия:
;
Ошибка прогноза составит:
Предельная ошибка прогноза:
?Y = tтабл • mY = 1,45 • 7,97 = 19,50
Доверительный интервал прогноза:
т/ч.; т/ч
г) для нахождения доверительного интервала по индивидуальным значениям составим таблицу/
Таблица 3.2 - Доверительный интервал
|
№ |
х |
Y |
mY |
t • mY |
Y - tmY |
Y + tmY |
||
|
1 |
8 |
6,50 |
1,14 |
0,6172 |
1,51 |
4,99 |
8,01 |
|
|
2 |
10 |
8,50 |
1,29 |
0,6547 |
1,60 |
6,90 |
10,10 |
|
|
3 |
11 |
9,50 |
1,57 |
0,7237 |
1,77 |
7,73 |
11,27 |
|
|
4 |
9 |
7,50 |
1,14 |
0,6172 |
1,51 |
5,99 |
9,01 |
|
|
5 |
8 |
6,50 |
1,14 |
0,6172 |
1,51 |
4,99 |
8,01 |
|
|
6 |
8 |
6,50 |
1,14 |
0,6172 |
1,51 |
4,99 |
8,01 |
|
|
7 |
7 |
5,50 |
1,29 |
0,6547 |
1,60 |
3,90 |
7,10 |
|
|
8 |
7 |
5,50 |
1,29 |
0,6547 |
1,60 |
3,90 |
7,10 |
Изобразим данные на рисунке 3.2.
Имеются следующие данные о выработке литья на одного работающего Х1(T), браке литья Х2 (%) и себестоимости 1 т литья Y (руб.) по литейным цехам заводов (табл.):
Необходимо:
а) найти уравнение множественной регрессии Y по X1 и X2,
б) оценить значимость этого уравнения и его коэффициентов на уровне б = 0,05;
Рисунок 3.2
Задача 4
в) сравнить раздельное влияние на зависимую переменную каждой из объясняющих переменных, используя стандартизованные коэффициенты регрессии и коэффициенты эластичности;
г) найти 95%-ные доверительные интервалы для коэффициентов множественной регрессии, а также для среднего и индивидуальных значений себестоимости 1 т литья в цехах, в которых выработка литья на одного работающего составляет 40 т, а брак литья - 5%.
|
Х1 |
7 |
7 |
10 |
9 |
9 |
8 |
5 |
6 |
|
|
Х2 |
8 |
10 |
11 |
9 |
8 |
8 |
7 |
7 |
|
|
Y |
7 |
8 |
10 |
7 |
7 |
6 |
6 |
5 |
Таблица 4.1 Расчетная таблица
|
№ |
Y |
е2 |
||||||||||
|
1 |
7 |
7 |
8 |
49 |
56 |
56 |
49 |
64 |
49 |
6,47 |
0,2835 |
|
|
2 |
8 |
7 |
10 |
56 |
80 |
70 |
49 |
100 |
64 |
6,58 |
2,0113 |
|
|
3 |
10 |
10 |
11 |
100 |
110 |
110 |
100 |
121 |
100 |
9,06 |
0,8881 |
|
|
4 |
7 |
9 |
9 |
63 |
63 |
81 |
81 |
81 |
49 |
8,14 |
1,2931 |
|
|
5 |
7 |
9 |
8 |
63 |
56 |
72 |
81 |
64 |
49 |
8,08 |
1,1664 |
|
|
6 |
6 |
8 |
8 |
48 |
48 |
64 |
64 |
64 |
36 |
7,27 |
1,6225 |
|
|
7 |
6 |
5 |
7 |
30 |
42 |
35 |
25 |
49 |
36 |
4,80 |
1,4449 |
|
|
8 |
5 |
6 |
7 |
30 |
35 |
42 |
36 |
49 |
25 |
5,60 |
0,3650 |
|
|
? |
56 |
61 |
68 |
439 |
490 |
530 |
485 |
592 |
408 |
56 |
9,0749 |
|
|
Ср: |
7,0 |
7,625 |
8,5 |
54,875 |
61,25 |
66,25 |
60,625 |
74,0 |
51,0 |
6,47 |