МИНОБРНАУКИ РОССИИ
Федеральное государственное бюджетное образовательное учреждение высшего образования
«Тульский государственный университет»
Кафедра «Вычислительная техника»
Практикум по теории статистики и многомерному статанализу
КОНТРОЛЬНО-КУРСОВАЯ РАБОТА
Регрессионный анализ
Выполнили:
студент гр.220931
Царёва А. Д.
Проверил:
проф. кафедры ВТ
Фатуев В. А.
Тула 2016
Цель работы
Изучение и приобретение навыков построения регрессионных моделей.
Задание на работу
Решить следующие задачи (в соответствии с вариантом):
1) Построить ковариационную и корреляционную матрицу (количество строк и столбцов равно числу переменных, на пересечении - коэффициент ковариации или корреляции соответственно).
2) Построить уравнение линейной регрессии, которое определяет зависимость эндогенной переменной (зависимая переменная) от других факторов (экзогенных). Зависимую и независимые переменные определить самостоятельно на основе построенной корреляционной матрицы.
3) Провести статистический анализ построенной регрессии, определив значимость модели, параметров модели, и адекватность модели на основе критерия Фишера. В случае отсутствия значимости модели и ее параметров перестроить модель.
4) Определить влияние независимых переменных на зависимую на основе коэффициента эластичности и дельта-коэффициентов.
Сделать выводы по каждому пункту.
Данные варианта 2
Результаты выборочного исследования предприятий представлены в таблице 1.
Таблица 1
|
№ предприятия |
Объем продукции, млн руб. |
Среднегодовая стоимость основных средств, млн руб. |
Среднесписочное число работников, чел. |
Прибыль, тыс. руб. |
|
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
197,7 592,0 465,5 296,2 584,1 480,0 578,5 204,7 466,8 292,2 423,1 192,6 360,5 208,3 |
10,0 22,8 18,4 12,6 22,0 19,0 21,6 9,4 19,4 13,6 17,6 8,8 14,0 10,2 |
900 1500 1412 1200 1485 1420 1390 817 1375 1200 1365 850 1290 900 |
13,5 136,2 97,6 44,4 146,0 110,4 138,7 30,6 111,8 49,6 105,8 30,7 64,8 33,3 |
|
|
15 16 17 18 19 20 21 22 23 24 25 |
190,7 502,0 460,0 301,3 564,5 484,4 571,1 264,7 467,3 290,2 403,4 |
10,0 20,0 16,8 12,6 22,5 19,5 20,5 8,4 18,9 13,1 17,1 |
920 1000 1215 1202 1480 1410 1400 825 1361 1200 1333 |
15,5 100,2 97,0 44,4 145,0 105,4 118,7 30,1 111,1 45,5 108,5 |
Ход работы
Задание 1
Построим ковариационнцю матрица по таблице 1 при помощи инструментов Microsoft Excel. Для этого используем функцию КОРРЕЛЯЦИЯ(), в которой укажем наш диапазон данных таблицы. Получим следующую матрицу (рисунок 1):
Рисунок 1 - Ковариационная матрица
Вывод: на основе полученной матрицы можно сказать, что все значения не являются нелинейыми между собой, т.к. все коэффициенты ковариации не равны 0.
Построим корреляционную матрицу при помощи функции КОРРЕЛЯЦИЯ() (рисунок 2).
Рисунок 2 - Корреляционная матрица
Вывод: на основе полученной матрицы можно сказать, что все пункты, по которым выделяется зависимость по предприятиям, обладают практически абсолютной линейной зависимость. Однако число работников не имеет абсолютную линейную зависимость по сравнению с остальными показателями, но оно очень близко к линейной ( коэффициенты 0,85; 0,86; 0,88).
Задание 2
Зависимая переменная в данной задаче - объём продукции в млн.руб. Соответственно все остальные переменные являются независимыми. В данной задаче уравнение линейной регрессии будет иметь вид:
При помощи функции РЕГРЕССИЯ() получим регрессионную статистику, в которой будут посчитаны коэффициенты уравнения регрессии (рисунок 3).
Рисунок 3 - Регрессионная статистика
В колонке Coefficients подсчитаны все коэффициенты. Таким образом линейное уравнение регресси принимает следующий вид:
Вывод: имея линейную зависимоть между переменными и рассчитанными коэффициентами получаем уравнение регрессии линейного вида.
Задание 3
Критерий Фишера из рисунка 3 равен 208,99. По числу степеней свободы ( 3 и 21) определим по таблице F-распределения (рисунок 4), что Fкр= 5,18. Критерий Фишера также рассчитывается по формуле .
Рисунок 4 - Таблица F-распределения
Вывод: F >Fкр. Модель является статически значима.
Наиболее эффективной оценкой адекватности регрессионной модели является коэффициент детерминации = 0.97. При этом коффициент детерминации рассчитывается по формуле :, , определяемая при помощий дисперсий остатков.
Если коэффициент детерминации равен 1, то имеет место полная корреляция с моделью, т. е. различий между фактическим и оценочным значениями y нет. В противоположном случае, если коэффициент детерминации равен 0, использовать уравнение регрессии для предсказания значений y не имеет смысла.
Вывод: на основе коэффициента детерминации можно сказать, что модель является адекватной.
Задание 4
Дельта-коэффициенты определяют долю вклада каждого фактора в суммарное влияние на вход. Рассчитываются по формуле
где - оценки соответмствующих регрессионных коэффициентов, ; - коэффициент детерминации. Используя Microsoft Excel, получим,
Вывод: как видно из полученных результатов наблюдается случай мультиколлинеарности при втором коэффициенте, так как он отрицателен. Однако можно сказать, что третий фактор, а именно прибыль определяется объёмом продукции.
Рассчитаем коэффициены эластичности. Формула коэффициента эластичности для линейной регрессионной модели имеет вид:
таким образом получим,
регрессия модель статистический
Вывод: увеличение среднегодовой стоимости на 1% повлечет за собой увеличение объёма продукции на 0,76%; увеличение числа работников на 1% приведёт к уменьшению объёма продукции на 0,102%; а увеличение прибыли на 1% приведёт к увеличению объёма продукции на 0,259%.