Материал: Сравнительный анализ эконометрических моделей регрессии

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Все построенные модели подтверждают, что величина заработной платы наемных рабочих является фактором увеличения числа прибывших в страну на постоянное место жительства. Коэффициент эластичности показывает, что годовая заработная плата наемных рабочих в больше степени влияет на число прибывших в страну на постоянное место жительства при линейной и квадратичной зависимостях. В меньшей степени данная связь прослеживается в кубической зависимости.

Находится коэффициент детерминации.

Линейная зависимость   

Уравнением регрессии объясняется 25% дисперсии результативного признака, а на долю остальных факторов приходится 75% ее дисперсии.

Модель линейной зависимости плохо аппроксимирует исходные данные.

Показательная зависимость =

Зависимость между показателями такая же слабая, как и в линейной модели. Вариация у всего на 20% объясняется вариацией х, а на долю остальных факторов приходится 80%. Связь в данной модели самая слабая. Поэтому качество модели неудовлетворительное.

Квадратичная зависимость

Зависимость между показателями немного лучше, чем в показательной и линейной моделях. Вариация у только на 40% объясняется вариацией х. Данную модель также не желательно использовать для прогнозирования.

Кубическая зависимость

Зависимость между показателями лучше, чем в предыдущих моделях. Вариация у на 52% объясняется вариацией х.

Значения коэффициентов детерминации представлены в Таблице 6.

Таблица 6. Расчет параметров и характеристик моделей.


Качество построенных моделей низкое, самая высокая оценка качества у модели с кубической зависимостью, так как доля объясненной вариации составила 52%.

Линейная модель =1153,261%

В среднем расчетные значения отклоняются от фактических на 1153,261%, что говорит об очень большой ошибке аппроксимации.

Показательная зависимость =396,93259

Ошибка аппроксимации несколько ниже, чем у остальных моделей, но также является недопустимой.

Квадратичная зависимость =656,415018

Наблюдается высокая ошибка аппроксимации, что свидетельствует о низком качестве подгонки уравнения

Кубическая зависимость =409,3804652

Ошибка аппроксимация также значительно превышает допустимые значения. Во всех рассмотренных моделях средняя ошибка аппроксимации значительно превышает допустимые значения, качество подгонки моделей к исходным данным очень низкое.

. Проводится построение и анализ множественной регрессии.

Исходные данные для построения множественной регрессии приведены в Таблице 7.

Таблица 7. Исходные данные для построения множественной регрессии

число прибывших в страну на постоянное место жительства, тыс. чел:- номинальная годовая заработная плата наемных работников, тыс. евро. - число безработных, тыс. чел.- ВВП, млрд. евро.

Оценки параметров уравнения регрессии:

Уравнение множественной регрессии:

Средние коэффициенты эластичности.

= 0,12026241 = -0,06319176 = 0,86930458

Расчет данных значений приведен в Таблице 8.

С увеличением величины годовой заработной платы наемных рабочих на 1% от среднего уровня при неизменных показателях остальных факторов, число прибывших на постоянное место жительства увеличивается на 0,12%.

С увеличением численности безработных на 1% от среднего при неизменных показателях остальных факторов, число прибывших на постоянное место жительства уменьшается на 0,06%

С увеличением величины ВВП на 1% от среднего при неизменных показателях остальных факторов, число прибывших на постоянное место жительства увеличивается на 0,87%

Изменение числа прибывших в страну на постоянное место жительства находится в прямой зависимости от годовой заработной платы наемных рабочих и величины уровня ВВП страны и в обратной зависимости от численности безработных, что не противоречит и логическим предположениям. Коэффициенты эластичности, как показатели силы связи, показывают, что наибольшее изменение числа прибывших в страну вызывает величина ВВП, а наименьшее - численность безработных.

Рассчитывается коэффициент множественной корреляции:

 

Значение индекса множественной корреляции лежит в пределах от 0 до 1.

Рассчитывается средняя ошибка аппроксимации:

 = 372,353247%

Значение средней ошибки аппроксимации свидетельствует о плохой подгонке модели под исходные данные.

Таблица 8. Расчет значений характеристик модели множественной регрессии


Совместное влияние всех факторов на число прибывших в страну на постоянное место жительства достаточно велико. Связь между рассматриваемым показателем и влияющими на него факторами усилилась по сравнению с парной регрессией (ryx=0.506). Наблюдается довольно сильная связь.

Необходимо учитывать, что в модели наблюдается небольшая мультиколлинеарность, что может свидетельствовать о ее неустойчивости, поскольку определитель матрицы межфакторной корреляции достаточно далек от 1. Максимальный коэффициент парной корреляции наблюдается между факторами x1 и x3 (rx1x3=0.595), что вполне объясняемо, т.к. среднегодовая заработная плата в стране должна находиться в прямой зависимости от ВВП страны.

Расчет оценок дисперсий ошибок и дисперсий параметров модели:= 20 - количество наблюдений, m=4 - количество параметров.

Для построенной модели оценка дисперсии ошибок составила:

=6674,02207

Оценки дисперсий параметров модели:

Стандартные ошибки параметров модели:


Оценка значимости коэффициентов регрессии с помощью t-критерия Стьюдента.

,

,


Значения , , <, значит коэффициенты  являются статистически незначимыми и случайно отличаются от 0.

 >, значит является статистически значимым

Для построенной модели доверительные интервалы коэффициентов регрессии:


Все полученные коэффициенты регрессии, кроме , статистически незначимы, доверительные интервал для них достаточно большой, что может свидетельствовать о недостаточном качестве модели.

Коэффициент множественной детерминации для построенной модели


Данный коэффициент детерминации показывает, что качество модели удовлетворительное.

С добавлением еще одной переменной  обычно увеличивается. Для того чтобы не допускать возможного преувеличения тесноты связи и применяется скорректированный коэффициент детерминации. При заданном объеме наблюдений при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. Для построенной модели значения скорректированного и нескорректированного коэффициента детерминации не значительно отличаются друг от друга, но т.к. скорректированный коэффициент детерминации немного уменьшился можно предположить, что увеличение доли объясненной регрессии при добавлении новой переменной незначительно, и что добавлять переменную нецелесообразно.

Оценка значимости уравнения регрессии с помощью F-критерия Фишера.

= F (0.05,m-1,n-m)= F(0.05,1,18)= 4,413873

Линейная модель =6,150512218

Показательная зависимость =4,6394274

Квадратичная зависимость =11,6775003

Кубическая зависимость =19,25548322

Во всех рассмотренных моделях <, гипотеза  отвергается.

Значимость уравнения множественной регрессии в целом с помощью F-критерия Фишера:


Так как Fтабл< Fфакт то  не принимается

. В результате проведенного исследования можно сделать следующее заключение: Все полученные уравнения регрессии значимы. По результатам F-теста и показателям коэффициента детерминации и средней ошибки аппроксимации можно сделать вывод, что среди рассмотренных моделей парной регрессии нет модели с хорошим качеством, которую можно было бы применять с целью прогнозирования. Однако, наилучшей моделью, описывающей взаимосвязь между годовой з/п наемных рабочих страны и числом прибывших в страну на постоянное место жительства, является модель с кубической зависимостью, поскольку она является значимой, коэффициент детерминации принимает наибольшее значение и средняя ошибка аппроксимации не так велика по сравнению с другими моделями, хотя и не принимает допустимого значения.

Все четыре модели парной регрессии являются статистически значимыми, однако достаточно малые значения коэффициента детерминации, большие ошибки средней аппроксимации свидетельствуют о плохом качестве данных моделей.

Сравнив параметры и характеристики данных уравнений, делается вывод, что наибольшей надежность и точностью обладает модель с кубической зависимостью. Об этом свидетельствуют наибольшее значение индекса корреляции и соответственно коэффициент детерминации, наиболее близкий к 1 и подтверждающий лучшее качество модели с точки зрения аппроксимации данных, результаты F-теста, признавшие модель значимой, а также средняя ошибка аппроксимации, меньшая, чем у других моделей. Стандартные ошибки параметров регрессии и стандартная ошибка прогноза для этой модели также принимают меньшие значения.

Уравнение множественной регрессии значимо, т.е. отвергается гипотеза о случайной природе оцениваемых характеристик. Полученная модель статистически надежна.

ЗАКЛЮЧЕНИЕ

В результате эконометрического исследования и анализа данных было рассмотрено четыре уравнения парной регрессии, устанавливающих зависимость между среднегодовой заработной платой наемных рабочих в стране и количеством людей, прибывших в страну на постоянное место жительство. Это линейная модель, показательная, модели с квадратичной и кубической зависимостью. Все построенные модели подтверждают, что рост величины заработной платы наемных рабочих, является фактором увеличения числа прибывших в страну на постоянное место жительства.

Самый высокий показатель тесноты связи переменных в модели с кубической зависимостью, т.к. коэффициент детерминации в кубической модели принимает наибольшее значение, что говорит о наибольшей надежности найденного уравнения регрессии. Модель в виде кубической зависимости наилучшим образом описывает взаимосвязь числа прибывших в страну на постоянное место жительства и годовой заработной платы наемных рабочих. Во всех рассмотренных моделях средняя ошибка аппроксимации значительно превышает допустимые значения, что говорит о низком качестве подгонки моделей. Однако модель с кубической зависимостью является лучшей с точки зрения аппроксимации данных и оценки тесноты связи, поскольку имеет наибольшую по сравнению с другими моделями долю объясненной вариации - 52% (коэффициент детерминации наиболее близок к 1).

Не достаточно хорошие характеристики модели могут быть вызваны наличием в исходных данных единиц с аномальными значениями исследуемых признаков: в Великобритании число прибывших на постоянное место жительства значительно превышает данный показатель для других стран. Возможно, для получения более точного и надежного результата данную страну следует исключить из выборки.

В результате построения множественной регрессии исследовано влияние на число прибывших в страну на постоянное место жительства таких факторов, как ВВП страны, численность безработных и средняя годовая заработная плата наемных рабочих.

Изменение числа прибывших в страну на постоянное место жительства находится в прямой зависимости от годовой заработной платы наемных рабочих и величины уровня ВВП страны и в обратной зависимости от численности безработных. Наибольшее изменение числа прибывших в страну вызывает величина ВВП, а наименьшее - численность безработных.

Совместное влияние всех факторов на число прибывших в страну на постоянное место жительства достаточно велико, поскольку индекс множественной корреляции принимает высокое значение. Однако это может объясняться наличием мультиколлинеарности.

Все полученные коэффициенты уравнения множественной регрессии кроме коэффициента при факторе уровень ВВП статистически незначимы, доверительные интервал для них достаточно большой.

Не смотря на это, коэффициент детерминации показывает, что качество модели удовлетворительное. Уравнение множественной регрессии значимо, т.е. отвергается гипотеза о случайной природе оцениваемых характеристик.

Однако в модели может наблюдаться гетероскедастичность, т.е. возможно необходима коррекция модели.

Данные результаты можно объяснить достаточно малым объемом выборки, в особенности с учетом глобальности исследования, наличием аномального значения исследуемого признака, не учтенностью каких-либо существенных факторов, а также тем, что число эмигрантов в страну зависит от большого числа не количественных, личных факторов, индивидуальных предпочтений.

Не смотря на отсутствие точного результата и качественного уравнения регрессии, пригодного для прогнозирования и дальнейших исследований, в ходе исследования удалось выявить, что заработная плата наемных рабочих в стране, уровень безработицы и ВВП оказывают немаловажное влияние на число прибывших в страну на постоянное место жительства.