Материал: 1843

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

2.ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ

ВЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ

2.1.Парная регрессия и корреляция

(мультимедиа 2)

Экономические данные представляют собой количественные характеристики каких-либо экономических объектов или процессов. Они формируются под действ ем множества факторов, не все из которых доступ-

ны внешнему контролю. Неконтролируемые факторы могут принимать

случайные значен я з некоторого множества значений и тем самым обу-

словливать случайность данных, которые они определяют. Стохастиче-

С

ская (вероятностная) пр рода экономических данных создает необходи-

мость пр менен я соответствующих статистических методов для их обра-

ботки анал за.

 

При зучен

конкретных зависимостей одни признаки выступают в

качестве факторов,

о условливающих изменение других признаков. При-

и

знаки этой первой группы называются признаками-факторами (фактор-

ными пр знаками), а пр знаки, которые являются результатом влияния

этих факторов – результативными.

Регрессией в теории вероятностей и математической статистике

принято называть зависимость среднего значения какой-либо величины

(y) от некоторой другой величины или от нескольких величин (х). В зави-

симости от количества факторов, включенных в уравнение регрессии,

принято различатьбАпростую (парную) и множественную регрессию.

 

Парной регрессией называется модель, выражающая зависимость

среднего значения зависимой переменной y от одной независимой пере-

менной х:

И

 

=

 

Д( );

(1)

 

 

 

где у

зависимая переменная (результативный признак);

 

х

независимая, объясняющая переменная (признак-фактор).

 

Практически в каждом отдельном случае величина y складывается из

двух слагаемых

 

 

 

= + или = + ∙ + ,

(2)

 

 

 

где y

– фактическое значение результативного признака;

 

 

– теоретическое значение результативного признака, найденное ис-

ходя из уравнения регрессии;

 

 

16

– случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.

Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности наблюдений [1].

Случайная величина включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Её присутствие в модели порождено тремя источниками: спецификацией модели, выборочным характером сходных данных, особенностями измерения переменных.

От прав льно выбранной спецификации модели зависит величина

случайных ош бок:

тем меньше, чем в большей мере теоретические

значения результат вного признака

подходят к фактическим данным y.

К ош

бкам

спец ф кации относится неправильный выбор той или

иной математ ческой функции для

и недоучет в уравнении регрессии

какогоони-л бо существенного фактора, т.е. использование парной регрессии

вместо множественной.

 

Наряду с ош

ками спецификации могут быть ошибки выборки, ко-

торые имеют место в силуАнеоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупностиДединицы с аномальными значениями исследуемых признаков.

Использование временной информации также представляет собой выборку из всего множества хронологических дат. зменив временной интервал, можно получить другие результаты регрессии.

рессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки, – увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками.

Наибольшую опасность в практическом использованииИметодов рег-

По виду аналитической зависимости различают линейные и нелинейные регрессии.

Линейная регрессия описывается уравнением

= + ∙ + .

17

Примеры наиболее часто используемых уравнений нелинейной регрессии:

 

полиномы разных степеней

=

+

 

+

,+

+

+ ,

 

равносторонняя гипербола

 

 

 

степенная

 

[4].

=

+

 

 

 

 

Линейная

регрессия чаще других используется в эконометрических

 

=

 

 

 

 

 

 

 

 

исследованиях из-за простоты расчёта параметров и возможности четкой экономической интерпретации коэффициента регрессии. Параболическая регрессия пр меняется для описания процессов с монотонным развитием

и отсутств ем пределов роста. На практике такая зависимость может

Гипербол

иметь место в течен

некоторого непродолжительного периода.

Сческую регрессию применяют для изучения зависимости

удельных расходов сырья, материалов, топлива от объема выпускаемой

продукц , времени

ращения товаров от величины товарооборота, про-

бА

цента пр роста зара отной платы от уровня безработицы (кривая Филипса), расходов на непродовольственные товары от доходов или общей суммы расходов (кр вые Энгеля).

Полулогар фм ческая и показательная модели регрессии применяются при изучении процессов, которые имеют предел роста результативного показателя, например в демографии.

Степенная регрессия также используется довольно часто, т.к. кривые спроса и предложения, производственные функции (функция КоббаДугласа) являются степенными функциями.

Для выбора вида аналитической зависимости можно использовать

следующие методы:

Д

 

графический;

 

аналитический;

 

экспериментальный [1].

При изучении зависимости между двумяИпризнаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции. Значительный интерес представляет аналитический метод выбора типа уравнения регрессии, созданный на изучении материальной природы связи исследуемых признаков. В случае анализа информации, основанном на использовании программных продуктов, вид уравнения регрессии выбирается экспериментальным методом. Экспериментальный метод основан на построении нескольких моделей различного вида с выбором наилучшей согласно применяемому критерию качества.

Линейная регрессия сводится к нахождению уравнения вида

= + ∙ или = + ∙ + .

18

Уравнение вида

 

 

 

 

позволяет по заданным

значениям

фактора х находить

теоретические значения результативного признака,

 

=

+

 

 

 

подставляя в него фактическое значение фактора х.

 

Классическим подходом для оценки параметров является метод

наименьших квадратов:

a=

,

 

(3)

 

 

 

 

 

 

 

 

=

̅

(4)

 

 

 

 

 

̅.

 

Параметр b называется коэффициентом корреляции, его величина

значение

 

 

 

 

показывает среднее

 

зменение результата с изменением фактора х на одну

Сединицу.

 

 

 

y при х=0. Если признак-фактор x не может

Значен е a

 

 

 

иметь нулевого значен я, то указанная трактовка свободного члена a не

бА

 

имеет смысла, т.е. параметр a

может не иметь экономического содержания.

Уравнен е регресс

всегда дополняется показателем тесноты связи.

При использован

л нейной регрессии в качестве такого показателя вы-

ступает л нейный коэфф циент корреляции, который можно рассчитать

по следующим формулам:

=

 

 

 

 

(5)

 

 

 

 

;

 

 

 

 

 

 

Д

где x – среднее значение переменной x (выборочное среднее);

y – среднее значение переменной y (выборочное среднее);

x y– среднее значение произведений;

 

 

 

 

 

 

 

 

 

 

х и y – выборочные средние квадратичные отклонения перемен-

ных х и y:

 

 

 

 

 

И

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

-

 

2 .

 

 

x

x2

 

x2

-

 

; y y2

 

 

y2

 

(6)

x

 

 

y

 

Коэффициент корреляции изменяется в диапазоне от

 

. Чем

ближе абсолютное значение

к единице,

тем

сильнее линейная связь

 

 

 

 

−1 ≤

≤ 1

между факторами.

Качественно оценить тесноту линейной корреляционной связи между x и y можно с помощью таблицы Чеддока (табл. 1).

19

Таблица 1

Качественная оценка тесноты линейной корреляционной связи

 

Диапазон изменения

 

Характер тесноты связи

 

0,1–0,3

 

 

 

слабая

 

0,3–0,5

 

 

 

умеренная

 

0,5–0,9

 

 

 

высокая

 

0,9–0,99

 

 

 

очень высокая

 

Для оценки качества подбора линейного уравнения регрессии ис-

 

пользуют коэфф ц ент детерминации(

.):

(7)

С

= (

)

 

 

 

Коэфф ц ент детерминации характеризует долю дисперсии резуль-

 

пр знака, о ъясненную с помощью уравнения регрессии. Зна-

 

чение коэфф ц ента

зменяются

от

нуля

до единицы: в пределах

 

 

[1, 4].

 

 

 

 

 

 

 

 

 

 

 

 

тативного

 

 

 

 

 

 

 

 

 

 

 

Проверка знач мости уравнения линейной регрессии предполагает

0 ≤ ≤ 1

 

 

 

 

 

 

 

 

 

 

 

 

 

оценку знач мости как уравнения в целом, так и отдельных его парамет-

ров.

Оценка значимости уравнения регрессии в целом осуществляется с

 

помощью F-критерия Фишера.

 

 

 

 

 

 

 

 

 

 

 

F-критерий Фишера рассчитывается по формуле

 

 

 

 

 

 

 

 

 

 

 

 

факт

 

 

 

 

 

 

бА= ост

,

 

 

(8)

где F-критерий для проверки нулевой гипотезы

факт =

ост;

факт

– фак-

торная дисперсия

 

 

 

 

 

 

 

 

 

 

 

 

=

∑(

Д

 

 

 

факт

)

,

 

 

 

 

 

(9)

ост – остаточная дисперсия

 

 

 

 

 

И(10)

 

 

ост =

∑(

)

.

 

 

Рассчитанное значение F- отношений признается достоверным, если оно больше табличного, т.е связь между признаками существенна: факт > табл. Если факт < табл, то уравнение регрессии считается статистически незначимым.

20