Скорректированный коэффициент корреляции |
|
|
|
||||||||||
где n – число наблюдений; |
= |
1− |
∑(∑( |
)) |
: |
|
|
, |
(40) |
||||
|
|
||||||||||||
m –число параметров при переменных x. |
|
|
|
|
|
||||||||
Поскольку |
∑( |
) |
|
|
, то скорректированный коэффициент ко- |
||||||||
|
записать в виде [1, 5, 6]: |
|
|
|
|
|
|
||||||
реляции можно∑( |
) |
= 1 − |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
(41) |
С= 1 −(1 − ) ∙ |
|
−1 |
|
, |
|||||||||
|
|
|
|||||||||||
− −1 |
|
||||||||||||
а скоррект рованный коэффициент множественной детерминации |
|||||||||||||
и |
|
−1 |
|
|
(42) |
||||||||
|
|
|
= 1 −(1 − ) ∙ |
|
|
|
|
. |
|
|
|||
Частные коэфф ц енты |
|
|
|
характеризуют |
тесноту связи |
||||||||
корреляции− |
|
−1 |
|
|
|
||||||||
между соответствующим фактором и результатом при устранении влияния других факторов, включенных в модель множественной регрессии.
Коэффициент частной корреляции для двухфакторной модели: |
|
|||||||||
б∙ = |
А, |
(43) |
||||||||
(44) |
||||||||||
∙ |
= |
|
|
|
− |
|
|
|
|
|
|
|
|
Д. |
|
||||||
|
|
|
|
|
|
|
|
|
И |
|
Если выразить остаточную дисперсию через коэффициент детерминации, |
||||||||||
частный коэффициент корреляции рассчитывается по формуле |
|
|||||||||
|
= |
1 − |
1 − |
; |
|
(45) |
||||
∙ |
|
1 − |
|
|
||||||
|
= |
|
1− |
1− |
|
. |
|
|
||
∙ |
|
1− |
|
|
|
|||||
31
При дополнительном включении факторов xi в модель частный коэффициент корреляции рассчитывается по формуле
С |
∙ |
|
|
= |
|
1− |
|
|
|
|
, |
|
(46) |
|||
|
|
|
|
|
|
|||||||||||
|
|
|
– множественный коэффициент детермина- |
|||||||||||||
где |
, |
|
|
|
||||||||||||
ции для модели множественной регрессии со всем количеством факторов |
||||||||||||||||
и с р-1 в модель не введенного фактора. |
|
∙ |
. |
(47) |
||||||||||||
|
корреляции∙ |
|
|
|
|
|
∙ |
|
||||||||
|
Значен я частных коэффициентов корреляции, рассчитанных дан- |
|||||||||||||||
ным способом, зменяются от нуля до единицы. |
|
|
|
|
||||||||||||
|
Коэфф ц енты |
|
|
|
|
олее высоких порядков рассчитывают- |
||||||||||
ся по рекуррентной формуле, значения которых изменяются [3]: |
|
|||||||||||||||
|
бА |
|
|
|
||||||||||||
|
∙ |
= |
|
|
|
∙ |
|
|
|
|
∙( |
|
) |
|
|
|
|
Коэффициенты корреляции, |
рассчитанные по данной формуле, |
из- |
|||||||||||||
меняют свое значение от – 1 до 1. |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
Частные коэффициенты корреляции используются для ранжирова- |
|||||||||||||||
ния факторов по степени влияния на результат, но и их отбора [1, 10]. |
|
|||||||||||||||
|
|
|
|
|
|
Д |
|
|||||||||
|
3.4. Оценка надежности результатов множественной регрессии |
|
||||||||||||||
|
|
|
|
и корреляции |
|
|
|
|
|
|||||||
|
Оценка значимости уравнения регрессии осуществляется с помощью |
|||||||||||||||
критерия Фишера |
= |
|
|
= |
|
|
∙ |
|
|
, |
|
|
|
|||
|
|
|
факт |
|
|
|
|
|
|
(48) |
||||||
|
|
|
ост |
|
|
|
|
|
|
|||||||
где |
факт – факторная дисперсия, объясненная регрессией на одну степень |
|||||||||||||||
свободы; |
|
|
|
|
|
|
|
|
|
|
И |
|||||
ост – остаточная дисперсия на одну степень свободы;
– множественный коэффициент детерминации; −число наблюдений;
– число параметров при факторах х в уравнении регрессии.
Полученное значение F-критерия сравнивается с табличным при определенном уровне значимости. Если его фактическое значение больше
32
табличного, гипотеза о незначимости уравнения регрессии отвергается и принимается гипотеза о статистической значимости. С помощью критерия Фишера оценивается значимость не только уравнения регрессии в целом, но и значимость дополнительного включения в модель каждого фактора.
|
Для оценки значимости включения дополнительного фактора |
в мо- |
||||||||||||||||
дель рассчитывается частный коэффициент критерий Фишера: |
|
|||||||||||||||||
С |
|
− |
|
|
|
|
|
|
|
|
− |
|
− 1 |
|
|
|||
|
= |
|
1− |
|
|
|
|
|
|
∙ |
|
1 |
, |
(49) |
||||
|
|
|
|
|
|
|
|
|
|
|||||||||
где |
– коэфф ц ент множественной детерминации для модели с |
|||||||||||||||||
полным набором факторов n; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
– коэффициент множественной детерминации для |
||||||||||||||||
|
бА |
|
||||||||||||||||
модели, не включающей фактор xi. |
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
Оценка знач |
|
коэффициентов регрессии осуществляется с по- |
|||||||||||||||
мощьюмостикр тер я Стьюдента: |
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
= |
|
|
, |
|
|
|
|
|
|
|
|
(50) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
: |
||
где |
– коэффициент «чистой» регрессии; |
|
|
|
|
|
|
|||||||||||
|
– средняя квадратичная ошибка коэффициента регрессии |
|||||||||||||||||
|
|
|
|
|
∙ |
|
|
|
Д |
|
||||||||
|
|
|
|
|
|
|
|
|
||||||||||
|
= |
|
|
|
|
|
|
∙ |
√ |
|
|
|
. |
|
(51) |
|||
|
|
∙ |
|
х |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
И |
|||||
|
Полученное значение критерия Стьюдента |
сравнивается с таблич- |
||||||||||||||||
ным, на основе которого принимается или отвергается гипотеза о значимости каждого коэффициента регрессии в отдельности [1].
При изучении экономических взаимосвязей возникает необходимость учесть в модели влияние качественного фактора (фактора, не имеющего количественного выражения). Влияние качественных признаков может приводить к скачкообразному изменению параметров линейных регрессионных моделей, построенных для различных значений качественного признака. Фиктивные переменные – это переменные бинарного
33
типа, т.е. каждая переменная может принимать два значения – единицу и
нуль:
1 = 0.
Для учета влияния одной качественной переменной вводится не-
сколько фиктивных переменных, которых должно быть на единицу меньше, чем значений этой переменной. За каждым значением качественной переменной закрепляется одна фиктивная переменная. Данная фиктивная переменная равна ед н це, если качественная переменная принимает значение, соответствующее этой фиктивной переменной, иначе принимает значение, равное нулю.
СибАДИ= ∙ + ∙ + ∙ + ∙ +ė,
Пр мер. Пусть рассматривается влияние уровня квалификации работника на объем выпуска продукции и имеется три возможных степени квалификац : высшая, средняя, низкая. Максимальная отдача – отдача от работника с высшей квал фикацией, следовательно, за базу принимается квалификац я, для двух значений качественной переменной вводятся
фиктивные переменные z1 и z2. |
||||
|
Z = |
1 − |
высшая квалификация |
|
|
не высшая квалификация |
|||
|
0−средняя квалификация |
|||
|
z |
= |
1− |
не средняя квалификация |
Есл |
|
=0, тогда0− |
качественная переменная. «уровень квалифи- |
|
кации» принимает значение «низкая квалификация». |
||||
|
= |
|
|
|
В общем виде модель с фиктивными переменными имеет вид (фиктивные переменные рассматриваются как факторы, которые используются
как количественные переменные):
где – результативная переменная;
– фиктивные переменные, принимающие значения.
В уравнении регрессии зависимая переменная у рассматривается как функция не только от х, но и от z. Переменная z рассматривается как дихотомическая переменная, принимающая два значения: 1 и 0. При этом, если z1=1, z2=0 и наоборот [1, 7].
34
Применение метода наименьших квадратов в уравнении множест-
венной регрессии |
уравнения регрессии. |
предполага- |
|
ет оценку параметров= + ∙ + |
∙ + ….+ ∙ + |
|
|
Оценки параметров регрессии |
должны отвечать определенным кри- |
||
С |
|
|
|
териям: |
|
|
|
несмещенность оценки – математическое ожидание остатков рав- |
|||
но нулю. Если оценки обладают свойством несмещенности, их можно |
|||
сравнивать между |
сследованиями; |
|
|
эффект вность остатков – характеризуются наименьшей диспер- |
|||
сией; |
|
|
|
состоятельность оценки – увеличение точности оценки с увеличе- |
|||
нием объема |
[3]. |
|
|
При этом делаются определенные предпосылки относительно слу- |
|||
чайной вел ч ны |
. Исследование остатков предполагает проверку нали- |
||
чиявыборкипредпосылок метода наименьших квадратов: |
|
||
случайный характер остатков – для оценки строится график зави- |
|||
симости остатков |
от теоретического значения результативного признака. |
||
Если на графике получена горизонтальная линия, то остатки представляют |
|||
собой случайные величины и применение МНК оправдано; |
|
||
нулевая средняя величина остатков, не зависящая от х – эта пред- |
|||
нейных моделейбАи ∑( − ) = 0 |
|
||
посылка означает, |
что |
. Данное условие выполнимо для ли- |
|
моделей, нелинейных относительно включаемых пара-
метров;
гомоскедастичность означает, что для каждого значения фактора х остатки имеют одинаковую дисперсию;
отсутствие автокорреляции остатков – значение остатков распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих значений;
остатки подчиняются нормальному распределению [6,7]. Обобщенный метод квадратов применяется к преобразованным дан-ДИ
ным и позволяет получить оценки, обладающие не только свойством несмещенности, но и имеющим меньшие выборочные дисперсии.
Если среднее значение остаточных величин равно нулю, а дисперсия пропорциональна величине Ki:
|
ė |
|
где ė – дисперсия ошибки при |
конкретном i - м значении фактора; |
|
|
= ∙ , |
|
– постоянная дисперсия ошибки при соблюдении предпосылки о гомоскедастичности остатков;
35