Материал: Введение в эконометрику10

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

2. Решение типовых задач в среде Excel

2.1. Оценивание значимости качественных признаков при исследовании пространственных выборок

2.1.1. Задание*

Исследовать зависимость между результатами письменного вступительного экзамена и экзамена в первую сессию по таблице 24, где Y – число задач, решенных на экзамене в сессию (из 7 задач задания), Х – число задач, решенных на вступительном экзамене (из 10 задач). Ответить на вопросы: влияют ли результаты вступительных экзаменов на успеваемость в сессию? Влияет ли пол студента на успеваемость в сессию? Одинакова ли зависимость Y(Х) для лиц мужского и женского пола?

Таблица 24. Число задач, решенных на экзаменах

№ сту­дента (i)

Число решенных задач

Пол

студента

zi

zi xi

№ сту­дента (i)

Число решенных задач

Пол

студента

zi

zi xi

xi

yi

xi

yi

10

6

муж.

1

10

6

3

жен.

0

0

6

4

жен.

0

0

7

4

муж.

1

7

8

4

муж.

1

8

9

7

муж.

1

9

8

5

жен.

0

0

6

3

жен.

0

0

6

4

жен.

0

0

5

2

муж.

1

5

7

7

муж.

1

7

7

3

жен.

0

0

2.1.2. Выполнение

Найдем уравнение парной линейной регрессии Y=mX+b по всем наблю­дениям таблицы 24 (т. е. не учитывая качественный признак «Пол студента»). Результаты функции ЛИНЕЙН, необходимые для дальнейших расчетов, приведены в таблице 25.

Значение статистики Фишера F=11,29 больше порога f(0,05, 1, 10)=4,96. Таким обра­зом, неравенство (35) справедливо, и уравнение Y=0,815X-1,44 значимо. Следовательно, успеваемость в сессию Y существенно зависит от результатов вступитель­ных экзаменов X.

Исследуем влияние пола студента на успеваемость в сессию. Для этого введем фиктивную переменную Z (равную 1 для мужчин и 0 для женщин) и оценим параметры уравнения регрессии Y=mX+m1Z+b. Результаты функции ЛИНЕЙН для этого уравнения приведены в таблице 25.

Таблица 25. Характеристики уравнений

Уравнение

Оценки коэффициентов

Выборочные СКО

F

k2

Qe

Y=mX+b

=0,815

-1,44

=0,242

11,29

10

13,46

Y=mX+m1Z+b

=0,743; =0,466

-1,17

=0,276; =0,763

5,48

9

12,93

Y=mX+m1(ZX)+b1Z+b

=0,571 =0,211 =-0,952

-0,048

=0,676 =0,749 =5,10

3,31

8

12,80

Y=mX+m1(ZX)+b

=0,680 =0,073

-0,765

=0,324 =0,112

5,53

9

12,86

Значение статистики Фишера F=5,48 больше порога f(0,05, 2, 9)=4,26. Таким обра­зом, уравнение Y=0,743X-0,466Z -1,17 значимо, и успеваемость в сессию в основном определяется двумя факторами: результатами вступитель­ных экзаменов и полом студента. Далее надо прове­рить значимость каждого из этих факторов. Рассчитаем статистики Стьюдента по формуле (36а): =0,743/0,276=2,69; 0,466/0,763=0,611.

Сравнивая значения этих статистик с порогом t(0,05, 9)=2,26, получаем, что фактор X значим, а фактор Z незначим (см. формулу (37)). Таким образом, ус­певаемость студента в сессию в основном зависит от результатов вступительных экзаменов (и слабо зависит от пола студента). Незначимость переменной Z в рассматри­ваемом уравнении также означает, что пол студента не оказывает значимого влияния на величину сдвига b в уравнении Y=mX+b.

Для оценки влияния пола и на коэффициент, и на сдвиг уравнения Y=mX+b надо проанализировать значимость параметров m1 и b1 в уравнении (45). В таблицу 24 для работы с уравнением (45) добавим столбец значений ZX. Результаты функции ЛИ­НЕЙН приведены в таблице 25. Значение статистики Фишера F=3,31 меньше порога f(0,05, 3, 8)=4,07, что говорит о незначимости уравнения. Также оказы­ваются незначимыми все коэффициенты уравнения (это предлагается прове­рить самостоятельно). По-видимому, двенадцати наблюдений недостаточно для оценивания четырех параметров уравнения. Поэтому для оценки влияния пола на коэффициент уравнения Y=mX+b проверим значимость коэффициента m1 в уравнении Y=mX+m1(ZX)+b; характеристики уравнения представлены в таблице 25. Применяя критерии Фишера и Стьюдента так же, как и для предыдущих уравнений, получим, что уравнение значимо, а коэффициент m1 незначим. Отсюда можно сделать вывод, что признак «Пол студента» не влияет на коэффициент уравнения регрессии Y=mX+b.

Так как признак «Пол студента» не влияет ни на коэффициент, ни на сдвиг уравнения линейной регрессии Y=mX+b, то зависимость Y(Х) одинакова для лиц мужского и женского пола.

Этот же вывод можно получить по критерию Г. Чоу (см. §1.3). Если ги­потеза H0 верна (пол студента не влияет на зависимость Y(Х)), то справедливо уравнение Y=mX+b, поэтому Q0=13,46, k0=10. Если H0 неверна, то зависимость Y от X описывается уравнением (45), поэтому Q1=12,80, k1=8. Из формулы (46) имеем: Q=0,663, из (47): k=2. Подставив эти значения в формулу (48), получим FЧоу=0,207. Порог для статистики Чоу равен: f(0,05, 2, 8)=4,46. Неравенство (49) не справедливо, и гипотеза H0 не отклоня­ется.

Заметим, что значение остаточной суммы Q1 можно было получить другим способом. Именно, надо разделить наблюдения на две части: в одну часть отнести наблюдения, для которых Z=0 (женщины), а в другую – для которых Z=1 (мужчины). Далее следует рассчитать остаточные суммы для каждой части (Q1(Z=0)=2,19 и Q1(Z=1)=10,61) и просуммировать их (получим Q1=12,80).

2.2. Проверка значимости структурных изменений временного ряда

2.2.1. Задание*

В таблице 26 представлены данные по объему продаж Y и цене товара X для фирмы по продаже молока. Построив поле корреляции, убедиться в том, что данные для месяцев 5, 6, 7 не являются типичными (на фирме в этот период прошла забастовка). Вынести суждение: отличается ли зависимость Y(X) до забастовки от зависимости Y(X) после забастовки; использовать критерий Г. Чоу и метод фиктивных переменных. Опре­делить, какой именно параметр линейной регрессии (коэффициент или сдвиг) значимо изменился в результате забастовки. Результаты проиллюстрировать графически.

Таблица 26. Зависимость объема продаж Y от цены товара X

№ месяца (i)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

yi (усл. ед)

98

100

103

105

80

87

94

113

116

118

121

123

126

128

xi (усл. ед)

10

11

12,5

12,5

14,6

14,6

14,9

13

13

13,8

14,2

14,4

15

16,1

2.2.2. Выполнение

Поле корреляции (построенное как точечная диаграмма) показано на рис.13. Видно, что точки наблюдений, соответствующие забастовке (5, 6, 7), являются нетипичными, далеко отстоят от других наблюдений. Поэтому эти точки исключим из дальнейших расчетов.

В таблице 27 представлены оценки уравне­ний вида Y=mX+b для непрерывной модели и участков кусочно-линей­ной модели (получены с помощью функции ЛИНЕЙН). Остаточная сумма непрерывной модели (см. §1.4) Q0=104,86, ее число степеней свободы k0=9. Остаточная сумма ку­сочно-линейной модели получается сложением остаточных сумм линейных участков: Q1=2,11+12,75=14,86, ее число степеней свободы равно k1=2+5=7. Из формул (46), (47) имеем: Q=Q0-Q1=104,86-14,86=90, k=k0-k1=9-7=2. Подставив эти значения в формулу (48), получим FЧоу=21,20. Порог для статистики равен f(0,05, 2, 7)=4,74. Неравенство (49) справедливо, и гипотеза о незначимости структурных изменений ряда отклоняется. Таким образом, по критерию Г.Чоу зависимость Y(X) до забастовки отличается от зависимости Y(X) после забастовки.

Таблица 27. Характеристики непрерывной и кусочно-линейной моделей

Модель

Наблюдения

k2

Qe

Непрерывная

1-4, 8-14 (все, кроме забастовки)

5,83

36,62

9

104,86

Кусочно-линейная

1-4 (до забастовки)

2,44

73,39

2

2,11

8-14 (после забастовки)

4,71

53,74

5

12,75

Применим метод фиктивных переменных для анализа значимости структурных изменений ряда. Рассмотрим двоичную переменную:

В таблицу исходных данных добавим две строки: со значениями Z и ZX, и с помощью функции ЛИНЕЙН оценим характеристики уравнения (45); результаты представлены в таблице 28.

Таблица 28. Характеристики уравнения Y=mX+m1(ZX)+b1Z+b

F

k2

Qe

2,44

2,27

-19,65

73,34

0,687

0,873

11,03

177,35

7

14,86