МОСКОВСКИЙ ЭНЕРГЕТИЧЕСКИЙ ИНСТИТУТ (ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)
В.С. Батасова
Учебное пособие по курсу «Эконометрика»
для студентов всех направлений подготовки факультета «Экономика и управление» Гуманитарно-прикладного института МЭИ (ТУ)
Москва Издательство МЭИ 2010
УДК
Б28
Утверждено учебным управлением МЭИ в качестве учебного пособия для студентов
Подготовлено на кафедре «Экономика и управление» ГПИ Рецензенты:
доктор техн. наук, профессор, Ю.А. Горицкий,
кандидат экономич. наук, доцент С.А. Зайчикова
Батасова В.С.
Практикум по основам эконометрики в среде Excel: учебное пособие по курсу «Эконометрика». – М.: Издательский дом МЭИ, 2010.– 68 с.
ISBN
Практикум предназначен для приобретения студентами навыков решения задач эконометрики с целью дальнейшего применения в специальных дисциплинах и практической деятельности. Включает работы по следующим темам: линейная парная регрессия, линейная множественная регрессия, временные ряды, фиктивные переменные, одновременные уравнения.
Предназначен для студентов всех направлений подготовки факультета «Экономика и управление» ГПИ МЭИ (ТУ) при изучении курса эконометрики. Может использоваться всеми студентами экономических специальностей.
ISBN © Московский энергетический институт, 2010
В настоящее время стремительно развиваются науки, связанные с применением математических методов и информационных технологий в различных областях человеческой деятельности. Эконометрика – одна из таких наук.
Эконометрика занимается разработкой и применением статистических методов для определения взаимосвязей между экономическими переменными. Основная цель таких исследований состоит в том, чтобы получить возможность по значениям одних переменных прогнозировать значения других.
Эконометрика – одна из дисциплин, составляющих базовую подготовку экономистов. Она входит в Государственные образовательные стандарты для экономических специальностей как обязательная дисциплина.
Предлагаемый практикум состоит из шести работ, материал которых приблизительно соответствует программе по эконометрике для вузов. Цель практикума – приобретение студентами навыков решения эконометрических задач для дальнейшего применения их в специальных дисциплинах и практической деятельности.
Задачи взяты из [1-10]. Некоторые задачи упрощены, учитывая небольшой объем часов практических занятий.
Для успешного прохождения практикума необходимо, чтобы студенты были знакомы с основами теории вероятностей и математической статистики в объеме [5 (гл.1, 2), 2] , а также имели навыки работы в среде Microsoft Excel
Выбор табличного процессора Excel как вычислительной среды обусловлен, с одной стороны, наличием в нем достаточно мощных инструментов для эконометрических расчетов (статистические функции, пакет анализа). С другой стороны, в Excel результат можно получить разными способами, в том числе легко сделать проверочные расчеты по формулам, не используя указанные инструменты. Еще одним преимуществом Excel является доступность; несомненно, этот табличный процессор имеет большую популярность, чем любая система статистического анализа данных.
Задания пособия использовались при проведении занятий по эконометрике со студентами различных специальностей дневного и вечернего отделения факультета «Экономика и управление» ГПИ МЭИ в 2005-2008 гг.
Пусть функционирование экономического объекта описывается двумя числовыми переменными: входной переменной X и выходной переменной Y. Возможно, что X может изменяться (регулироваться) исследователем, а значение Y получается как результат функционирования объекта.
Предполагается, что Y зависит от X практически линейно:
Y=mX+b+e, (1)
где m и b – детерминированные величины, e – случайная величина.
Выходная переменная Y называется зависимой переменной (или объясняемой переменной, или откликом). Входная переменная X называется независимой переменной (или объясняющей переменной, или фактором, или регрессором). Случайную величину e в эконометрике называют возмущением.
Если математическое ожидание возмущения равно нулю, то функция
f(x)= mx+b
является условным математическим ожиданием Y при заданном значении X=x: f(x)≡MxY. В этом случае соотношение (1) называется регрессионным уравнением. Чтобы подчеркнуть, что переменных всего две, а связь между ними линейная, говорят, что (1) – уравнение парной линейной регрессии. Функция f(x) называется регрессией (линейной) Y по X (или функцией регрессии), а величины m и b – параметрами линейной регрессии (m – коэффициентом, b – сдвигом).
Пусть имеется n наблюдений величин X и Y: (x1,y1), (x2,y2), …, (xn,yn). Из соотношения (1) получаем: yi=mxi+b+εi, где εi – возмущение в i-ом наблюдении, i=1, …, n.
Требуется по
наблюдениям найти в некотором смысле
наилучшие оценки
и
значений m и b. Если
и
получены, то оценку отклика
по известному значению фактора x
можно определить по формуле:
. (2)
Формулу (2) можно использовать для прогноза значения отклика по интересующему исследователя значению фактора.
Для получения оценок и традиционно используется метод наименьших квадратов (МНК). В соответствии с МНК значения и определяются из условия минимума остаточной суммы, которая равна сумме квадратов отклонений наблюдений отклика yi от оценок, полученных с помощью соотношения (2).
Обозначим:
– оценка отклика для i-го наблюдения,
i=1, …, n;
– отклонение наблюдения отклика от
оценки; величины ei
называются остатками; Qe
– остаточная сумма.
Графически определение остатков поясняется на рис. 1. Координатная плоскость, на которой нанесены точки наблюдений, называется полем корреляции.
С учетом принятых обозначений остаточная сумма является суммой квадратов остатков и задается формулой:
(3)
Ясно, что чем меньше
Qe,
тем лучше оценки соответствуют
наблюдениям. Из необходимого условия
экстремума Qe
(равенства частных производных по
и
нулю) можно получить формулы для оценок
параметров уравнения линейной регрессии:
, (4)
. (5)
В формулах (4) и (5)
использованы обозначения:
– выборочная ковариация переменных X
и Y,
– выборочная дисперсия переменной X,
и
– выборочные средние значения X и
Y, соответственно.
Определения перечисленных выше выборочных характеристик приводятся в Приложении. Вывод формул (4) и (5) дается, например, в [5].
Заметим, что сдвиг
b нельзя считать объективной
характеристикой зависимости Y от
X, потому что его величина определяется
выбором начала координат. Из соотношения
(5), в частности, следует, что для МНК-оценок
прямая, задаваемая уравнением (2), всегда
проходит через точку (
).
Подставив (5) в (2), после несложных
преобразований получим:
. (6)
Это соотношение связывает отклонения оценки отклика и фактора от их выборочных средних значений. Переход от величин к их отклонениям от среднего называется центрированием этих величин. Заметим, что значение в соотношении (6) не присутствует.
На первый взгляд
кажется, что по величине коэффициента
можно
судить о степени зависимости Y от
X: чем больше
,
тем сильнее зависимость. Это не совсем
так, потому что на величину
влияет выбор единиц измерения X и
Y. Для получения более объективной,
чем
,
характеристики зависимости X и Y,
следует найти связь между их
нормированными значениями. Нормировку
обычно проводят делением величины X
(и, соответственно, Y) на ее
выборочное среднее квадратичное
отклонение
sx
(sy).
Разделим обе части соотношения (6) на
sy,
а затем правую часть умножим и
разделим на sx.
Тогда получим:
(7)
где введено обозначение:
Величина r называется выборочным коэффициентом корреляции (см. Приложение). Коэффициент r показывает, на сколько значений sy в среднем увеличится отклик, если фактор увеличится на sx. Говорят, что выборочный коэффициент корреляции характеризует тесноту связи между X и Y.
Известно, что |r| ≤1. Чем ближе |r| к 1, тем теснее связь между X и Y; чем ближе |r| к 0, тем слабее связь. При r=1 точки наблюдений лежат на прямой, задаваемой соотношением (2). При r=0 прямая (2) параллельна оси абсцисс, и связь между X и Y отсутствует. Примеры тесной и слабой связи даны на рис.2.
Рассмотрим вопрос о качестве МНК-оценок (4) и (5). Эти оценки обладают многими хорошими свойствами, если величины в уравнении (1) удовлетворяют следующим условиям.
X – детерминированная величина;
e1, …,en – независимые нормальные одинаково распределенные случайные величины: ei~N(0,s2), M(eiej)=0 при ij.
При выполнении этих условий соотношение (1) называется классической нормальной линейной регрессионной моделью.