ŷ =x'n+1 β (2.1)
Нетрудно проверить, что поскольку Е
= β, то Е ŷ
= Еуn+1, т.е.
оценка ŷ является несмещенной. Оказывается, в классе линейных (по
у) несмещенных оценок она обладает наименьшей среднеквадратичной ошибкой.[3]
Нетрудно проверить, что
среднеквадратичная ошибка прогноза есть
Е(ŷ -уn+1)2
= σ2(1+ x'n+1 (Х'X)-lxn+1). (2.2)
Заменим σ2 на ее
оценку s2 и обозначим
Получаем, что если ошибки (ε,εn+1) имеют совместное нормальное распределение, то случайная величина (ŷ -yn+1)/δ имеет распределение Стьюдента с n- к степенями свободы. Поэтому доверительным интервалом для yn+1 с уровнем доверия α будет интервал (ŷ - δ tα, ŷ - δ tα) где tα - двусторонняя α -квантиль распределения Стьюдента с n - к степенями свободы.
Можно показать, что в случае парной
регрессии, т. е. когда система у=Хβ+ε имеет вид
yt = β1 +β2xt + εt t= 1,. . .,n,
формула (2.2) выглядит так:
(2.3)
где x=1/n ∑xt . Из (2.3) следует, что среднеквадратичная ошибка
прогноза минимальна при xn+1=
, и чем
дальше xn+1 от
, тем шире
соответствующий доверительный интервал (см. рис. 2).
Рис. 2 доверительный интервал
Условное прогнозирование
В предыдущих рассуждениях мы
предполагали, что независимая переменная xn+1 известна
точно. Однако на практике встречаются ситуации, когда в xn+1 содержатся
ошибки. Так, при прогнозировании временных рядов часто приходится
прогнозировать значения независимых переменных, что неизбежно приводит к
отклонениям от истинных значений. Поэтому рассмотрим задачу условного
прогнозирования. Пусть выполнены соотношения у=Хβ+ε и (2.0), но
вектор xn+1 наблюдается
с ошибкой
z = xn+1+ u, (2.4)
где u - k х 1 случайный вектор, не зависящий от (ε,εn+1).
Прогноз (2.1) заменяется теперь на
ŷ = z'
. (2.5)
Пусть е = ŷ- yn+1 - ошибка
прогнозирования. Тогда
Ее = Е(z'
) - x'n+1 β =
Е[(xn+1 + u)'
] - x'n+1 β
= Е(x'n+1
) + Е(u'
)- x'n+1 β = 0,