Находится характеристика
С помощью критерия Стьюдента проверяется гипотеза о том, что можно считать случайной разность D (т.е. ряд можно считать случайным, не содержащим тренд).
где уd- средняя квадратическая ошибка величины D.
Для исследуемого ряда были получены следующие результаты:
|
tнабл |
5,94 |
|
|
tкрит |
2,07 |
Наблюдаемое значение больше критического, гипотеза об отсутствии тренда отвергается с вероятностью ошибки 0,05.
Таким образом, все три критерия опровергли гипотезу об отсутствии тренда в исследуемом временном ряду.
Сглаживание ВР осуществляется посредством взвешивания средних значений, наблюдаемых в окрестностях выбранной точки. Содержание процедуры сглаживания включает в себя замену фактических уровней временного ряда расчетными уровнями, которые подвержены колебаниям в меньшей степени, что способствует более четкому проявлению тенденции развития.
Алгоритмические методы выделения тренда, которые были выбраны для проведения процедуры сглаживания:
· метод простого скользящего среднего;
· метод взвешенного скользящего среднего.
Для проведения процедуры сглаживания по простой скользящей средней сначала определяют длину интервала сглаживания g, включающего в себя g последовательных уровней ряда (g<n). Стоит учитывать, что чем шире интервал сглаживания, тем в большей степени взаимопогашаются колебания, и тенденция развития носит более плавный, сглаженный характер; чем сильнее колебания, тем шире должен быть интервал сглаживания. Затем весь период наблюдений разбивают на участки, при этом интервал сглаживания как бы скользит по ряду с шагом, равным 1. После этого рассчитывают арифметические средние из уровней ряда, образующих каждый участок. Далее фактические значения ряда, стоящие в центре каждого участка, заменяют на соответствующие средние значения. Итак, скользящая средняя определяется по формуле:
При применении сглаживания с помощью взвешенной скользящей средней значение центрального уровня заменяется на расчетное:
,
где wi - весовые коэффициенты yi определяются с помощью МНК. При сглаживании по взвешенной скользящей средней используют полиномы 2-го или 3-го порядков. Сглаженное значение в центральной точке активного участка для данного временного ряда рассчитывалось с учетом следующих весовых коэффициентов:
,
При использовании скользящей средней с длиной активного участка g=2k+1 первые и последние k уровней ряда сгладить нельзя, их значения теряются. Для восстановления значений следует сначала вычислить средний прирост на последнем активном участке по следующей формуле:
где g-длина активного участка, yt+k - значение последнего уровня на активном участке, yt-k - значение первого уровня на активном участке, Дy - средний абсолютный прирост. После этого сглаженные значения получаются путем последовательного прибавления среднего абсолютного прироста к последнему сглаженному значению. Аналогично оценивают первые уровни ВР. Средние приросты для анализируемого ряда составляют:
|
?верх |
95412,8 |
|
|
?нижн |
1993897,3 |
Результаты проведения процедуры сглаживания представлены на рис.4.
Рис.4. Совмещенный график сглаживания для объёмов страховых поступлений, 2004-2014 гг
Таким образом, процедура сглаживания выявила более четкую положительную тенденцию динамики объёмов поступлений в российские страховые компании.
Часто во временных рядах наблюдается не только определенная тенденция, но и присутствие сезонной составляющей. Сезонная компонента описывает поведение, изменяющееся регулярно в течение заданного временного периода (в нашем случае - квартала); состоит из последовательности изменяющихся циклов. В данной работе была проверена гипотеза об отсутствии сезонности с помощью применения фиктивных переменных и гармонического анализа.
Модель с фиктивными переменными предполагает выдвижение некоторых предположений относительно анализируемого ряда:
- ВР квартальной динамики представлен в виде аддитивной модели, содержащей трендовую, сезонную и случайные компоненты;
- Тренд может быть описан линейной моделью;
- Для описания сезонных колебаний используем фиктивные переменные.
а,b,c-коэффициенты модели.
При этом, di=1, если наблюдения принадлежат i-му кварталу, иначе d=0. 1-й квартал взят в качестве эталона, а фиктивные переменные позволяют оценить разницу между эталонным кварталом и остальными. После проверки значимости коэффициентов и зависимости модель можно использовать для описания сезонных колебаний в каждом квартале.
Регрессионная модель, описывающая динамику уровней ряда, относящихся к эталонному месяцу, примет вид:
Соответственно для наблюдений 2-ого квартала:
Расстояние между отдельной регрессионной прямой для любого квартала и усредненной моделью даст оценку сезонных отклонений в квартале. После построения модели с фиктивными переменными было получено следующее уравнение (базовым является первый квартал):
tнабл (-2,04)* (14,28)*** (0,72) (0,77) (1,69)
Стоит отметить, что значимыми оказались только константа и коэффициент при переменной времени. Незначимость коэффициентов говорит о том, что разница между каждым из них и базовым месяцем несущественна. Регрессия в целом является значимой (П.1.Рис.6). Таким образом, на основе полученной информации можно сделать вывод о том, что сезонности нет.
Идея гармонического анализа состоит в том, что рассматривается ряд, в котором на случайную компоненту наложены стандартные предположения МНК. Пусть ряд содержит циклическую (сезонную) составляющую, выраженную некоторой функцией от времени С(t) с известными периодами. Функцию, заданную в каждой точке изучаемого интервала времени, можно представить рядом SIN и COS функций - рядом Фурье.
Для анализируемого ряда были сгенерированы переменные:
, , , . После этого была получено уравнение регрессии (П.1.Рис.7):
tнабл (13,47)*** (-1,54) (0,79) (0,35) (-0,72) (0,92)
Так как коэффициенты уравнения регрессии являются незначимыми, гармонический анализ также подтверждает тот факт, что в данных не наблюдается сезонность.
Таким образом, на основе проведенного анализа можно утверждать, что в представленном временном ряде отсутствует сезонность.
Для проверки стационарности случайного процесса используем тест Дики-Фулера.
Согласно тесту Дики-Фулера (П.1.Рис.8), гипотеза о наличии единичного корня не отвергается на уровне значимости б=0,01, следовательно, исходный временной ряд можно считать нестационарным.
Проведем тест Дики-Фулера для первой разности (П.1.Рис.9). Гипотеза о наличии единичного корня отвергается на уровне значимости б=0,01, следовательно, временной ряд со взятием первой разности можно считать стационарным.
Таким образом, после использования теста Дики-Фулера можно утверждать, что ряд со взятием первой разности является стационарным, что означает высокую вероятность использования для прогноза модели типа ARIMA.
2.3 Построение моделей анализа временных рядов
В данной работе было построено два вида адаптивных моделей: Брауна и Хольта. Адаптивными называются методы, позволяющие строить самокорректирующиеся экономико-математические модели, которые способны оперативно реагировать на изменение условий путем учета результата прогноза, сделанного на предыдущем шаге, и учета различной информационной ценности уровня ряда.
Модель Брауна представляет собой своего рода экспоненциальное сглаживание. В качестве первого значения (S0 = 4005909,25) использовалась арифметическая средняя первых четырех имеющихся кварталов. Параметр б оценивался в пакете Stata (П.1.Рис.10) и составил 0,9423. После этого был рассчитан прогноз по следующей формуле:
Сущность этого метода состоит в том, чтобы убрать избыточный вес от веса, даваемого первому значению, и распределить его пропорционально по всем членам ряда. Прогнозы, получаемые по соответствующей модифицированной модели, основываются в большей степени на фактических данных, чем на предварительной оценке S0 даже при малых выборках. Результаты построения модели отражены на рис.5.
Рис.5. Результаты прогнозирования временного ряда с помощью модели Брауна
По графику с результатами прогнозирования временного ряда с помощью модели Брауна можно сделать вывод, что модель достаточно точно повторяет кривую динамики рынка, ошибка прогноза составляет ESS = 17,971013
Адаптивная модель Хольта является одной из первых моделей подобного рода, однако основная ее проблема заключалась в том, что она не учитывала сезонность. Для того чтобы получить прогноз по модели Хольта, нужно провести некоторую подготовительную работу, а именно - рассчитать значения коэффициентов a1,0 и а2,0 по имеющемуся ряду данных. После этого подбираются постоянные сглаживания, в результате чего получается линейную модель, на каждом шаге адаптирующуюся к фактическим данным. Оценка коэффициентов происходит по следующим формулам:
где б1, б2 -- параметры экспоненциального сглаживания (0 ? б1, б2, ? 1), параметрами адаптации. Обновление параметров модели происходит по схеме экспоненциального сглаживания. Для анализируемого временного ряда данных с помощью Stata (П.1.Рис.11) были подобраны следующие коэффициенты: б1=0,171 и б2=1. Результаты построения модели отражены на рис.6.
Рис.6. Результаты прогнозирования временного ряда с помощью модели Хольта
По графику с результатами прогнозирования временного ряда с помощью модели Хольта можно сделать вывод, что модель достаточно хорошо описывает общую тенденцию развития рынка, ошибка прогноза составляет ESS = 9,791013
Модели для нестационарных временных рядов называют моделями авторегрессии интегрированного скользящего среднего ARIMA(p,d,q). Так как анализируемый ряд становится стационарным при взятии первой разности, для прогноза строим модель ARIMA с помощью эксперта построения моделей в пакете SPSS (П.1.Рис.12). Оптимальной моделью признана модель ARIMA (0,1,0), результаты построения модели отражены на рис.7.
Рис.7. Результаты прогнозирования временного ряда с помощью модели ARIMA
По графику с результатами прогнозирования временного ряда с помощью модели ARIMA(0,1,0) можно сделать вывод, что модель достаточно точно повторяет кривую динамики рынка, ошибка прогноза составляет ESS = 13,691013
Для построения прогноза из трех моделей необходимо выбрать такую, которая лучше всего описывает тенденции на рынке страхования жизни в России. Для этого сравним сумму квадратов остатков для каждой модели (табл.3).
Таблица 3
Сравнение суммы квадратов остатков моделей
|
Модель Брауна |
Модель Хольта |
Модель ARIMA |
||
|
Сумма квадратов остатков |
17,971013 |
9,791013 |
13,691013 |
|
Таким образом, наилучшей моделью является адаптивная модель Хольта, построим по ней прогноз на следующие 5 периодов: с 1 квартала 2015 по 1 квартал 2016 гг (рис.8).
Рис.8. Построение прогноза до 1 квартала 2016 года с помощью модели Хольта
Таким образом, в данной главе был проанализирован ряд динамики объёмов поступлений в российские страховые компании и сделаны выводы относительно основных характеристик ряда и тенденций развития рынка страхования жизни в России. Во-первых, тест Чоу показал неоднородность выборки из-за сильного различия тренда в докризисное и посткризисное время, вследствие чего было принято решение проводить анализ данных с первого квартала 2009 года. Дальнейшее исследование выявило наличие тренда, а также отсутствие сезонности, что позволило сузить круг моделей для прогнозирования до трёх: модели Брауна, модели Хольта и модели ARIMA. Среди выбранных моделей лучшей оказалась адаптивная модель Хольта. В целом, построенный прогноз на пять периодов вперед (до 1 квартала 2016 года) показывает восходящий тренд, однако демонстрирует некоторое снижение объёмов страховых поступлений в 1 квартале 2015 года.
ГЛАВА 3. СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ ВЛИЯНИЯ РАЗЛИЧНЫХ ФАКТОРОВ НА ОБЪЁМЫ ПОСТУПЛЕНИЙ В РОССИЙСКИЕ СТРАХОВЫЕ ОРГАНИЗАЦИИ
В настоящее время объёмы поступлений в российские страховые фонды определяется рядом факторов, характеризующимися различными социально-экономическими показателями различных сфер. В данном исследовании были использованы следующие переменные: