Дипломная работа: Статистика тарифообразования в страховании

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Находится характеристика

С помощью критерия Стьюдента проверяется гипотеза о том, что можно считать случайной разность D (т.е. ряд можно считать случайным, не содержащим тренд).

где уd- средняя квадратическая ошибка величины D.

Для исследуемого ряда были получены следующие результаты:

tнабл

5,94

tкрит

2,07

Наблюдаемое значение больше критического, гипотеза об отсутствии тренда отвергается с вероятностью ошибки 0,05.

Таким образом, все три критерия опровергли гипотезу об отсутствии тренда в исследуемом временном ряду.

Сглаживание ВР осуществляется посредством взвешивания средних значений, наблюдаемых в окрестностях выбранной точки. Содержание процедуры сглаживания включает в себя замену фактических уровней временного ряда расчетными уровнями, которые подвержены колебаниям в меньшей степени, что способствует более четкому проявлению тенденции развития.

Алгоритмические методы выделения тренда, которые были выбраны для проведения процедуры сглаживания:

· метод простого скользящего среднего;

· метод взвешенного скользящего среднего.

Для проведения процедуры сглаживания по простой скользящей средней сначала определяют длину интервала сглаживания g, включающего в себя g последовательных уровней ряда (g<n). Стоит учитывать, что чем шире интервал сглаживания, тем в большей степени взаимопогашаются колебания, и тенденция развития носит более плавный, сглаженный характер; чем сильнее колебания, тем шире должен быть интервал сглаживания. Затем весь период наблюдений разбивают на участки, при этом интервал сглаживания как бы скользит по ряду с шагом, равным 1. После этого рассчитывают арифметические средние из уровней ряда, образующих каждый участок. Далее фактические значения ряда, стоящие в центре каждого участка, заменяют на соответствующие средние значения. Итак, скользящая средняя определяется по формуле:

При применении сглаживания с помощью взвешенной скользящей средней значение центрального уровня заменяется на расчетное:

,

где wi - весовые коэффициенты yi определяются с помощью МНК. При сглаживании по взвешенной скользящей средней используют полиномы 2-го или 3-го порядков. Сглаженное значение в центральной точке активного участка для данного временного ряда рассчитывалось с учетом следующих весовых коэффициентов:

,

При использовании скользящей средней с длиной активного участка g=2k+1 первые и последние k уровней ряда сгладить нельзя, их значения теряются. Для восстановления значений следует сначала вычислить средний прирост на последнем активном участке по следующей формуле:

где g-длина активного участка, yt+k - значение последнего уровня на активном участке, yt-k - значение первого уровня на активном участке, Дy - средний абсолютный прирост. После этого сглаженные значения получаются путем последовательного прибавления среднего абсолютного прироста к последнему сглаженному значению. Аналогично оценивают первые уровни ВР. Средние приросты для анализируемого ряда составляют:

?верх

95412,8

?нижн

1993897,3

Результаты проведения процедуры сглаживания представлены на рис.4.

Рис.4. Совмещенный график сглаживания для объёмов страховых поступлений, 2004-2014 гг

Таким образом, процедура сглаживания выявила более четкую положительную тенденцию динамики объёмов поступлений в российские страховые компании.

Часто во временных рядах наблюдается не только определенная тенденция, но и присутствие сезонной составляющей. Сезонная компонента описывает поведение, изменяющееся регулярно в течение заданного временного периода (в нашем случае - квартала); состоит из последовательности изменяющихся циклов. В данной работе была проверена гипотеза об отсутствии сезонности с помощью применения фиктивных переменных и гармонического анализа.

Модель с фиктивными переменными предполагает выдвижение некоторых предположений относительно анализируемого ряда:

- ВР квартальной динамики представлен в виде аддитивной модели, содержащей трендовую, сезонную и случайные компоненты;

- Тренд может быть описан линейной моделью;

- Для описания сезонных колебаний используем фиктивные переменные.

а,b,c-коэффициенты модели.

При этом, di=1, если наблюдения принадлежат i-му кварталу, иначе d=0. 1-й квартал взят в качестве эталона, а фиктивные переменные позволяют оценить разницу между эталонным кварталом и остальными. После проверки значимости коэффициентов и зависимости модель можно использовать для описания сезонных колебаний в каждом квартале.

Регрессионная модель, описывающая динамику уровней ряда, относящихся к эталонному месяцу, примет вид:

Соответственно для наблюдений 2-ого квартала:

Расстояние между отдельной регрессионной прямой для любого квартала и усредненной моделью даст оценку сезонных отклонений в квартале. После построения модели с фиктивными переменными было получено следующее уравнение (базовым является первый квартал):

tнабл (-2,04)* (14,28)*** (0,72) (0,77) (1,69)

Стоит отметить, что значимыми оказались только константа и коэффициент при переменной времени. Незначимость коэффициентов говорит о том, что разница между каждым из них и базовым месяцем несущественна. Регрессия в целом является значимой (П.1.Рис.6). Таким образом, на основе полученной информации можно сделать вывод о том, что сезонности нет.

Идея гармонического анализа состоит в том, что рассматривается ряд, в котором на случайную компоненту наложены стандартные предположения МНК. Пусть ряд содержит циклическую (сезонную) составляющую, выраженную некоторой функцией от времени С(t) с известными периодами. Функцию, заданную в каждой точке изучаемого интервала времени, можно представить рядом SIN и COS функций - рядом Фурье.

Для анализируемого ряда были сгенерированы переменные:

, , , . После этого была получено уравнение регрессии (П.1.Рис.7):

tнабл (13,47)*** (-1,54) (0,79) (0,35) (-0,72) (0,92)

Так как коэффициенты уравнения регрессии являются незначимыми, гармонический анализ также подтверждает тот факт, что в данных не наблюдается сезонность.

Таким образом, на основе проведенного анализа можно утверждать, что в представленном временном ряде отсутствует сезонность.

Для проверки стационарности случайного процесса используем тест Дики-Фулера.

Согласно тесту Дики-Фулера (П.1.Рис.8), гипотеза о наличии единичного корня не отвергается на уровне значимости б=0,01, следовательно, исходный временной ряд можно считать нестационарным.

Проведем тест Дики-Фулера для первой разности (П.1.Рис.9). Гипотеза о наличии единичного корня отвергается на уровне значимости б=0,01, следовательно, временной ряд со взятием первой разности можно считать стационарным.

Таким образом, после использования теста Дики-Фулера можно утверждать, что ряд со взятием первой разности является стационарным, что означает высокую вероятность использования для прогноза модели типа ARIMA.

2.3 Построение моделей анализа временных рядов

В данной работе было построено два вида адаптивных моделей: Брауна и Хольта. Адаптивными называются методы, позволяющие строить самокорректирующиеся экономико-математические модели, которые способны оперативно реагировать на изменение условий путем учета результата прогноза, сделанного на предыдущем шаге, и учета различной информационной ценности уровня ряда.

Модель Брауна представляет собой своего рода экспоненциальное сглаживание. В качестве первого значения (S0 = 4005909,25) использовалась арифметическая средняя первых четырех имеющихся кварталов. Параметр б оценивался в пакете Stata (П.1.Рис.10) и составил 0,9423. После этого был рассчитан прогноз по следующей формуле:

Сущность этого метода состоит в том, чтобы убрать избыточный вес от веса, даваемого первому значению, и распределить его пропорционально по всем членам ряда. Прогнозы, получаемые по соответствующей модифицированной модели, основываются в большей степени на фактических данных, чем на предварительной оценке S0 даже при малых выборках. Результаты построения модели отражены на рис.5.

Рис.5. Результаты прогнозирования временного ряда с помощью модели Брауна

По графику с результатами прогнозирования временного ряда с помощью модели Брауна можно сделать вывод, что модель достаточно точно повторяет кривую динамики рынка, ошибка прогноза составляет ESS = 17,971013

Адаптивная модель Хольта является одной из первых моделей подобного рода, однако основная ее проблема заключалась в том, что она не учитывала сезонность. Для того чтобы получить прогноз по модели Хольта, нужно провести некоторую подготовительную работу, а именно - рассчитать значения коэффициентов a1,0 и а2,0 по имеющемуся ряду данных. После этого подбираются постоянные сглаживания, в результате чего получается линейную модель, на каждом шаге адаптирующуюся к фактическим данным. Оценка коэффициентов происходит по следующим формулам:

где б1, б2 -- параметры экспоненциального сглаживания (0 ? б1, б2, ? 1), параметрами адаптации. Обновление параметров модели происходит по схеме экспоненциального сглаживания. Для анализируемого временного ряда данных с помощью Stata (П.1.Рис.11) были подобраны следующие коэффициенты: б1=0,171 и б2=1. Результаты построения модели отражены на рис.6.

Рис.6. Результаты прогнозирования временного ряда с помощью модели Хольта

По графику с результатами прогнозирования временного ряда с помощью модели Хольта можно сделать вывод, что модель достаточно хорошо описывает общую тенденцию развития рынка, ошибка прогноза составляет ESS = 9,791013

Модели для нестационарных временных рядов называют моделями авторегрессии интегрированного скользящего среднего ARIMA(p,d,q). Так как анализируемый ряд становится стационарным при взятии первой разности, для прогноза строим модель ARIMA с помощью эксперта построения моделей в пакете SPSS (П.1.Рис.12). Оптимальной моделью признана модель ARIMA (0,1,0), результаты построения модели отражены на рис.7.

Рис.7. Результаты прогнозирования временного ряда с помощью модели ARIMA

По графику с результатами прогнозирования временного ряда с помощью модели ARIMA(0,1,0) можно сделать вывод, что модель достаточно точно повторяет кривую динамики рынка, ошибка прогноза составляет ESS = 13,691013

Для построения прогноза из трех моделей необходимо выбрать такую, которая лучше всего описывает тенденции на рынке страхования жизни в России. Для этого сравним сумму квадратов остатков для каждой модели (табл.3).

Таблица 3

Сравнение суммы квадратов остатков моделей

Модель Брауна

Модель Хольта

Модель ARIMA

Сумма квадратов остатков

17,971013

9,791013

13,691013

Таким образом, наилучшей моделью является адаптивная модель Хольта, построим по ней прогноз на следующие 5 периодов: с 1 квартала 2015 по 1 квартал 2016 гг (рис.8).

Рис.8. Построение прогноза до 1 квартала 2016 года с помощью модели Хольта

Таким образом, в данной главе был проанализирован ряд динамики объёмов поступлений в российские страховые компании и сделаны выводы относительно основных характеристик ряда и тенденций развития рынка страхования жизни в России. Во-первых, тест Чоу показал неоднородность выборки из-за сильного различия тренда в докризисное и посткризисное время, вследствие чего было принято решение проводить анализ данных с первого квартала 2009 года. Дальнейшее исследование выявило наличие тренда, а также отсутствие сезонности, что позволило сузить круг моделей для прогнозирования до трёх: модели Брауна, модели Хольта и модели ARIMA. Среди выбранных моделей лучшей оказалась адаптивная модель Хольта. В целом, построенный прогноз на пять периодов вперед (до 1 квартала 2016 года) показывает восходящий тренд, однако демонстрирует некоторое снижение объёмов страховых поступлений в 1 квартале 2015 года.

ГЛАВА 3. СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ ВЛИЯНИЯ РАЗЛИЧНЫХ ФАКТОРОВ НА ОБЪЁМЫ ПОСТУПЛЕНИЙ В РОССИЙСКИЕ СТРАХОВЫЕ ОРГАНИЗАЦИИ

В настоящее время объёмы поступлений в российские страховые фонды определяется рядом факторов, характеризующимися различными социально-экономическими показателями различных сфер. В данном исследовании были использованы следующие переменные: