Дипломная работа: Статистика тарифообразования в страховании

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

· У - страховые сборы на душу населения (тыс.руб.);

· Х1 - вклады физических лиц на рублевых счетах в Сберегательном Банке РФ на душу населения (млн руб.);

· Х2 - расходование бюджета фонда социального страхования РФ на душу населения (млн руб.);

· Х3 - расходование бюджета пенсионного фонда РФ на душу населения (млн руб.);

· Х4 - ожидаемая продолжительность жизни при рождении (число лет);

· Х5 - коэффициент демографической нагрузки (на 1000 человек трудоспособного населения);

· Х6 - среднедушевые денежные доходы населения (руб.).

Анализ основан на показателях в разрезе 80 субъектов РФ по данным Росстата и ФССН за 2013 год.

3.1 Первичный анализ данных

Для того, чтобы выдвинуть гипотезы о законе распределения каждой из переменных, необходимо проанализировать основные описательные статистики для каждого из факторов (табл.4). Практически среди всех переменных среднее значение является достаточно близким по значению к медиане, что может говорить о нормальности распределения. Коэффициент асимметрии положителен везде, кроме переменной Х5, что свидетельствует о смещении распределения влево (для Х5, соответственно, вправо); а положительные во всех случаях значения коэффициента эксцесса указывают на островершинность.

Таблица 4

Описательные статистики для переменных

У

Х1

Х2

Х3

Х4

Х5

Х6

Среднее

209,71

35,78

3,68

43,05

70,03

700,09

21458,72

Станд. ошибка

12,54

1,68

0,14

0,90

0,27

5,47

642,33

Медиана

210,07

33,88

3,35

42,81

69,97

709,50

20289,00

Мода

Нет

Нет

Нет

Нет

69,13

716,00

Нет

Станд. отклонение

109,33

14,63

1,18

7,83

2,35

47,65

5599,71

Дисперсия выборки

11952,34

214,15

1,39

61,34

5,52

2270,38

31356734,04

Эксцесс

0,60

1,71

0,62

1,54

3,59

0,40

1,44

Асимметричность

0,18

0,76

1,08

0,48

0,29

-0,54

1,16

Интервал

471,41

82,14

5,19

40,89

17,05

246,00

28660,00

Минимум

2,00

1,94

1,90

24,12

61,79

563,00

11311,00

Максимум

473,41

84,08

7,09

65,01

78,84

809,00

39971,00

Прежде чем проверить данные на нормальность, нужно было убедиться, что в выборке отсутствуют выбросы. Для проверки на аномальные значения использовалось правило трёх сигм, согласно которому значения должны укладываться в интервал . После проверки из анализа были исключены следующие регионы: Москва, Чукотский автономный округ, Магаданская область и Самарская область. Проверка на нормальность осуществлялась с помощью критерия Колмогорова-Смирнова (П.2.Рис.1). На уровне значимости 0,05 в соответствии с критерием Колмогорова-Смирнова гипотеза о нормальном распределении всех величин, кроме переменной Х3 и Х6, принимается. На основе полученных данных можно сделать вывод, что проведение дальнейшего анализа представляется возможным.

Чтобы определить тесноту связи между выбранными факторами были проведены расчёты парных коэффициентов корреляции. Парные коэффициенты корреляции используются для измерения взаимозависимости между двумя переменными без учета их взаимодействия с другими переменными.

Таблица 5

Парные коэффициенты корреляции

У

Х1

Х2

Х3

Х4

Х5

Х6

У

1

0,435

0,326

0,248

-0,290

-0,299

0,401

Х1

0,435

1

0,337

0,544

-0,122

-0,375

0,768

Х2

0,326

0,337

1

0,466

-0,200

-0,419

0,572

Х3

0,248

0,544

0,466

1

-0,329

0,016

0,454

Х4

-0,290

-0,122

-0,200

-0,329

1

-0,178

-0,086

Х5

-0,299

-0,375

-0,419

0,016

-0,178

1

-0,562

Х6

0,401

0,768

0,572

0,454

-0,086

-0,562

1

На основе проведенного анализа (Табл.5) можно сделать следующие выводы. Наиболее тесная связь наблюдается между анализируемым признаком У - объёмом поступлений в российские страховые фонды и факторным признаком Х1 - вкладами физических лиц на рублевых счетах в Сберегательном Банке РФ. Также сильная корреляционная связь наблюдается между признаками Х1 и Х6 - вкладами физических лиц и среднедушевыми денежными доходами населения. Стоит отметить, что между переменными У - объёмом поступлений в российские страховые фонды и Х4 - ожидаемой продолжительностью жизни при рождении и Х5 - коэффициентом демографической нагрузки наблюдается отрицательная связь.

Также для оценки взаимосвязи между двумя выбранными переменными при исключении влияния остальных показателей, были рассчитаны частные коэффициенты корреляции (табл. 6). Анализ частных коэффициентов корреляции позволяет сделать вывод о том, что воздействие посторонних факторов не влияет на взаимосвязь с исследуемым признаком только для переменной Х4, отражающей ожидаемую продолжительность жизни при рождении. В остальных случаях частные коэффициенты корреляции значительно меньше, чем парные, что говорит о том, что воздействие посторонних факторов усиливает взаимосвязь между исследуемыми признаками и зависимой переменной.

Таблица 6

Частные коэффициенты корреляции

Парный КК

Частный КК

У Х1

0,435

0,244

У Х2

0,326

0,115

У Х3

0,248

-0,072

У Х4

-0,290

-0,295

У Х5

-0,299

-0,150

У Х6

0,401

-0,029

3.2 Регрессионный анализ

После проведения корреляционного анализа, который позволил установить наличие взаимосвязей между переменными и оценить их тесноту, был проведен регрессионный анализ для исследования степени влияния факторов на исследуемый признак. Для анализа был использован алгоритм пошагового регрессионного анализа с последовательным исключением незначимых переменных, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.

На первом этапе анализа мы имеем исследуемый признак У и семь факторных признаков. После построения регрессии получаем следующие оценки коэффициентов (табл.7). Таким образом, константа и коэффициенты в1 и в4 являются значимыми с вероятностью ошибки 5%. Согласно алгоритму регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную Х6 (среднедушевые денежные доходы населения), имеющую коэффициент регрессии в6, для которого tнабл минимальна по модулю.

Таблица 7

Итоги регрессионного анализа с участием всех переменных

Коэффициенты

t

Знч.

B

Стд. Ошибка

Константа

1338,58

492,39

2,72

0,01

Х1

2,78

1,33

2,09

0,04

Х2

12,85

13,33

0,96

0,34

Х3

-1,22

2,04

-0,60

0,55

Х4

-13,11

5,12

-2,56

0,01

Х5

-0,41

0,32

-1,26

0,21

Х6

-0,001

0,004

-0,24

0,81

На втором этапе регрессионного анализа в модель включены все факторы кроме Х6. На основе анализа были получены следующие данные (табл.8).

Таблица 8

Итоги регрессионного анализа с исключением переменной Х6

Коэффициенты

t

Знч.

B

Стд. Ошибка

Константа

1313,80

478,59

2,75

0,01

Х1

2,57

1,01

2,54

0,01

Х2

11,63

12,27

0,95

0,35

Х3

-1,23

2,03

-0,61

0,55

Х4

-13,12

5,09

-2,58

0,01

Х5

-0,38

0,30

-1,26

0,21

В полученной модели значимыми являются вновь лишь константа и коэффициенты в1 и в4 . Переменная Х3 исключается из анализа.

Процесс исключения переменных продолжается до тех пор, пока все переменные не окажутся значимыми на заданном уровне вероятности ошибки. Обобщенная таблица последующего пошагового исключения переменных представлена в П.2.Табл.1. Таким образом, уравнение регрессии имеет вид:

tнабл (3,42)*** (2,84)** (-2,85)** (-2,13)**

Полученное уравнение регрессии позволяет сделать вывод о том, что при отсутствии влияния внешних факторов страховые сборы на душу населения в среднем составят 1462,32 тыс. рублей. Остальные коэффициенты регрессии показывают среднюю величину изменения зависимой переменной У при изменении объясняющих переменных X1, Х4 и Х5 на единицу собственного изменения. Знаки при коэффициентах указывают направление этого изменения.

Также при проведении регрессионного анализа была получена регрессионная статистика (табл.9).

Таблица 9

Регрессионная статистика для уравнения регрессии

Множественный R

0,539

R-квадрат

0,291

Нормированный R-квадрат

0,261

Стандартная ошибка

93,960

Стоит отметить, что коэффициенты регрессии и сама регрессия являются значимыми, что даёт возможность проинтерпретировать полученные данные.

Величина R2 характеризует долю общей дисперсии зависимой переменной, обусловленную воздействием объясняющих переменных. Таким образом, около 29,1% вариации объёмов страховых поступлений (Y) объясняется вариацией вкладов (депозитов) физических лиц, ожидаемой продолжительности жизни при рождении и индексом потребительских цен, а 70,9% вариации вызвано воздействием неучтенных в модели и случайных факторов.

Коэффициент регрессии показывает среднюю величину изменения зависимой переменной Y при изменении объясняющей переменной X на единицу собственного изменения. Знак при коэффициенте указывает направление этого изменения. Таким образом, коэффициент регрессии при Х1 показывает, что при росте вкладов физических лиц на 1 миллион рублей, объёмы страховых поступлений увеличиваются в среднем на 2,33 тысяч рублей; коэффициент регрессии при Х4 говорит о том, что при увеличении продолжительности жизни на 1 год, объёмы страховых поступлений уменьшаются в среднем на 13,69 тысяч рублей; коэффициент регрессии при Х5 свидетельствует о том, что при увеличении коэффициента демографической нагрузки на 1 пункт, объёмы страховых поступлений уменьшаются в среднем на 0,54 тысяч рублей.

3.3 Спецификация регрессионной модели

Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. В нашем случае разделим выборку на две части: с более низкими и более высокими объемами страховых поступлений.

Выдвинем нулевую гипотезу H0: вi(1)=вi(2), где вi - коэффициенты регрессии для исследуемых выборок. Таким образом, проверим предположение о том, будет ли уравнение регрессии одним и тем же для обеих выборок. Для проверки используем сравнение с F-статистикой:

Получаем следующие результаты (П.2.Рис.2):

Fнабл

1,443

Fкр

2,507

Таким образом, Fнабл<Fкр, значит, гипотеза об отсутствии разрывов на уровне 39 не отвергается, то есть выборки однородны и можно анализировать весь массив данных целиком.

Многообразие и сложность экономических процессов предопределяет многообразие моделей, используемых для эконометрического анализа. Это существенно усложняет процесс нахождения максимально адекватной формулы зависимости. Для того чтобы проверить адекватность выбранной модели, был проведен ряд тестов.

RESET-тест основан на вспомогательной регрессии зависимой переменной на факторы исходной модели плюс различные степени оцененных по исходной модели значений зависимой переменной. Таким образом, если модель - линейная, то добавление в модель нелинейных функций от У не должно помогать объяснять У. После проверки гипотезы о линейности модели, были получены следующие результаты: