Материал: Анализ поведения финансовых индексов с помощью методов математической статистики на примере курса Центрального банка валютной пары евро/рубль

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Анализ поведения финансовых индексов с помощью методов математической статистики на примере курса Центрального банка валютной пары евро/рубль

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Ростовский государственный строительный университет»

Институт информационных систем и технологий

Кафедра прикладной математики и вычислительной техники






КУРСОВАЯ РАБОТА

по дисциплине «Теория вероятностей и математическая статистика»

на тему: «Анализ поведения финансовых индексов с помощью методов математической статистики на примере курса Центрального банка валютной пары евро/рубль»


Выполнила студентка группы ПИ-223 В.С. Самарина

Руководитель проекта

к.ф.-м.н., с.н.с., доцент В.В. Мисюра


Ростов-на Дону

г.

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ

1.1 Описание входных данных. Получение ряда доходностей (случайной величины (СВ)Х). Построение графика доходностей

1.2 Построение интервального статистического ряда и гистограммы

1.3 Выявление грубых ошибок в выборке. Исключение аномальных значений

1.4 Оценка функции распределения и построение ее графика. Интерпретация полученных результатов и предварительный закон распределения

ГЛАВА 2. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ СТАТИСТИЧЕСКИХ ДАННЫХ. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ

2.1 Вычисление основных характеристик выборочных данных. Свойства полученных оценок

2.2 Точечные оценки параметров предполагаемого закона распределения случайных величин методом максимального правдоподобия

2.3 Восстановление теоретической функции распределения и плотности распределения СВ

2.4 Построение доверительных интервалов для математического ожидания и дисперсии с надежностью 0,95

ГЛАВА 3. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

3.1 Проверка с помощью критерия согласия гипотезы о виде закона распределения СВ, уровень значимости α=0,05

3.2 Построение графика функции плотности вероятности и сравнение его с гистограммой

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ВВЕДЕНИЕ

Статистический анализ выборочных данных является очень актуальной темой в наше время. Очень часто невозможно провести анализ по всей совокупности данных (любых данных) по причине их многочисленности. Либо анализ всей совокупности может занимать много времени. Для получения данных проводится анализ выборочных данных по этой совокупности.

В данной курсовой работе проводится анализ поведения финансовых индексов с помощью методов математической статистики на примере ЦБ валютной пары евро/рубль.

Целью данной работы является практическое закрепление теоретических данных статистического анализа вариационных рядов.

Задачи курсовой работы:

.        Произвести наблюдения над курсом ЦБ валютной пары евро/рубль;

.        Вычислить логарифмы изменения цен;

.        Выполнить первичный анализ данных;

.        Вычислить основные характеристики выборки;

.        Произвести проверки статистических гипотез;

.        Интерпретировать полученные результаты.

ГЛАВА 1. ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ

.1 Описание входных данных. Получение ряда доходностей (случайной величины (СВ)Х). Построение графика доходностей


Исходные данные к работе были взяты с официального сайта <#"879860.files/image001.gif">

Рисунок 1. Курс рубля

Получили выборку, состоящую из 48 элементов. Для дальнейшей работы с данными преобразуем их в доходности, то есть найдем функцию отражающую поведение изменения цен. Значение натурального логарифма, при аргументе равным единице, равен нулю. Если цены акций при закрытии равны, то доходность равна нулю, = 1, а  = 0, при, следовательно , является доходностью (См.[6]). Преобразуем цены акций в доходность.

Каждый элемент выборки заменили на логарифм отношения текущего значения к предыдущему:

 , где (1.1.)

Sn- цена рискового актива, n = 1, 2, 3,.., N.

Таким образом рассчитали финансовые индексы.

По полученным индексам курса рубля построили график доходностей, который наглядно отражает динамику изменения валютной пары евро/рубль (Рисунок 2) (См.[8]).

Рисунок 2. График доходностей

.2 Построение интервального статистического ряда и гистограммы


Полученный первичный статистический материал подлежит дальнейшей обработке, прежде всего упорядочению. Результаты наблюдений над случайной величиной, необходимо расположить в порядке возрастания, т.е. проранжировать выборку.

Интервальный статистический ряд - это таблица, в которой приведены интервалы значений признака и относительные частоты попадания признака в эти интервалы(См.[1]).

Интервальный статистический ряд строится для непрерывных случайных величин и для дискретных случайных величин с большим числом вариант, в нем определены границы для непрерывно варьируемого признака (См.[4]). Интервалы будем брать с одинаковой длиной, число интервалов рассчитывается по формуле Стерджеса:

= 1+1.4 ln (n) , (1.2)

где k - число интервалов, n - объем выборки.

Длина интервала определяется по формуле

 . (1.3)

Находим наименьшее и наибольшее значение в выборке, а также число интервалов и длину интервалов (Рисунок 3). Отступаем на полшага h от наименьшего значения выборки. Промежуточные интервалы получаем прибавляя к концу предыдущего интервала длину частичного интервала h (в данном случае h=0,0304095) (См.[2]).

Рисунок 3. Интервалы карманов

Таблица частот при этом имеет вид (Рисунок 4):

Рисунок 4. Интервальный статистический ряд

Первый столбец полученной таблицы - это квантиль данного для распределения доходностей/убытков, второй- частота попадания доходностей в тот или иной интервал.

Для наглядного изображения интервального ряда распределения построим гистограмму доходностей, с помощью всторенного модуля Анализ данных/ Гистограмма (Рисунок 5). Гистограмма доходностей представлена на Рисунке 6 (См.[2]).

Рисунок 5. Модуль Анализ данных

Рисунок 6. Гистограмма

Единицы статистической совокупности, у которых значения анализируемого признака существенно отклоняются от основного массива, называются аномальными явлениями, «грубыми ошибками» или выбросами.

При решении задач статистического анализа проблема наличия в выборке аномальных измерений имеет чрезвычайно важное значение. Присутствие единственного аномального наблюдения может приводить к оценкам, которые совершенно не согласуются с выборочными данными.

Для данных индексов построим точечный график (Рисунок 7). В ходе визуального анализа выявляем наличие в выборке аномальных значений (выбросов).

Рисунок 7. Точечный график

Самым простым методом обнаружения грубых ошибок считается метод, на основании Т - Критерия Граббса:

, где (1.4)

- среднее значение, x - аномальное значение, s - выборочное среднеквадратическое отклонение СВ.

Данный критерий можно использовать для выделения аномальных результатов измерений только в случае нормального закона.

Так как выборка распределена нормально, мы можем найти Тк, и проверить наличие грубых ошибок в выборке.

Результаты расчетов по выборке представлены на Рисунке 8:

Рисунок 8.Результаты вычисления

Полученные значения  сравнивают с табличными значениями процентных точек критерия Смирнова Граббса (Таблица 1). В том случае, если >, мы может утверждать, что проверяемое значение является грубой ошибкой и относится к классу выбросов.

Таблица 1. Значения процентных точек критерия Смирнова Граббса

0.99

0.95

30

0.4257

0.4791

31

0.4376

0.4885

32

0.4477

0.4995

33

0.4558

0.5099

34

0.4688

0.5189

35

0.4779

0.5285

36

0.4874

0.5374

37

0.4970

0.5459

38

0.5048

0.5540

39

0.5145

0.5617

40

0.5211

0.5692

41

0.5307

0.5767

42

0.5385

0.5835

43

0.5450

0.5902

44

0.5522

0.5970

45

0.5599

0.6033

46

0.5675

0.6090

47

0.6154

48

0.5789

0.6211

49

0.5861

0.6270

50

0.5910

0.6324

Сравним полученные значения с табличным (при = 0,01) при числе наблюдений равном 48, а Ткр = 0,5789.

Так как Тк(1) =1,9> = 0,5789, то проверяемое значение является грубой ошибкой и относится к классу выбросов.

Аналогично Тк(2) =3,33> = 0,5789, что подтверждает, что рассматриваемое значение является аномальным значением.

Критерий Граббса имеет некоторые недостатки. Он не точен, и не чувствителен к засорениям, когда ошибки группируются на расстоянии от общей совокупности.

Далее подтвердим наличие грубых ошибок на основании L- критерия Титьена-Мура (См.[9]).

Решающее правило для исключения k наибольших членов вариационного ряда основано на статистике:

, где  (1.5)

Воспользовавшись формулами, было найдено значение L-критерия Титьена-Мура для рассматриваемой выборки (Рисунок 9)

Рисунок 9. Значение L-критерия Титьена-Мура

Сравниваем полученное значение с критическим пределом (Таблица 2). При наличии выбросов статистика Lk должна быть меньше критического предела. В данном случае Lk = 0,67887 <Cкр = 0,696, что подтверждает наличие аномальных значений в выборке (См.[9]).

Таблица 2. Критические значения оценки для L - критерия Титьена и Мура (a=0,05)


Для избавления от выбросов изменим данные доходностей, исключим значение 0,076594461 и -0,125593848, что приведет к нормальному распределению.

Гистограмма при этом теперь имеет вид (Рисунок 10):

Рисунок 10.Гистограмма

.4. Оценка функции распределения и построение ее графика. Интерпретация полученных результатов и предварительный закон распределения


Каждая случайная величина полностью определяется своей функцией распределения.

Если X - случайная величина, то функция F(x) = FX (x) = P (X <x) называется функцией распределения случайной величины X. Здесь P (X <x) - вероятность того, что случайная величина X принимает значение, меньшее x.

Важно понимать, что функция распределения содержит всю информация о случайной величине и поэтому изучение случайной величины заключается в исследовании ее функции распределения, которую часто называют просто распределением.

Функция распределения любой случайной величины обладает следующими свойствами:

.        F(x) определена на всей числовой прямой R;

.        F(x) не убывает, т.е. если x1x2, то F(x1) F(x2);

3.      F(-)=0, F(+)=1, т.е. и  ;

.        F(x) непрерывна справа, т.е.

Для построения функции распределения необходимо взять накопленные частоты. Они определяются путем последовательного суммирования частот предшествующих интервалов (Рисунок 11).

Рисунок 11. Накопленные частоты

Таким образом график оценки функции имеет вид (Рисунок 12):

Рисунок 12. График оценки функции

Полученная функция распределения соответствует нормальному закону распределения, поэтому логично предположить, что финансовые индексы валютной пары евро/рубль распределены нормально.