Дипломная работа: Меры связи случайных величин и их применение в сетевом анализе

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

F1 мера

Так как в процессе построения отсеченного графа происходит принятие или отвержение статистических гипотез о включении или не включении ребра в указанный граф, можно говорить об ошибке первого и второго рода - ребро принято, когда не должно было или отвергнуто, когда ему следовало быть графе. В связи с этим есть возможность описать меру схожести двух графов G1 и G2, как F1 меру, где включение ребра в граф G1 будем считать верным, если это ребро включено в граф G2 и наоборот, неверным, если данное ребро в G2 отсутствовало.

Для расчета F1 меры будем брать , что означает, что F1 мера будет представлять собой среднегармоническое точности и полноты. Очевидно, что в таком случае F1 мера симметрична относительно порядка графов. А именно:

Также очевидно, что F1 мера имеет область значений от 0 до 1, где 1 означает полное совпадение графов, а 0 - отсутствие общих ребер.

ГЛАВА 4. Результаты

Результаты представлены в виде таблиц. Сначала идут сравнения графов рынка, построенных при помощи различных метрик - корреляции Пирсона, корреляции Спирмена и знаковой корреляции, далее сравниваются последовательно максимальные остовные деревья и клики. В таблицах строки отвечают за метрику, столбцы соответственно за графы, построенные по выбранным данным и значения F1 метрики, которая и является основным способом определить степень схожести графов.

Временные промежутки выбраны так, чтобы в первой таблице показать разницу между структурами, полученными в спокойный период (2017 год), а во второй, между теми, что были идентифицированы в переломный для американской экономики период (до и после кризиса начала 2016 года). В связи с этим можно ожидать, что во вторых таблицах значения F1 меры будут малы для всех функций зависимости.

Графы рынка

При помощи одношаговой процедуры из сети рынка (которая является полным взвешенным графом) получаем отсеченный граф, в котором предстоит решить задачу идентификации сетевых структур - клики и максимальные остовные деревья.

Отсеченные графы, построенные по данным за 2017 год (стабильный рост индекса)

1 января 2017 - 30 июня 2017

1 июля 2017 -31 декабря 2017

F1 measure

Pr

0.11842

Sp

0.14754

Sn

0.14754

Рисунок 7 отсеченные графы по данным за 2017 год

Отсеченные графы, построенные по данным за период с середины 2015 года по середину 2016 (до и после кризиса)

1 июля 2015 - 31 декабря 2015

1 января 2016 - 30 июня 2016

F1 measure

Pr

0.16842

Sp

0.16667

Sn

0.10345

Рисунок 8 отсеченные графы 2015 - 2016 гг

Максимальное остовное дерево, полученное из отсеченного графа рынка при помощи алгоритма Прима

Максимальные остовные деревья в отсеченных графах, построенных по данным за 2017 год (стабильный рост индекса)

1 января 2017 - 30 июня 2017

1 июля 2017 -31 декабря 2017

F1 measure

Pr

0.21429

Sp

0.17857

Sn

0.17857

Максимальные остовные деревья в отсеченных графах, построенных по данным за период с середины 2015 года по середину 2016 (до и после кризиса)

1 июля 2015 - 31 декабря 2015

1 января 2016 - 30 июня 2016

F1 measure

Pr

0.5

Sp

0.5

Sn

0.17857

Рисунок 9 максимальное остовное дерево 2015 - 2016 гг

Клики

Сравнение проводится по 6ти наиболее значимым кликам (как мера значимости в алгоритме используется сумма весов соответствующих ребер в сети рынка), объединенным в один граф.

Клики в отсеченных графах, построенных по данным за 2017 год (стабильный рост индекса)

1 января 2017 - 30 июня 2017

1 июля 2017 -31 декабря 2017

F1 measure

Pr

0.09524

Sp

0.13462

Sn

0.14414

Рисунок 10 клики 2017 год

Клики в отсеченных графах, построенных по данным за период с середины 2015 года по середину 2016 (до и после кризиса)

1 июля 2015 - 31 декабря 2015

1 января 2016 - 30 июня 2016

F1 measure

Pr

0.08571

Sp

0.02273

Sn

0.04211

Рисунок 11 клики 2015 - 2016 гг

Итоговое сравнение мер зависимости на основе данных полученных в эксперименте.

ЗАКЛЮЧЕНИЕ

Вывод

В ходе сравнения мер зависимости, применяемых для определения весов в сетевой модели рынка, были выявлены результаты, приведенные выше, и по ним можно сделать следующие заключения:

1. Ни одна из функций не может быть названа лучшей по всем показателям. Разницы в значениях F1 меры малы и в значительной мере зависят от выбранного временного промежутка.

2. На выбранных данных знаковая функция зависимости показывает результаты в среднем несколько менее стабильные, чем две другие меры зависимости.

3. Как можно заметить из сравнения результатов для максимального остовного дерева за временной период, включающий в себя экономический кризис, результат анализа сетевой модели может значительно зависеть от применяемой функции связи случайных величин.

Итог: при работе с сетевой моделью фондового рынка имеет смысл проводить предварительное исследование для того, чтобы определить, какая мера зависимости даст лучший (в плане информативности) результат на конкретном наборе данных.

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

рынок сетевой фондовый акция

1. В.А. Калягин, А.П. Колданов, П.А. Колданов, П.М. Пардалос «Статистические процедуры идентификации сетевых структур фондовых рынков» 2017г

2. Valery A. Kalyagin, Alexander P. Koldanov, Petr A. Koldanov «Robust identification in random variable networks» 2016г

3. E. L. Lehman «Some concepts of dependence» 1966г

4. William H. Kruskal «Ordinal Measures of Association» 2012г

5. Бенджамин Грэм и Дэвид Додд «Анализ ценных бумаг» 2012г

6. Майкл Н. Кан «Технический анализ. Просто и ясно» 2008г

7. Дмитрий Михнов «Успешный трейдинг. От нуля до первого миллиона» 2016г