F1 мера
Так как в процессе построения отсеченного графа происходит принятие или отвержение статистических гипотез о включении или не включении ребра в указанный граф, можно говорить об ошибке первого и второго рода - ребро принято, когда не должно было или отвергнуто, когда ему следовало быть графе. В связи с этим есть возможность описать меру схожести двух графов G1 и G2, как F1 меру, где включение ребра в граф G1 будем считать верным, если это ребро включено в граф G2 и наоборот, неверным, если данное ребро в G2 отсутствовало.
Для расчета F1 меры будем брать , что означает, что F1 мера будет представлять собой среднегармоническое точности и полноты. Очевидно, что в таком случае F1 мера симметрична относительно порядка графов. А именно:
Также очевидно, что F1 мера имеет область значений от 0 до 1, где 1 означает полное совпадение графов, а 0 - отсутствие общих ребер.
ГЛАВА 4. Результаты
Результаты представлены в виде таблиц. Сначала идут сравнения графов рынка, построенных при помощи различных метрик - корреляции Пирсона, корреляции Спирмена и знаковой корреляции, далее сравниваются последовательно максимальные остовные деревья и клики. В таблицах строки отвечают за метрику, столбцы соответственно за графы, построенные по выбранным данным и значения F1 метрики, которая и является основным способом определить степень схожести графов.
Временные промежутки выбраны так, чтобы в первой таблице показать разницу между структурами, полученными в спокойный период (2017 год), а во второй, между теми, что были идентифицированы в переломный для американской экономики период (до и после кризиса начала 2016 года). В связи с этим можно ожидать, что во вторых таблицах значения F1 меры будут малы для всех функций зависимости.
Графы рынка
При помощи одношаговой процедуры из сети рынка (которая является полным взвешенным графом) получаем отсеченный граф, в котором предстоит решить задачу идентификации сетевых структур - клики и максимальные остовные деревья.
Отсеченные графы, построенные по данным за 2017 год (стабильный рост индекса)
|
1 января 2017 - 30 июня 2017 |
1 июля 2017 -31 декабря 2017 |
F1 measure |
||
|
Pr |
0.11842 |
|||
|
Sp |
0.14754 |
|||
|
Sn |
0.14754 |
Рисунок 7 отсеченные графы по данным за 2017 год
Отсеченные графы, построенные по данным за период с середины 2015 года по середину 2016 (до и после кризиса)
|
1 июля 2015 - 31 декабря 2015 |
1 января 2016 - 30 июня 2016 |
F1 measure |
||
|
Pr |
0.16842 |
|||
|
Sp |
0.16667 |
|||
|
Sn |
0.10345 |
Рисунок 8 отсеченные графы 2015 - 2016 гг
Максимальное остовное дерево, полученное из отсеченного графа рынка при помощи алгоритма Прима
Максимальные остовные деревья в отсеченных графах, построенных по данным за 2017 год (стабильный рост индекса)
|
1 января 2017 - 30 июня 2017 |
1 июля 2017 -31 декабря 2017 |
F1 measure |
||
|
Pr |
0.21429 |
|||
|
Sp |
0.17857 |
|||
|
Sn |
0.17857 |
Максимальные остовные деревья в отсеченных графах, построенных по данным за период с середины 2015 года по середину 2016 (до и после кризиса)
|
1 июля 2015 - 31 декабря 2015 |
1 января 2016 - 30 июня 2016 |
F1 measure |
||
|
Pr |
0.5 |
|||
|
Sp |
0.5 |
|||
|
Sn |
0.17857 |
Рисунок 9 максимальное остовное дерево 2015 - 2016 гг
Клики
Сравнение проводится по 6ти наиболее значимым кликам (как мера значимости в алгоритме используется сумма весов соответствующих ребер в сети рынка), объединенным в один граф.
Клики в отсеченных графах, построенных по данным за 2017 год (стабильный рост индекса)
|
1 января 2017 - 30 июня 2017 |
1 июля 2017 -31 декабря 2017 |
F1 measure |
||
|
Pr |
0.09524 |
|||
|
Sp |
0.13462 |
|||
|
Sn |
0.14414 |
Рисунок 10 клики 2017 год
Клики в отсеченных графах, построенных по данным за период с середины 2015 года по середину 2016 (до и после кризиса)
|
1 июля 2015 - 31 декабря 2015 |
1 января 2016 - 30 июня 2016 |
F1 measure |
||
|
Pr |
0.08571 |
|||
|
Sp |
0.02273 |
|||
|
Sn |
0.04211 |
Рисунок 11 клики 2015 - 2016 гг
Итоговое сравнение мер зависимости на основе данных полученных в эксперименте.
1. Ни одна из функций не может быть названа лучшей по всем показателям. Разницы в значениях F1 меры малы и в значительной мере зависят от выбранного временного промежутка.
2. На выбранных данных знаковая функция зависимости показывает результаты в среднем несколько менее стабильные, чем две другие меры зависимости.
3. Как можно заметить из сравнения результатов для максимального остовного дерева за временной период, включающий в себя экономический кризис, результат анализа сетевой модели может значительно зависеть от применяемой функции связи случайных величин.
Итог: при работе с сетевой моделью фондового рынка имеет смысл проводить предварительное исследование для того, чтобы определить, какая мера зависимости даст лучший (в плане информативности) результат на конкретном наборе данных.
1. В.А. Калягин, А.П. Колданов, П.А. Колданов, П.М. Пардалос «Статистические процедуры идентификации сетевых структур фондовых рынков» 2017г
2. Valery A. Kalyagin, Alexander P. Koldanov, Petr A. Koldanov «Robust identification in random variable networks» 2016г
3. E. L. Lehman «Some concepts of dependence» 1966г
4. William H. Kruskal «Ordinal Measures of Association» 2012г
5. Бенджамин Грэм и Дэвид Додд «Анализ ценных бумаг» 2012г
6. Майкл Н. Кан «Технический анализ. Просто и ясно» 2008г
7. Дмитрий Михнов «Успешный трейдинг. От нуля до первого миллиона» 2016г