Материал: Корреляция финансовых временных рядов

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

3.2     Watson Analytics


Это система от всеми известной компании IBM. Аналитическая система для различных данных. В эту систему необходимо загрузить базу данных, которую необходимо проанализировать и система предложит выбрать тип анализа, который необходимо провести для базы данных. В системе имеется возможность ввести вопрос, ответ на который должны дать данные, и система сама подберет представление информации в удобном виде и свои прогнозы. Системой можно пользоваться как на платной основе в виде подписки, так и бесплатно с введенными ограничениями.

В арсенале этой системы имеется огромное количество инструментов. Она способна строить многофакторные модели, делать сентиментный и семантический анализ рядов, но, что самое главное в рамках исследования, систем умеет импортировать данные из системы Twitter. Поиск нужных твитов система проводит в соответствии с введенными хэштегами, и имеется возможность выбрать период времени, за который необходимо узнать активность пользователей. Единственное ограничение - это 25 000 твитов. Можно выбрать период, в который будет больше 25 000 твитов, но тогда система сама выберет 25 000 твитов из всех возможных, что не очень хорошо для проведения исследования. После выбора системы пришло время провести анализ временного ряда и активности в Twitter.

3.3     Дональд Трамп

Дональд Трамп - это президент США, который осенью 2016 года баллотировался на пост президента и провел превосходную PR-компанию в социальных сетях. Миллиардер и очень яркая личность, новости о которой влияли на поведение американского доллара.

Для проведения анализа был выбран хэштег #trump. Был выбран лишь один тег, так как практически везде он был использован при упоминании президента вместе с другими тегами, такими как #donaldtrump, #presidenttrump и другими. В качестве временного финансового ряда использовался курс евро-доллар за октябрь-ноябрь 2016 года.

Для того, чтобы анализ был точным, при получении статистики данные соответствовали ограничениям Watson Analytics, и количество твитов в одной базе не превышало 25 000. Поэтому было создано несколько баз на каждый день, в целях уместить все твиты по выбранному хештегу. После сбора были получены следующие графики (рис.2, рис.3, рис.4). Также, были построены сентиментные графики.

Рисунок 2. График твитов по хэштегу #trump

Рисунок 3. График положительного сентимента по хэштегу #trump

Рисунок 4.График отрицательного сентимента по хэштегу #trump

3.4     Брексит

Кроме ряда по хэштегу «trump», также был проведен анализ по хештегу «brexit». Этот хэштег был выбран, так как это событие является одно из самых ярких событий для евросоюза за прошедший год. Как и в прошлой выборке, для анализа создавались базы данных из твитов так, чтобы в каждой базе количество твитов не превышало 25 000. Для исследования были выбраны месяца май и июнь 2016 года.

Решение о том, что Великобритания выйдет из состава Евросоюза, было объявлено на референдуме, который прошел 23 июня. В связи с этим, для анализа реакции рынка на новость необходимо посмотреть состояние системы до появления новости, а затем во время объявления.

До объявления новости в общественности обычно появляются различные слухи, которые порождают реакцию. Если обратиться к рынку акций, то там эта ситуация наиболее ярко видна. На стоимость акций влияют результаты финансового года. Поэтому объявление результатов является важным событием для компании. Как объявить новость это задача, которая стоит отдельного рассмотрения. Первое, на что обычно смотрят при объявлении результатов, так это на состав акционеров. Если в составе акционеров достаточно много крупных инвесторов, чаще всего не частных, то менеджеры компаний рассказывают плохие новости им раньше объявлений результатов. В таком случае, реакция рынка во время непосредственного объявлений гораздо слабее, так как все уже было решено заранее.

В обратном же случае, когда в составе акционеров преобладают частные акционеры, которые полагаются на мнение аналитиков, то новости сначала раскрываются им, чтобы те сделали прогноз, подготовивший акционеров. Реакция рынка снижается, но из-за задержки понимания, реакция рынка может быть продолжительно и сами результаты могут вызвать вторую волну активности.

Для поиска закономерностей, были построены три графика. Первый график отражает общее количество твитов по дням с 1 мая до 23 июня. Второй график показывает количество твитов положительного сентимента. Третий график отражает количество твитов отрицательного сентимента.

Рисунок 5.График твитов по хэштегу #brexit

Рисунок 6. График положительного сентимента по хэштегу #brexit

Рисунок 7. График отрицательного сентимента по хэштегу #brexit

3.5     Тойота

В качестве еще одной выборки для анализа корреляции между активностью в микроблогинговой сетью Twitter и финансовым рядом, был взят график котировок акций Toyota Motor. В отличие от временных финансовых рядов, которые отражают поведение курса различных валют, стоимость акций сильно подвержены влиянию общественного мнения. С этой точки зрения было бы интересно посмотреть, насколько сильно это выражено в микроблоге.

В данном исследовании нет упора на то, какие новости были раскрыты рынку. Разные исследователи ставят проблему определения стоимости акции в зависимости от новости, которая была выдана на рынок. Тогда, при определении влияния, встает вопрос определения окраса новости. Другими словами, как определить, является ли новость хорошей или является ли она плохой.

Одним из методов определения типа новости является метод, предложенный Чаном. Он определяет тип новости в зависимости от изменения доходности акций. Если доходность компании является меньшей, то новость объявляется плохой. Иначе, новость вполне можно считать хорошей. Притамани и Сингал представили другую метрику определения окраса новости. Они определяют тип новости в зависимости от знака скорректированной сверхдоходности. Если знак положительный, то и новость можно считать хорошей. Если же знак отрицательный, то новость плохая.

Другая группа исследователей сосредоточила свое внимание на дивидендах. Котари, Шу и Высоцки в своем исследовании говорят, что новость является хорошей тогда, когда виден рост дивидендов. Если же дивидендные выплаты падают, то новость, которая была объявлена, является плохой.

Третья группа исследователей, например Скиннер и Слоун, строят свою теорию о том, какая новость является хорошей, а какая плохой, в зависимости от ожиданий инвесторов. Высчитывается показатель ES, который равен разности между реальной стоимостью акций и прогнозируемой.

В представленном исследовании не будет выдвигаться теории насчет того, какая из групп исследователей является правой, а какая нет. Напротив, данное исследование можно использовать для дополнения уже существующих теорий. В работе, для определения знака новости используются статистические данные, взятые из сети Twitter. Как известно, резонанс от новости происходит не сразу, в виду скорости распространения информации. Тем не менее, в зависимости от того, какое пропорциональное соотношение между положительными и отрицательными твитами, можно судить об окрасе новости.

Еще один вопрос, который остается открытым и не раскрывается в работе - это вопрос о другой классификации новостей. Новости бывают разных типов - это могут быть объявления о результатах финансового года. Это могут быть новости о внутренних изменениях в компании, новости о слияниях и так далее. Каждая новость будет влиять по-разному на стоимость акций. При исследовании корреляции финансовых рядов и рядов Twitter, не ставился акцент на то, какая новость была опубликована. Рассматривалась лишь реакция пользователей на публикацию. В связи с этим, появляется еще один нюанс.

Как было сказано ранее, имеет значение, для кого публикуются новости. Состав акционеров для разных компаний может быть разным. У одних преобладают большие инвесторы, у других в основном частные инвесторы. Реакция на новости, касающихся компаний в которые инвестируют большие компании, не такая яркая, как у частных инвесторов. Частные инвесторы больше подвержены влиянию в виду своей ограниченности информации и, возможно, опыта и знаний.

В предложенном случае, рассматривается реакция частных инвесторов, так как именно они наиболее активны в микроблоггинговой сети. Поэтому, корреляция стоимости акций будет большей для тех компаний, у которых в составе акционеров преобладают частные инвесторы.

Для анализа были взяты графики положительного сентимента, отрицательного сентимента, а также график котировки акций.

Рисунок 8.График отрицательного сентимента по хэшетгу #toyota

Рисунок 9. График положительного сентимента по хэштегу #toyota

4. Результаты

.1 Фрактальность


В ходе проведения исследования были получены результаты:

Финансовый ряд

Размерность вложения

Размерность D2

Евро-Британский фунт

7

0.0754332

Евро-Японская йена

8

0.166714

Золото

8

0.0965661

Серебро

9

1.38747

Доллар-Японская йена

8

0.671846


Мы получили, что эти ряды имеют конечномерное представление, так как начиная с размерности вложения размерность D2 перестала меняться. По результатам, представленным в таблице, мы можем судить о фрактальной природе рядов. На это указывается то, что размерность D2 не является целочисленной. Этот факт дает нам основание для продолжения исследования. Во-первых, это означает, что данные финансовые временные ряды, да и остальные финансовые ряды, можно каким-либо способ предсказывать и описывать, так как они не являются случайными процессами. Во-вторых, используя то, что финансовые ряды можно предсказывать с помощью математических инструментов, можно использовать методике поиска корреляции с активностью в микроблоггинговых системах.

4.2 Анализ рядов


В ходе качественного анализа графиков получились следующие выводы. Количество сделанных твитов на конкретную дату и построенный график по этим твитам не дает полной картины по поведению временного финансового ряда. При просмотре сентиментных графиков наблюдается интересная зависимость. Был построен график разниц сентиментов (рис. 5) . При изменении знака разницы между положительным и отрицательным сентиментом меняется выпуклость финансового графика. Посмотрим на графики подробнее. На первом графике видно, что 22 октября меняется знак сентимента. А 23 октября график евро-доллар меняет свое направление. В этой точке он достигает своего дня. После этого график не опускался ниже этой точки, а постепенно рос вверх. Мы видим, что изменение сентимента также особо сильно не менялось и не уходило в отрицательную часть графика. Далее рассмотрим другой пример с событием Брексит.

Рисунок 10.График разницы сентиментов по хэштегу #trump

Посмотрим на такой же график разницы сентиментов, построенный на основе запросов по хэштегу #brexit. Тут более сложная ситуация. Так как тут два ряда, на которые все это могло повлиять, то и оценка сложнее. Но, тем не менее, можно рассмотреть несколько ситуаций. Видно, что в целом новость была нейтральна, до 22 числа, когда резко сентимент изменился. Тогда, 23 мая, произошло изменение направления графика. Второе изменение графика сложно объяснить с помощью только одного события. Видимо, там было что-то другое, что повлияло на доллар. Но в день объявления новости, был резкий рост положительных твитов. Это видно и на графике. Начался рост графика. Это продолжилось недолго в итоге. Но резкие перепады настроения на Twitter можно считать сигналом к тому, как поведет себя график. На данном графике сложно сказать, что связь однозначна, но отрицать отсутствие сигналов тоже невозможно.

Рисунок 11. График евро-доллар

Рисунок 12. График разницы сентиментов по хэштегу #brexit

Рисунок 13. График евро-доллар

Обратимся к графику котировок акций Toyota Motor. Обратим внимания на графики сентиментов. Можно заметить два всплеска: 19 июня и 30 июня. Для начала посмотрим на 19 июня. Это очень интересный всплеск, так как он отражен на обоих графиках. Но более ярко он отражен в отрицательном сентименте. После этого всплеска был достигнут максимум на графике за летний период через 4 дня. Опять же, активность в Twitter была сигналом для инвесторов. Скорее всего, произошел какой-то слух о новости, которая произошла 23 июня. Следующий всплеск тоже привел к изменению направления графика, но незначительно. Вполне возможно, что однозначно отрицательная новость не так сильно влияет на стоимость акций. Или же сама новость была не очень важной.

В рассуждениях на эту тему поднимается важный вопрос о новостях. Для акций важно знать, какие новости были опубликованы. Кроме того, не раскрыта информация, каким образом новость была опубликована, как быстро она может повлиять. К этому можно добавить еще и то, что не проведен анализ акций.

Рисунок 14. График котировок акций Toyota Motor

Тем не менее, в результатах есть подтверждение гипотезе, которая была доказана не в одном исследовании рынка акций. Отрицательные новости имеют более сильное воздействие на рынок, нежели положительные. Это можно связать с поведенческой моделью поведения инвесторов. Инвесторы часто очень оптимистично смотрят на события, нежели они на самом деле.

Заключение


В исследовании были использованы временные финансовые ряды. Были даны теоретические выкладки в области теории хаоса. Описаны методы, которые используются в математике, для прогнозирования стохастических рядов. Рассмотрены подходы экономистов к этому вопросу. Также, была описана методология, с помощью которой были получены следующие результаты.

Было доказано, что финансовые ряды, которые были взяты для исследования, имеют фрактальную природу, а не являются случайными процессами. Это был важный момент в исследовании, так как без него продолжение не имело бы смысла. Доказано это было с помощью подсчет корреляционного интеграла. Подсчеты были приведены в разделе результаты и были сделаны при помощи методов программирования. Для подсчета размерности был использован алгоритм Грассбергера-Прокаччиа. Но для исследования, он был немного преобразован, чтобы ускорить вычисления.

В ходе анализа финансовых рядов и рядов Twitter была выявлена связь между сентиметными графиками и поведением временного финансового ряда. Основным выводом в исследовании стало то, что активность в Twitter является сигналом к изменениям в финансовых рядах, отражающих отношения валют. Причем не любая активность, а резкое изменение сентиментоной пропорции. Для более точных результатов, необходимо продолжить исследование в этой сфере и использовать графики для разного рода новостей и разного рода графиков, чтобы исключить перекрестного влияния одной и той же новости.