Материал: Корреляция финансовых временных рядов

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Корреляция финансовых временных рядов

Оглавление

1.   История исследований

2.       Методология

.        Исследование по хэштегам

3.1 Mozdeh

3.2     Watson Analytics

.3       Дональд Трамп

.4       Брексит

.5       Тойота

4.   Результаты

.1   Фрактальность

4.2     Анализ рядов

Заключение

Литература

Приложения

Введение

Деньги играют большую роль в жизни каждого человека. Благодаря деньгам человек может позволить себе развлечения, разнообразие блюд на столе во время обеда и многое другое. В связи с этим появилась необходимость следить за изменениями на финансовом рынке, так как это напрямую влияет на жизнь любого человека. В доказательство можно привести простой пример: многие продукты привозят из-за рубежа, а значит, цена на них формируется из соображений курса рубля. Следовательно, изменения курса рубля влияет на цену продуктов, а, значит, и на уровень жизни человека. Для того, чтобы уберечь себя от неожиданных случаев появились специалисты, которые прогнозируют поведение финансовых графиков. Этим объясняется актуальность данной работы.

Агентами, которым будет полезна работа являются биржи. Впервые финансовая биржа появилась еще в 16 веке. Тогда она сильно отличалась от существующей сейчас. Там не встречалось большого количества фирм, которые бы предлагали их ценные бумаги. Первая биржа появилась для торговли перцем. В основном именно цена на перец и была показателем, на которые все смотрели. Затем, в Англии появилась биржа ценных бумаг, которые существовали для работы с бумагами государства. В последствии это направление развивалось, и первая биржа в России появился в 1703 году.

На бирже наблюдают за изменением котировок и других различных величин, но их так же можно и просчитать. Цель данной работы выяснить, являются ли финансовые временные ряды стохастическими рядами или же они имеют хаотическую природу и определить, как активность в социальных сетях влияет на финансовые временные ряды. Под временными рядами в работе понимается набор наблюдаемых данных изменения некой величины во времени. Объектами исследования являются финансовые ряды отношения евро-доллар, евро-йена и другие ряды, включая график изменения цены на золото.

Предсказывание финансовых временных рядов является очень сложной задачей и на сегодняшний день нет способа предсказать точно хотя бы поведение графика. Работа направлена на решение данной проблемы. Новизна работы заключается в использовании социальных сетей, а именно микроблога twitter. Данные из социальных сетей использовались как источник данных для других методов, но активность по тематике и математическую интерпретацию данных социальных сетей не рассматривали как отдельный вид данных.

В работе используется только качественный сравнительный анализ данных. Математическая интерпретация сложный процесс, который требует времени и большого количества актуальных данных. В рамках работы нет возможности использовать такие данные, поэтому для решения проблемы используется качественный анализ на поиск зависимости.

Для исследования используется система Twitter. В рамках работы с системой используются следующие термины: хэштег и твит. Твит - это сообщение, которое создается пользователем для распространения информации всем остальным пользователям, которые его читают. Хэштег - это название знака «#». В Twitter отождествляется со словом после знака «#».

Данную работу можно использовать как для проведения собственного анализа поведения временных рядов, так и для профессиональной деятельности в игре на бирже. Работа позволит угадывать поведение графика с высокой точностью.

1. История исследований

Временными рядами занимались многие ученные. Все началось еще со временем Пуанкаре. Он первый заметил, что при анализе сложного поведения обычные методы не подходят, они попросту не работают. И тогда перед ученными встала задача на исследование устойчивости, геометрической структуры и других показателей различных систем. Такой подход не позволяет представить решение в явном виде, зато позволяет качественно оценить представленную систему.

Помимо Пуанкаре, свой вклад в развитие теории хаотических моделей ввели советские математики А.Н.Колмогоров, В.И.Арнольд и немецкий математик Ю.К.Мозер. Пуанкаре доказал теорию о возвращении. В википедии это теория звучит следующим образом:

Рисунок 1. Формулировка теоремы о возвращении

А.Н.Колмогоров, В.И.Арнольд и Ю.К.Мозер сформулировали теорию КАМ (теорию Колмогорова-Арнольда-Мозера). Эта теория относится к теории хаоса, так как гласит о почти периодических системах с малыми возмущениями. Теория помогла решить вопрос об устойчивости солнечной системы. Формулировку этой теоремы можно считать началом развития теории хаоса.

Важной фигурой в развитии теории хаоса можно считать Э.Н.Лоренца. Он и Пуанкаре первые сформулировали известный на сегодняшний день «эффекта бабочки». Естественно, они сформулировали это правило по-разному, но смысл, которые они вложили в свои формулировки один и тот же.

Также, следует отметить еще одну персону в теории хаоса. А.М.Ляпунов, который сформулировал центральную предельную теорему и ввел критерии устойчивости в теории хаоса. Исключительно важная фигура в теории хаоса, работы которого сложно переоценить.

Первое печатное издание по использованию теории хаоса в финансовой сфере можно отнести книгу Эдгара Петерса «Хаос и порядок на рынке капитала». Это был новый подход к изучению финансовых рынков. Позднее, появилось новое понятие в математическом исследовании временных рядов - фрактальная природа ряда. Применение фракталов стало следующим шагом и начало развитие сравнительно недавно.

На сегодняшний день существует множество способов прогнозирования временных рядов. В основном эти способы предназначены для рядов, которые можно представить в виде математической системы с множеством переменных. Для прогнозирования таких систем применяют стохастические методы прогнозирования. Методы, применяемые для финансовых временных рядов, описал в своей книге «Финансовая математика» Альберт Николаевич Ширяев. Он описал в своей книге регрессионный и авторегрессионный анализ стохастических рядов. Использование нейросетей для стохастического анализа и многие другие методы, которые, если верить его словам, на самом деле не работают. Это показали его последние исследования в этой области. Оказалось, что нельзя выразить финансовые ряды только с помощью математических переменных. Точнее не все переменные можно определить через график, а поэтому и нельзя интерпретировать. Зависимость найти можно, а от чего зависит понять невозможно.

Дмитрий Возный, автор книги «Код Эллиотта: волновой анализ рынка Forex» 2006 года, рассказывает в своей книге про анализ финансового рынка. Автор подходит к анализу графиков с точки зрения экономики. Сама наука экономика - это смесь социологии, психологии и математики. Поэтому именно экономисты помогли определить такие закономерности, как повторение истории. В своей книге Дмитрий приводит множество примеров того, как фрагменты графиков схожи между собой, хотя они совершенно из разных периодов. Эти все примеры и доказывают принцип повторения.

Второй принцип, который в книге указывает и который был применен в работе, это влияние факторов. По мнению экономистов, на финансовые графики влияет буквально все. Чтобы не произошло, это точно найдет отражение в поведении графика. Поэтому слежение за новостями является одной из главнейших задач каждого трейдера.

Далее в книге рассказываются методы, при помощи которых экономисты исследуют графики. Одним из таких методов являются Закон волн Эллиотта. Это математический метод анализа графика на экстремумы. Этот метод является также качественным, так как позволяет лишь определить поведение графика. Тем не менее, несмотря на эффективность способа, его достаточно сложно применить на практике даже специалистам. Поэтому экономисты пользуются методом рыночных плеч, который, как показывает практика, не отличается точностью предсказаний. Используя этот метод сложно определить, где начинается плечо, а где просто случайный скачок.

Фишер Блэк в публикации «Шумовая торговля» обозначил новый термин, который использовал в названии статьи. Он считает, что есть тип трейдеров, которые используют не фактическую информацию, а лишь шум. Шум - это помехи или излишек информации, который искажает ее. «Шумовая торговля - это торговля на шуме, воспринимаемом так, как если бы шум был бы информацией. Люди, торгующие на шуме, будут торговать даже тогда, когда объективно они должны были бы воздерживаться от этого. Возможно, они считают, что шум, на основе которого они торгуют, является информацией. Или, возможно, им просто нравится торговать». Хотя Ф. Блэк не указывает, каких операторов следует относить к категории «шумовых трейдеров», в работе Де Лонга, Шляйфера, Саммерса и Вальдмана можно найти описание таких участников рынка. Шумовые трейдеры ошибочно полагают, что у них есть уникальная информация о будущих ценах на активы. Источниками такой информации могут быть ложные сигналы о несуществующих трендах, подаваемые индикаторами тех. анализа, слухи, рекомендации финансовых «гуру». Шумовые трейдеры сильно переоценивают значение имеющейся информации и готовы принимать на себя необоснованно большой риск. Проведённые эмпирические исследования также указывают на то, что к шумовым трейдерам в первую очередь следует отнести индивидуальных инвесторов, т.е. физических лиц. Более того, именно эта группа трейдеров несёт систематические убытки от торговли из-за иррациональности своих действий. Для западных фондовых рынков эмпирическое подтверждение этого явления можно найти в исследованиях Барбера и Одина, а для операторов российского фондового рынка - в работе И.С. Нилова. Теория шумовой торговли позволяет объяснить и феномен Р. Шиллера. Именно иррациональные действия трейдеров вызывают чрезмерную изменчивость цен.»

Это открытие продвинуло изучение и прогнозирование финансовых рядов. Использование другими игроками разного рода шума означает, что его влияние недооценивали и влияние шума на результат гораздо выше, чем предполагалось ранее. Работа с социальными сетями как раз и предполагает, что шум, который используют трейдеры, усиливается в микроблогах и его легче отследить.

2. Методология

финансовый ряд прогнозирование

В ходе исследования использовался метод Такенса. Временные ряды представляют собой набор зафиксированных данных. Поэтому достаточно затруднительно ответить на вопрос, какое количество переменных содержит данная функция и какая взаимосвязь между ними. Метод Такенса или, как его еще называют, метод погружения позволяет решить данную проблему.

Для использования метода Такенса требуется временной ряд, длина которого заведомо превышает размер пространства. Далее, будем использовать вектора, предполагаемой размерности пространства, каждая координата которого будет зафиксированное значение временного ряда, взятое через промежуток t. Заметим, что данный промежуток един для всех значений ряда. Тогда, каждое значение координаты вектора будет представлять себе значение отдельной переменной и эти значение можно будет использовать для воспроизведения системы, порождающей временной ряд.

Далее, для просчета корреляционной размерности, которая относится к разряду фрактальной размерности, был использован алгоритм Грассбергера-Прокаччиа. Проблема алгоритма в том, что он требует достаточно большое количество данных, а значит и оценка времени работы алгоритма относительно большая. Суть заключается в том, чтобы с помощью алгоритма Такенса искусственно создать векторы из данных и найти количество векторов, расстояние между которыми меньше заданной величины. Для отбора количество векторов использовалась функция Хевисайда.

Для вычисления расстояния было выбрано Манхеттенское расстояние. Выбор был сделан по двум причинам: алгоритм позволяет использовать это тип вычисления расстояния для оценки ряда без потерь для вычислений, а второе, реализация с использованием этого принципа вычисления расстояния работает быстрее. При реализации алгоритма приходится большое количество раз вычислять расстояние. При использовании этого расстояния, количество новых вычислений можно сократить, используя принцип динамического программирования.

После получения результата, был проведен анализ на местность, на которой график ведет себя как линейная функция. Размерность, при которой не перестает меняться угол наклона линейной функции, и будет являться размерностью пространства.

Изучив ряды на фрактальность, можно говорить о построении системы, согласно теории хаоса. Изучение природы ряда крайне важно в дальнейшем развитии работы. Природа ряда повлияет на модель, которая будет выбрана для проведение количественного анализа. Количественный анализ - это следующий шаг в развитии данной работы.

3. Исследование по хэштегам


Для нахождения закономерность в поведении финансовых временных рядов и активность в микроблоге Twitter, необходимо использовать дополнительное ПО, чтобы извлечь информацию из Twitter. Получение необходимой информации является самой по себе не простой задачей, так как в открытом доступе данных по всей системе Twitter нет. Большинство программ, которые представлены в просторах интернета, являются программами индивидуального пользования. Эти программы чрезвычайно полезны для SMM маркетологов, индивидуальных предпринимателей, блогеров - для тех, кому важно знать статистику по своему аккаунту и по активности подписчиков.

Другие сервисы, которые вполне могли подойти для решения задачи, имели некоторые ограничения. Стоит рассмотреть эти ограничения в отдельности. Так как программ по сбору статистики по всему Twitter не особо много, то сервисы, которые могли собрать такого рода информацию вполне обоснованно просят за доступ к их данным денежную плату. В основном это платная подписка сроком на 1 месяц или год. Безусловно, данные, которые там имеются, стоят того, чтобы за них заплатили, если бы не следующее ограничение.

Сервисы предоставления информации по активности в представленном микроблоге могут предложить информацию по количеству твитов по определенному хэштегу, что и требуется в данном исследовании, но только за ограниченный период времени. Это не было столь существенной проблемой, если бы этот промежуток времени можно было бы выбрать, но ограничение по времени берет свой отсчет от сегодняшнего дня. Другими словами, информацию можно получить лишь за последний период, что не является удобным в рамках исследования рядов.

Последнее ограничение, которое помогло принять окончательное решение по поводу выбора системы - это наличие сентиментного анализа. Сентиментный анализ является подходом к сегментации твитов. Все твиты можно разделить по эмоциональному окрасу. На начальном этапе не предполагалось его использования, так как сравнительное небольшое количество сервисов может его предоставить, и наличие подобного анализа для Twitter не было известно. Далее, использование такого подхода стало ключевым.

В итоге, кандидатами для использования оказалось две системы. Первая система - это Watson Analytics от компании IBM. Вторая система - это приложение для ПК под названием Mozdeh.

.1       Mozdeh

Разработчики этой программы позиционируют свой продукт как программу способную анализировать временные ряды Twitter. На первый взгляд прекрасно подходит для решения поставленной задачи. К программе есть понятная инструкция с приведенными примерами. Имеются различные варианты поиска твитов. В настройках поиска можно найти такие вариации настроек как поиск по ключевым словам, поиск у конкретных пользователей.

После поиска с полученными данными можно построить большое количество графиков. Это, естественно, временной график и сентиментные графики. Помимо основных в рамках исследования графиков, существует еще огромное множество показателей, которые выводятся по данному временному ряду из Twitter. Например, это часто встречающиеся слова, словарь используемый по дням и другие. Отличный инструмент для проведения анализа рядов и поиска информации, если бы не один нюанс. При поиске данных нельзя выбрать период поиска данных. Чаще всего он ограничен последними двумя неделями или, как утверждают разработчики, ограничением в 11 000 твитов. Для подобного рода исследований это чрезвычайно мало, поэтому было решено выбрать вторую систему.