Дипломная работа: Количественный рекуррентный анализ в обнаружении экстремальных событий в социальных сетях

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

· статистики времени возврата и времени повторения [1].

Рисунок 2. Отображение Пуанкаре (а), график разделения пространства и времени (б)

Постоянный рост вычислительной мощности позволил проводить еще более интенсивные компьютерные исследования, такие как попарное сравнение всех возможных комбинаций пар ряда данных. Это можно сделать с помощью матрицы сходства, являющейся графическим представлением сходства всех парных комбинаций в рассматриваемых рядах данных.

Работа Краскала в 1960-х годах [20] была одной из самых цитируемых работ в области статистики и глубоко затронула многие области исследований от экологии до психологии и экономики. Все эти области казались отдельными физическими науками, поэтому оценка этих работ в физике оставалась ограниченной. Тем не менее, эти авторы глубоко исследовали и использовали этот подход для анализа пространств расстояний, позволяющих непредвзято представлять практически все виды данных без какого-либо ограничения их характеристик. Таким образом, они проложили путь к признанной в настоящее время способности рекуррентных методов справляться с нестационарными, нелинейными и относительно короткими рядами данных.

С увеличением интенсивности применения компьютеров с 1970-ых до 1980-ых разными науками были заново исследованы матрицы подобия, а потому для одного и того же метода имеются разные названия. Спустя несколько лет результаты данных исследований превратились в рекуррентную диаграмму.

Теперь цель состояла в том, чтобы сравнить все возможные состояния, представленные многомерной фазовой траекторией. Если траектория проходит через область в фазовом пространстве, который она прошла ранее, то считаем её повторением. Повторение означает, что текущее состояние как-то похоже на прежнее состояние. Таким образом, рекуррентные диаграммы в действительности не являются чем-то новым. Но Экман с соавторами сразу отметили, что на таких диаграммах можно обнаружить дополнительную важную информацию, к примеру, детерминизм, расхождение и дрейфующее поведение. Они также заявили, что длины структур диагональных линий в рекуррентных диаграммах связаны с положительным показателем Ляпунова.

Используя матрицу подобия в качестве инструмента для визуализации повторений многомерных траекторий фазового пространства, Экман не планировал открыть новое направление в нелинейном анализе данных. Тем не менее, 1987 год считается рождением рекуррентных диаграмм и их количественной оценки как современного инструмента нелинейного анализа данных.

Спустя некоторое время (не позднее 1992 г.) разные авторы независимо друг от друга ввели другой тип представления рекуррентность [29]. Они сравнивали не все возможные временные точки, а только данное время в прошлом и будущем (рисунок 3). Здесь появилось еще одно название: график приближённого возвращения. Такое представление может быть более интуитивным, особенно для начинающих, потому что линейные структуры рекуррентной диаграммы будут параллельны оси X.

Рисунок 3. Рекуррентная диаграмма

Эти первые годы характеризовались довольно редким применением этого метода (рисунок 4). Появление рекуррентных диаграмм в публикациях было достаточно экзотично.

Более того, до этого момента рекуррентные диаграммы были всего лишь инструментом визуализации, что приводило к недостатку, заключающемуся в том, что пользователь должен был обнаруживать и интерпретировать закономерности и структуры, выявленные рекуррентной диаграммой. Низкое разрешение экрана и принтера еще больше усугубило эту проблему. Чтобы преодолеть эту субъективную часть метода, начиная с конца восьмидесятых годов Збилут и Уэббер пытались дать количественную оценку структурам данной диаграммы. Сначала они просто определили плотность точек повторения и изучили гистограмму длин диагональных линий [56,58,60]. В последующие пять лет они ввели известные показатели сложности, основанные на диагональных линиях структур рекуррентных диаграмм, и вместе с тем создали рекуррентный количественный анализ с несколькими мерами:

- процент повторения или частота повторения

- процент детерминизма

- максимальная длина линии и расхождение

- энтропия Шеннона распределения длин линий

Полезность этих мер была продемонстрирована увеличением числа приложений для реальных данных. Однако до 1995 года в публикациях появлялось лишь несколько приложений рекуррентных диаграмм и рекуррентного количественного анализа.

В начале девяностых годов Уэббер предоставляет свободно доступное программное обеспечение (RQA Software), которое может использоваться для вычисления RP и мер RQA. В 1996 году Кононов запустил программу Visual Recurrence Analysis (VRA), которая имеет удобный графический интерфейс и вычислительные усовершенствования. Поэтому это программное обеспечение довольно популярно. Пакет TISEAN, предоставленный немецкими авторами, также был одним из первых пакетов программного обеспечения, способным рассчитывать RP (но без количественного определения, только RP).

Рисунок 4. Количество публикаций по рекуррентному анализу

В качестве следующего этапа развития стоит отметить введение зависимости от времени в RQA. Меры RQA рассчитываются по окнам, перемещаемым вдоль главной диагонали рекуррентной диаграммы. Это позволяет изучать эволюцию мер RQA во времени [57]. Было показано, что при таком подходе можно было бы обнаружить переходы в динамических системах. В этот момент могут быть обнаружены только переходы между регулярной и нерегулярной динамикой (например, переходы порядок-хаос, устойчивость-неустойчивость). В том же году вышла публикация с многообещающим названием «Recurrence plots revisited» [3]. В ней было предложено использовать RP для восстановления движущей силы динамических систем и представлена идею мета-рекуррентных графиков, основанных на суммировании окон и корреляции.

Основная методологическая работа по RP и RQA в течение 1990-х была выполнена группой вокруг Збилута и Уэббера в Чикаго. С середины 1990-х годов научное сообщество все больше и больше осознавало преимущества рекуррентных диаграмм, что демонстрирует постоянно растущее число публикации между 1996 и 2004 годами.

К концу 1990-х годов появились первые теоретические исследования рекуррентных диаграмм, касающиеся их связи с динамическими инвариантами и сохранения топологии. Макгвайр аналитически продемонстрировал, что матрица расстояний как основа RP сохраняет всю информацию для реконструкции ряда данных, лежащих в их основе [28]. Связь между столбцами RP и мерой информации обсуждалась Гао и Цаем [10].

В 1999 году в качестве уточнения для оценки расходимости состояний было предложено перпендикулярная рекуррентная диаграмма [4]. В данном случае повторение определяется с использованием дополнительного условия, которое гласит, что точки повторения должны лежать на плоскости, которая перпендикулярна траектории фазового пространства исходной точки. Изо-направленная рекуррентная диаграмма, введенная в 2002 году, следует в том же направлении [15]. Её дополнительное условие требует, чтобы периодические траектории фазового пространства развивались параллельно, то есть в одном и том же направлении. К сожалению, эти варианты рекуррентных диаграмм не особо популярны, скорее всего, из-за их слишком больших требуемых вычислительных мощностей.

Также в связи с переходом в новое тысячелетие метод рекуррентных диаграмм был распространен и на кросс-рекуррентные диаграммы (cross-recurrence plot, CRP) [25]. Это двумерное расширение проверяет одновременные появления похожих состояний в двух разных системах. Затем, что вполне логично, последовал и кросс-рекуррентный количественный анализ. Этот метод может использоваться для обнаружения детерминированных сигналов и для изучения сложных взаимосвязей между различными системами. В нём были представлены варианты мер RQA, основанные на задержке. Кроме того, кросс-рекуррентные диаграммы оказались довольно иллюстративными для изучения различий или трансформации временных шкал подобных наблюдений.

С появлением CRP появился свободно доступный CRP Toolbox для MATLAB, написанная Марваном. Этот набор инструментов не зависит от платформы и содержит практически все инструменты и меры, связанные с RP. Примечательно, что в это время начало появляться и коммерческое программное обеспечение, которое включает по крайней мере вычисление RP, к примеру, Dataplore (ixellence GmbH, Германия).

С новым тысячелетием в RQA были добавлены дополнительные меры сложности. Марван ввел меры, основанные на вертикальных линейных структурах в RP, которые назвали замиранием и временем захвата. С помощью этих мер удалось обнаружить переходы хаос-хаос.

В то же время в биоинформатике для исследования пространственной структуры биополимеров использовались RP и RQA [12]. На самом деле, это было довольно глубокое изменение в применении данных методов, потому что они уже анализировали не временные ряды, а пространственные ряды или даже пространственные структуры.

В период с 2002 по 2006 год Романо и Тиль опубликовали несколько новаторских статей, связанных с различными аспектами RP. Они теоретически обосновали выбор порога повторяемости для данных с наблюдательным шумом и смогли аналитически описать RP для шума [46]. Они объяснили связь между длинами диагональных линий и динамическими инвариантами [50]. Эта работа привела к дальнейшим исследованиям влияния вложения [23].

В 2004 году было введено реальное многомерное расширение RP, общая рекуррентная диаграмма (joint recurrence plot, JRP) [51]. JRP проверяет одновременное возникновение повторений в разных системах и является подходящим средством для обнаружения общей синхронизации [47]. Романо и соавторы продемонстрировали, как использовать основанную на задержке меру RQA для обнаружения фазовой синхронизации даже для нефазных когерентных генераторов [49]. Этот метод может быть использован для определения направления связи между системами [48].

Как видим, основную часть теоретической и методической работы в начале века выполняла группа из Марвана, Романо и Тиля в Потсдаме. В результате в 2005 году в Потсдаме, Германия (33 участника) был организован первый международный семинар, посвященный исключительно рекуррентным диаграммам.

Работа Потсдамской группы была продолжена Зоу, Нгамгой и Шинкелем, которые работали над теоретическим подходом для рекуррентности квазипериодических систем [52] и для различных типов переходов.

Частота дискретизации колебательных сигналов может иметь важное значение для обнаружения рекуррентности [8]. При определенных условиях в RP могут появляться большие промежутки, где фактически должны быть точки повторения. Этот притворный недостаток действительно может быть полезен для обнаружения незначительных изменений частоты в колебательных сигналах, которые не видны при стандартном спектральном анализе.

Второй международный семинар по RP был организован в 2007 году, на этот раз в Сиене, Италия (44 участника).

В 2008 году Рохде с соавторами обнаружил связь статистических свойств матрицы расстояний с дисперсией и ковариацией (по крайней мере, для случайных процессов) [38]. Кришнан рассматривал RP с совершенно другой точки зрения [19]. Он подчеркнул тот факт, что RP можно рассматривать как матрицу смежности сложной сети, позволяющую проводить топологический анализ сетей или графов с помощью RQA. Этот подход особенно интересен во многих междисциплинарных научных исследованиях.

Последующие работы во многом связаны именно с различными областями применения рекуррентных диаграмм и количественного рекуррентного анализа. Главным образом, в финансовом секторе для прогнозирования экстремальных событий или предсказательных моделей.

Часть темы работы посвящена обнаружению экстремальных событий, а потому стоит остановиться на них чуть подробнее.

Множество динамических систем в природе и технике демонстрируют скачкообразное поведение в виде экстремальных событий. Эти крупные сдвиги имеют значительные последствия и важны для статистического прогнозирования. Экстремальные события количественно определяются с помощью определенных наблюдений над динамическими системами, которые демонстрируют эпизодические всплески со значениями, равными нескольким стандартным отклонениям. Кроме того, существование экстремальных событий по своей природе связано с соответствующей функцией плотности вероятности (probability density function, PDF) наблюдения, которая характеризуется свойствами тяжелого хвоста.

Экстремальные события - это события, встречающиеся не столь часто, но возникает вопрос: любое ли редкое событие является экстремальным? Проведем неформальное различие между ними. Редкое событие, по определению, является получение случайного эксперимента с очень низкой вероятностью. Получение одного и того же числа при броске кубика шесть раз подряд имеет очень низкую вероятность. Однако специального динамического механизма, связанного с его возникновением, не существует. Это результат чистой случайности. Такие редкие события должны быть отделены от более особого понятия экстремальных событий, которые в контексте данной работы будут рассматриваться как редкие события, вызванные динамической нестабильностью. В частности, экстремальные события могут быть вызваны нестабильностью. Такие временные неустойчивости относятся к случаю, когда конечный временной показатель Ляпунова системы становится положительным, но только для определённого временного интервала. В этом смысле экстремальные события являются частным случаем редких событий, и поэтому важно подчеркнуть их особые свойства:

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_11_А. Франс для эл версии
_индив анализ данных
_РГР № 3