Дипломная работа: Твиттер как нелинейная динамическая система

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Факультет бизнеса и менеджмента

Школа бизнес-информатики

Выпускная квалификационная работа - БАКАЛАВРСКАЯ РАБОТА

по направлению подготовки Бизнес-Информатики студента группы ББИ144

образовательная программа «Бизнес-Информатика»

ТВИТТЕР КАК НЕЛИНЕЙНАЯ ДИНАМИЧЕСКАЯ СИСТЕМА

Сомов Александр Евгеньевич

Научный руководитель

д-р. физ.-мат. наук., проф.

Дмитриев А.В.

Москва 2018

Оглавление

Введение

Актуальность

Методологические предпосылки исследования

Цель исследования

Задачи исследования

Объект исследования

Предмет исследования

Методы исследования

Практическая значимость результатов

Краткое описание структуры работы

Обзор литературы

Обоснование выбора литературы

Литература

Предметная область

Ключевые термины и определения

Данные

Способ получения

Описание полученной выборки

Принадлежность сети к классу сложных и наличие фрактальности с точки зрения структуры

Сложность сети

Фрактальность

Наличие у системы фрактальности с точки зрения временного ряда

Признаки фрактальности временного ряда

Вычисление основных индикаторов фрактальности временного ряда

Выводы

Моделирование процесса работы системы

Использование модели как инструмента политической борьбы

Заключение

Список использованной литературы

Введение

Актуальность

За последнее десятилетие социальные сети превратились из средств коммуникации в огромные СМИ, которые оказывают значительное влияние на население в целом. В частности, политические стратеги заинтересовались этим явлением как одним из инструментов в гонке за голоса избирателей (McClurg, Scott, 2003). Широко известно, что ряд современных лидеров демократических стран добился победы через социальные сети. Недавним сенсационным примером является избрание президента США Дональда Трампа. Это не случайно, потому что в Twitter люди делятся своими мнениями и формируют свои взгляды на основе информации, которую они используют из разных источников. Это можно использовать, создавая точки воздействия информацией, которые будут влиять на приверженность определенных социальных групп тому или иному политическому лидеру. Доказательством способности точно определять факторы и силу, которая влияет на данное значение с определенной вероятностью, является необходимой основой для практической реализации такого информационного воздействия как политическими стратегами, так и маркетологами, исследователями и другими.

Моделирование процессов, происходящих в социальных сетях, является сложной, но в то же время теоретически и практически важной научной проблемой. Результаты и выводы, которые могут быть сделаны с использованием моделей социальных сетей, позволяют определять, сможет ли социальная сеть оставаться стабильной при внутреннем и внешнем информационном воздействие, выявлять различные способы формирования сообществ и выяснять практические способы управление социальной сетью. Моделирование социальных сетей может иметь широкий масштаб применений: может быть полезно для процессов принятия решений при разработке краткосрочных и долгосрочных маркетинговых стратегий, разработке систем рекомендаций, прогнозировании спроса, а также задачах, связанных с национальной безопасностью (Dmitriev, Dmitriev, Tsukanova, Maltseva, 2017).

Методологические предпосылки исследования

Структура функционирования Twitter по своей системе напоминает другие системы, которые неоднократно были изучены другими областями науки. Что позволяет предположить, что используя различные уже изученные в других областях научные методы можно рассмотреть, как практически использовать социальную сеть, для воздействие на массовое сознание. Например, устройство Twitter хорошо ложится на теорию сложности, теорию хаоса и нелинейную динамика. Эти направления изучения могут с большой эффективностью моделировать и прогнозировать поведение современного общества в контексте соц. сети. Сложной в математике считается система, которая одновременно обладает пятью-шестью признаками. Предыдущие исследователи (Dmitriev, Dmitriev, Tsukanova, Maltseva, 2017) о проблеме сложности Twitter доказали одновременное присутствие максимум трех из пяти-шести особенностей сложности, что потенциально дает основания для дальнейшего исследования данной проблемы. В частности, одним из разделов теории сложности является теория сложных сетей. В данной работе в качестве дальнейшего изучения проблемы сложности Twitter будет проведен анализ структуры Twitter на предмет того, является ли она сложной сетью.

Цель исследования

Цель данного исследования заключается в построение динамической модели Twitter и определения значений ключевых факторов, при которых состояние сети радикально меняется. Для доказательства такой потенциальной возможности изменения нужно доказать наличие определенных свойств в социальной сети.

Задачи исследования

Ключевыми задачами для достижения поставленной цели являются:

1. Рассмотреть социальную сеть Twitter с точки зрения двух направлений: сложность сети Twitter и анализ изменения количественных показателей

o Сложность сети Twitter

§ Анализ структуры сети Twitter и определение является ли Twitter по структуре сложной сетью через доказательство наличия пяти-шести признаков сложности

§ Определение типа сложной сети, к которому принадлежит Twitter

o Доказать наличие признаков сложности у временного ряда количественных показателей Twitter

2. Построить динамическую модель сети Twitter

3. Определить ключевые факторы и их начальные значения, которые приводят к радикальным изменениям в топологической и временной структуре Twitter

Объект исследования

twitter динамический сеть временный

Объектом данного исследования является социальная сеть Twitter, с точки зрения некоторой структуры, внутри которой могут быть созданы агенты влияния на массовые решения. Автор данного исследования хочет рассмотреть социальную сеть, с научной точки зрения, для возможности детерминировать те практические способы взаимодействия с сетью, при которых могут быть использованы ее свойства в целях взаимодействия с общественным мнением.

Предмет исследования

Автором данного исследования, в качестве предмета исследования, будут рассмотрены два направления признаков социальной сети. С одной стороны для понимания возможности применения практических научных методов воздействия на социальную сеть нужно доказать является ли Twitter сложной фрактальной сетью. С другой стороны для понимания возможности применения практических научных методов к данной сети будет необходимо рассмотреть количественные показатели соц. сети в процессе их изменения, для этих целей будут использован методы анализа мультифрактальных временных рядов. На основе полученных данных от двух направлений признаков будет возможным смоделировать процессы функционирования соц. сети.

Методы исследования

Для изучения поставленной проблемы, автору исследования необходимо изучить существующие подходы к сложным сетям и их моделирование. Таким образом, в работе будут применены следующие исследовательские методы:

· анализ литературы

· изучение существующих сложных систем

· изучение существующих моделей сложных систем

· практические расчеты и моделирование

· теоретический анализ и синтез

Практическая значимость результатов

Предыдущими исследователями данной проблемы был описан ряд вопросов по продолжению и улучшению исследования (Dmitriev, Dmitriev, Tsukanova, Maltseva, 2017). В рамках данного исследования автор собирается расширить и уточнить предыдущий опыт, тем самым создав исследование с более расширенной научной обоснованностью.

Краткое описание структуры работы

Во введении описана актуальность работы и методологические предпосылки исследования, поставлена цель и задачи, раскрыты объект, предмет, методы исследования, а также практическая значимость работы.

В первой главе раскрыта предметная область и заданы ключевые термины и определения данной области, приведен литературный обзор.

Во второй главе будет проведено изучение структуры Twitter на предмет сложности и мультифрактальности. Также в этой главе будут построены временные ряды по данным из сети.

Третья глава посвящена моделированию сети Twitter и экспериментам относительно влияния на модель.

В заключении представлены результаты исследования, а также описаны возможные пути развития и дополнения.

Обзор литературы

Обоснование выбора литературы

К сожалению, изучение предметной области данного исследования крайне размыто в плане литературы, так как область исследования новая. В контексте проблемы существует достаточно большое количество точек зрения и с уверенностью утверждать о их правомерности сложно, поэтому автор исследования будет опираться на более классические и общепринятые работы, а также на работы, которые максимально близки к предмету данного исследования.

Автор этого исследования проанализировал несколько источников. Концепция теории сложных систем, сложившаяся из недостаточно формализованных понятий, которые изначально были более абстрактными, позже стала изучаться для применения в более практических задачах, стала описываться строго математическими средствами. Из-за появления более практичных средств анализа сложных систем мы можем изучить конкретные явления, напоминающих сложные системы. Ниже в тексте будут представлены несколько важных работ, имеющих отношение к этому исследованию. Следует отметить, что изучение сложных систем является прерогативой недавнего прошлого. За последнее десятилетие появилось несколько знаковых работ, в которых было предложено несколько новых способов доказательства мультифрактальности системы как с точки зрения топологии ее структуры, так и с точки зрения изменения количественных характеристик с течением времени.

Литература

В статье «A Nonlinear Dynamical Approach to the Interpretation of Microblogging Network Complexity» Андрея Дмитриева, Виктора Дмитриева, Ольги Цукановой и Светланы Мальцевой (2017 г.) была рассмотрена сложность Twitter в терминах временных рядов, представляющих изменения характеристик социальной сети. Это доказало существование основных показателей сложности системы: масштабную инвариантность, тенденцию к катастрофам и неравновесное состояние. В результате было получено, что временные ряды Twitter имеют распределение вероятностей энтропии Tsalis (q-экспоненциальной), что также позволяет говорить о социальной сети Twitter как о классе сложных систем. Они были дополнительно смоделированы по уравнению Каулакиса, которое хорошо подходит для описания сигналов и, следовательно, временных рядов (Дмитриев, Дмитриев, Цуканова, Мальцева, 2017).

В статье «Investigation into the Regular and Chaotic States of Microblogging Networks as Applied to Social Media Monitoring» Андрея Дмитриева, Виктора Дмитриева, Ольги Цукановой и Светланы Мальцевой (2016 г.) более подробно рассмотрены вопросы, которые описаны в статье выше, а также приведен подробный анализ моделирования микроблогов. Работа посвящена исследованию эволюционной динамики социального микроблога. Рассмотрены различные состояния сети: регулярные и хаотические. В статье предложена и обоснована новая модель социальной сети микроблогов: точечная диссипативная система. Представлены динамические переменные такой системы по вариациям числа твитов / ретвитов вокруг равновесного значения. Указывается, что система находится в условиях асимптотически устойчивого равновесия, когда значения интенсивности внешней информации малы (количество твитов в конечном итоге стремится к его равновесному значению). Когда значения интенсивности внешней информации не превышают критическое значение, в системе микроблога наблюдается стабильность (почти гармоническая), происходят колебания твитов. Если интенсивность значения внешней информации превышают критическое значение, тогда следует наблюдать хаотические колебания твитов.

В статье «Multifractal analysis of complex networks» Wang Dan-Ling, Yu Zu-Guo и Anh V (2012) предлагается новый алгоритм построения полей для вычисления фрактальной размерности связанного графа, что позволяет принять или отклонить гипотезу мультифрактальности сети. Этот алгоритм был протестирован на четырех разных типах сетей: искусственных сетях без малейших сетей, сетях малого масштаба и случайных сетях, а также сети взаимодействия белка и белка на основе реальных данных. В результате исследования была продемонстрирована мультифрактальность в сетях artificial scale-free, small world, random и на сети protein-protein interaction (Dan-Ling, Zu- Guo, V, 2012).

В статье «Fractal Characterization of Complex Networks» (2015) Roland Molontay («Фрактальная характеристика сложных сетей») рассмотрел теорию фрактальных сетей, он не продвигает одну цель: пересмотреть основные достижения в этой области, наоборот, он продвинул исследование и обработал недостаток математического строгости соответствующих статей и предлагал различные подходы к уточнению понятий. В начальных главах рассматривались основные понятия теории сложности: фрактальность и автомодельность, и было доказано, что эти характеристики присущи любой сложной сети. Проведен обзор предыдущих работ, посвященных изучению этих характеристик, а также их точная математическая формализация и устранение дефектов, сделанных предыдущими исследователями. Кроме того, был исследован базовый алгоритм покрытия полей, чтобы доказать существование фрактальности и автомодельности, модификации которых могут быть успешно использованы для доказательства сложности реальных систем и сетей. Далее в статье автор рассмотрел дальнейшие размеры сети в дополнение к фрактальной размерности: метрическую размерность, фрактальную размерность кластера и т. д. Это дало возможность более глубокого понимания природы сложных сетей с использованием этих новых характеристик. Основным результатом этой работы стала формализация понятий фрактальности и самоподобия и исчерпывающий список методов и характеристик, которые помогают анализировать и описывать сложные сети (Molontay, 2015).