Дипломная работа: Факторы, определяющие распространение рекламных сообщений на платформе YouTube

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Факультет Санкт-Петербургская школа экономики и менеджмента

Департамент менеджмента

Выпускная квалификационная работа

по направлению подготовки 38.03.02 Менеджмент

образовательная программа «Менеджмент»

Факторы, определяющие распространение рекламных сообщений на платформе YouTube

Тихомирова Ксения

Санкт-Петербург 2018

Содержание

Введение

Глава 1. Факторы информационной диффузии в теории и эмпирических моделях

1.1 Коммуникации в сетях как база для понимания распространения информации

1.2 Структурные особенности сообщения в интернете и рекламе на YouTube

1.3 Классические и современные подходы к анализу и прогнозированию распространения информации

Глава 2. Процесс сбора данных, построения графа и анализа

2.1 Выборка сообщений и их контекст

2.3 Сбор данных о сообщениях

2.3 Сбор данных о каналах

2.4 Построение и анализ графа

2.5 Сбор фич и их анализ

Глава 3. Оценка факторов на основе моделей и рекомендации по работе с ними

3.1 Структурный анализ графов распространения информации

3.2 Сравнение моделей регрессии и классификации в оценке факторов

3.3 Рекомендации по работе с рекламой и трендами в YouTube

Заключение

Список литературы

Приложения

Аннотация

Анализ распространения информации позволяет выявлять паттерны и факторы виральности, которые помогают маркетологам увеличить показатели конверсии и охвата аудитории. Цель данной работы выявить факторы, которые влияют на распространение рекламного сообщения на платформе YouTube. В исследовании рассматривается сеть русскоязычных каналов и движение среди них 8 сообщений, часть из которых коммерческие, а часть - не рекламные. Автор анализирует три группы факторов: характеристики сообщения и его автора, черты узла, принимающего сообщение. Для этого используется сетевой анализ и алгоритмы регрессии и классификации. В результате работы предлагается описание значимых факторов и применение полученной модели на практике.

The audience of social media is growing, and marketers observe methods to guarantee the highest ROI and coverage of advertising message. The information diffusion analysis allows to describe current patterns and create a model to predict the message flow in the future. The aim of the paper is to distinguish factors influencing the advertising distribution on YouTube. In the research, Russian-language channels are observed to build a graph. Moreover, the diffusion of 8 messages through this network is described. The study is focused on three groups of factors (a message, an author, and a node), which include data of previous interactions between channels. Paper results include the description of features influence and approach to deal with them.

Введение

Интернет и социальные сети плотно вошли в жизнь людей, становясь важной частью повседневной жизни. В среднем россияне тратили 143 минуты в день на социальные сети в 2015 году, тогда как в 2012 году этот показатель был меньше - 90 минут. Почти 7% этого времени занимает YouTube [MediaScope, 2017]. Компании видят эту тенденцию, поэтому в 2017 году бренды потратили рекордные бюджеты на интернет-рекламу. По данным ACAR [ACAR, 2017], объем мобильной рекламы в январе-сентябре 2017 года был равен объему на телевидении.

В то же время текущие исследования интернета внутри компаний сосредоточены на маркетинговом анализе аудитории и краткосрочных трендов. Например, такие исследования публикуются Google и Yandex в конце каждого года. Кроме того, Google предоставляет маркетологам инструмент Google Trends: простой способ узнать, что сейчас интересно для публики. Однако его использование не позволяет получить точных прогнозов.

Исследований в области распространения информации в интернете много. Весь двадцатый век ученые [Кермак и МакКендрик, 1927; Далей и Кендалл, 1965] предлагают различные математические модели взаимодействия между людьми (коммуникаций), посредством которых движется информация. Одной из первых была модель SIR, ориентирующаяся на распространение эпидемий. Далее публиковались данные о моделях, связанных напрямую с коммуникациями. Последние, современные, модели и находки фокусируются на улучшении алгоритмов и уменьшении влияния исходного набора данных на результат.

Однако большинство данных исследований не ставят в свои задачи работу с проблемами маркетинговой коммуникации. А при этом их находки по оптимизации движения сообщений (например, с помощью выделения важных ранних последователей) могут быть полезны в данной сфере. Также в большинстве работ, связанных с социальными сетями, авторы используют датасет или какой-нибудь блог-платформы, или Twitter. В редких случаях они обращаются к YouTube, а работ, посвященных коммуникациям внутри комьюнити блогеров на русском языке, мы не нашли.

Поэтому цель нашей работы - определить факторы, которые влияют на распространение информации в русскоязычном сегменте YouTube. Для достижения поставленной цели нам необходимо выполнить следующие задачи:

? рассмотреть текущие модели распространения информации, чтобы выявить релевантные для анализа факторы;

? собрать данные о сообщениях и каналах русскоязычного сегмента YouTube;

? построить сеть каналов и динамический граф распространения информации, проанализировать его структуру (длина путей, хабы, кластеры);

? построить модели для оценки влияния каждого фактора на степень активации узла сообщением;

? проинтерпретировать полученные результаты и составить список рекомендаций для компаний по работе с трендами и рекламой на YouTube.

Объект нашего исследования - коммуникации внутри комьюнити русскоязычных блогеров. Предмет - факторы, влияющие на появление публичной реакции одного блогера на сообщение другого (в рамках платформы YouTube).

Работа состоит из трех частей: обзор литературы, описание методологии и анализ данных. В первой части мы рассматриваем теоретическое обоснование распространения информации в интернете с точки зрения структуры сети и сообщения, а также классические и современные модели, описывающие данный процесс с математической точки зрения. Как результат, мы выявляем список факторов, подходящий для нашего исследования. Во второй части мы описываем процесс сбора данных, их подготовку и последующий анализ. Для сбора данных мы используем открытый API YouTube. С помощью Python, R, Gephi мы составляем необходимые для анализа датасеты и графы. В третьей части мы описываем результаты анализа и приводим рекомендации. Граф блогеров мы рассматриваем с точки зрения его структуры. Модель анализа мы строим, используя популярные алгоритмы регрессии и классификации: линейная регрессия, дерево решений, random forest, SVM. Список рекомендаций должен помочь маркетологам работать с инфоповодами и блогерами на платформе YouTube.

В целом, данная работа должна внести ясность в понимание механизмов движения информации в русскоязычном сегменте YouTube, а также стать шагом на пути автоматизации принятия решений по работе с блогерами и контентом.

Глава 1. Факторы информационной диффузии в теории и практических моделях

В данной главе мы рассмотрим, как на сегодняшний описывают процесс движения информации: какие звенья входят в его структуру и от чего они зависят. Для этого информационная диффузия будет представлена с нескольких позиций: с точки зрения сообщения, которое передается в процессе коммуникации, и с точки зрения сети, в которой процесс и происходит. Далее мы обратимся к современным моделям, описывающим распространение информации. По итогам данной главы мы получим список факторов, которые обоснованно стоит рассмотреть в данной работе.

1.1 Коммуникации в сетях как база для понимания распространения информации

Сеть, согласно Кастельсу [Кастельс, 2009] - это набор взаимосвязанных узлов (nodes). Связи между элементами сети называются ребрами (edges), и чем больше ребер входит в узел или выходит из него, тем значимей данный элемент для структуры. Такие узлы также называют хабами.

В данной работе, сети рассматриваются как коммуникативные структуры. Здесь связь между узлами означает контакт - коммуникацию между пользователями. Андрианов (2007) пишет о четырех видах коммуникации: массовая, публичная, межгрупповая и межличностная. В классическом случае первые два типа коммуникаций - вертикальные структуры, где по нисходящей идет прямая связь, а по восходящей - обратная. Так можно представить работу традиционных СМИ, например, радио или телевидения. Обратная связь встречает преграды, и ее охват несравним с охватом телевидения настолько, что ею можно пренебречь. Вес СМИ значителен перед весом аудитории, которая в этой структуре выглядит пассивным потребителем информации, но существуют аргументы против данного утверждения.

Ряд исследований в психологии коммуникаций отмечает, что аудитория может переосмысливать полученное сообщение в соответствии со своим культурным опытом. Так Рассел Ньюман (1991) называл новую массовую аудиторию как пассивной, так и активной одновременно как раз за счет способности оценивать, интерпретировать и фильтровать полученную информацию. Фильтрация в данном случае происходит за счет внимания к тому или иному сообщению и выбору медиа. Это не означает, что получатель не подвергается воздействию сообщения, но говорит о том, что зритель участвует в формировании его смысла.

Также Умберто Эко (1994) в своей основополагающей работе «Оказывает ли аудитория отрицательное влияние на телевидение?» подчеркивает, что большинство аудитории способно добавлять свои коды и субкоды к кодам отправителя. С учетом этого он предлагает усложненную модель однонаправленной коммуникации (рис. 1).

Рис. 1: Модель коммуникации Умберто Эко. Источник: Кастельс, 2009

В классической модели означающее, которое передает отправитель, равно означающему, которое получает адресат. В модели Эко адресат разделяет в процессе обработки означающее и означаемое. Он формирует собственный денотат и, следовательно, может получить несколько иной смысл сообщения. То есть, основываясь на материалах исходного послания, адресат помещает сообщение в новое интерпретационное пространство.

Но это по-прежнему описание классической, однонаправленной, вертикальной структуры. Если говорить об интернете, то процесс развивается иначе. Во-первых, здесь формируются горизонтальные связи. Все связанные члены сети являются равноправными участниками коммуникации и выступают одновременно источниками и адресатами сообщений. И публичный контакт между двумя людьми в сети является массовой коммуникацией, т.к. общение двух людей в комментариях или в Twitter становится достоянием общественности, которая может вмешиваться в обсуждение. Во-вторых, в интернете мы имеем дело не с просто массовой коммуникацией, а с названной Кастельсом (2009) массовой самокоммуникацией. Развитие технологий позволило огромному количеству людей выходить в интернет и создавать собственный контент. Часть современных средств массовой коммуникации, например, YouTube, существует не за счет профессиональных кураторов, как это происходит в печати и телевидении, а за счет обычных пользователей. Это касается не только публикаций, но и выбора контента. В-третьих, интернет не существует отдельно от других средств коммуникаций. Сообщение может транслироваться по разным каналам, при этом изменяясь. Исходя из этих дополнений, предложенная схема Эко может быть усложнена еще раз, что и предложил сделать Кастельс (рис. 2).

Рис. 2: Процесс коммуникации в креативной аудитории. Источник: Кастельс, 2009

На этой схеме отправители и адресаты являются одним и тем же субъектом. Совершенно не обязательно, что отдельный субъект исполняет и ту, и другую роль в рамках отдельно взятого процесса коммуникации, но в целом в данной разнонаправленной сети все отправители превращаются в адресатов и наоборот. Они не только интерпретирует полученное сообщение, но и могут создать на его основе собственное. То есть при такой схеме аудитория становится все более активной, и Кастельс называет такой тип аудитории «креативной».

Коммуникации в этой сети, по словам Кастельса, являются мультимодальными и многоканальными. Мультимодальность означает разные медиумы передачи информации: интернет, телевидение, радио, печать и прочее. Каждый из медиумов и их комбинации формируют особый код коммуникации, который следует рассматривать отдельно для каждого случая, учитывая контекст. Каналы по Кастельсу - это различные телевизионные каналы, радиостанции, площадки в интернете. Каждый из них также передает свой код коммуникации. Так Кастельс выделяет для вида коммуникации код В, и для канала коммуникации код К. Коды имеют субкоды - конкретные виды коммуникационного процесса для В и виды канала для К.

Получается, здесь «средство коммуникации (медиум) - есть сообщение» - как писал Маклюэн (1964). Средство коммуникации контролирует масштаб распространения сообщения и формы ассоциаций на него. В «Понимание медиа» Маклюэн рассматривает все многообразие средств коммуникаций, называя их «продолжением человека вовне». И содержанием каждого средства коммуникации является другое средство коммуникации. В нашем же исследовании нас интересует часть, посвященная влиянию средства коммуникации на его содержимое, то, что Кастельс как раз назвал кодом каналов. Это влияние зависит от специфики самого медиума и того культурного контекста, в котором он был создан и существует.

Если говорить о YouTube, то нас может заинтересовать структура взаимосвязей между пользователями данной платформы, т.к. она влияет на характер распространения информации. Парк, Лим и Парк (2015) в ходе своего исследования приходят к выводу, что структура сети YouTube склоняется к кластерной форме. Авторы анализировали структурные характеристики сетей и паттерны взаимодействий внутри них, основываясь на сравнении структуры упоминаний движения Оккупай Уолл Стрит на платформах Twitter и YouTube. Twitter представляет собой концентрированную структуру, в которой информация контролируется лидерами мнений. Эти лидеры мнений соединяют между собой маленькие группы других пользователей и являются хабами. В свою очередь YouTube представляет по своей структуре маленький мир. То есть для данной платформы присуще большое количество кластеров без большого количества ярко выраженных лидеров мнений, от которых идет контент.