Для подсчета фактора процента статичных элементов в анализируемых материалах были подсчитаны статичные и динамические, или интерактивные, визуальные элементы, такие как видео, в том числе закольцованные, слайдеры, изображения с анимацией. С помощью контент-анализа подсчитали значения факторов: число цитат-врезок, число визуальных элементов, число знаков на один визуальный элемент, число знаков. Также у нас были данные о числе просмотров каждого материала.
Влияние вышеперечисленных факторов проанализировали на двух массивах данных -- в соответствии с показателями вовлеченности на мобильных устройствах и на декстопе. В выборку попали только материалы объемом не менее трех экранов, так как процент доскроллов материалов объемом 1--2 экрана по очевидным причинам стремится к 100%.
Обратимся к методике исследования: итоговые выводы статьи построены на основе комплексного подхода. Основной метод исследования -- регрессионный анализ -- позволил выявить зависимость между показателями вовлеченности (процент доскроллов и коэффициент вовлеченности выступили зависимыми переменными) и независимыми переменными (факторы), а также описать тип взаимосвязи (влияют они отрицательно или положительно). Для сбора данных был использован метод контент-анализа.
Регрессионный анализ был проведен четыре раза: для анализа влияния факторов на показатели - процент доскроллов и коэффициент вовлеченности на мобильных устройствах и на ПК - были построены четыре модели, каждая методом множественной линейной регрессии. В нечисловых факторах, таких как тип заголовка, значение для каждой вариации параметра присваивается в зависимости от среднего значения по материалам с данным параметром. Для каждой модели мы тестировали 16 факторов, методом перебора исключая их по очереди из модели и наблюдая, как в зависимости от этого меняется ее качество - так мы исключили незначимые переменные для каждой модели.
В результате исследования были получены данные о значимости и характере влияния факторов на каждый из рассматриваемых показателей вовлеченности. Выводы о статистической значимости или незначимости влияния фактора были сделаны по итогам регрессионного анализа, который учитывает взаимовлияние факто- ров и позволяет получить наиболее целостную картину и сделать объективные выводы. Значимым признается влияние факторов, где p-значение < 0.05, то есть вероятность ошибки не превышает 5%, что является стандартом для подобных исследований. Но по полученным моделям нельзя было сделать вывод о том, какой из факторов влияет на переменную сильнее, можно было сравнивать влияние факторов только по уровню значимости, так как на коэффициенты модели влияют свойства фактора (в нашу входят как параметрические, так и непараметрические), а также шкала значений каждого из факторов, не позволяя сравнивать их между собой.
Поэтому мы воспользовались одним из подходов, описанных в материалах нескольких исследователей29 (Grцmping: 2006), столкнувшихся с той же проблемой. В дополнение к регрессионным моделям мы построили матрицу парных корреляций, с помощью которой отследили взаимосвязь каждого фактора с каждой переменной. По коэффициенту парной корреляции мы смотрели взаимосвязи каждой переменной с метрикой, то есть взаимовлияние факторов не учитывалось. Коэффициент корреляции отражает характер взаимосвязи -- отрицательная или положительная -- и помогает отранжировать факторы между собой. Для определения значимости влияния фактора он не используется, так как корреляция отражает только наличие взаимосвязи и может быть результатом влияния скрытого фактора.
В результате этого комплексного подхода получили рейтинги факторов, которые влияют на каждую из зависимых переменных, -- процент доскроллов и коэффициент вовлеченности, и по каждому фактору также коэффициент корреляции. По данным коэффициентов парной корреляции нельзя сделать выводы о силе влияния каждого из факторов в модели относительно друг друга, но можно сравнить их между собой по отдельности, в то время как регрессионный анализ позволяет сделать выводы только о том, значимо ли влияет каждый из факторов, и о характере влияния.
Результаты исследования
Анализ влияния факторов на показатели вовлеченности
Для начала отразим в таблице результаты регрессионного анализа по каждому из факторов: положительно или отрицательно влияет процент доскроллов и коэффициент вовлеченности на мобильных устройствах и ПК на показатели или не влияет вовсе (см. табл. 1).
Количество просмотров. Этот показатель отражает популярность или значимость темы материала для читателей Lady.mail.ru -- просмотры растут под влиянием заголовка и короткого описания материала, которые, в свою очередь, отражают тему и суть материала. То есть материалы с наибольшим количеством просмотров привлекают и удерживают больше внимания читателей. Хуже всего дочитывают материалы с числом просмотров от 100 до 5 тысяч на мобильных устройствах и от 2 до 9 тысяч на ПК, лучше всего -- начиная от 40 тысяч просмотров на мобильных устройствах и от 20 тысяч -- на ПК.
Количество знаков. Увеличение длины материала отрицательно влияет и на процент доскроллов, и на коэффициент вовлеченности на любых устройствах: с ростом объема материала все меньше посетителей досмотрят до конца, все меньше времени потратят на вдумчивое чтение материала.
Рекламность. Это еще один фактор, который отрицательно влияет на процент доскроллов и коэффициент вовлеченности на всех типах устройств. С ростом рекламности материала все больше посетителей бросают материал, не дочитав до конца, и все меньше времени тратят на чтение.
Число знаков на один визуальный элемент. С ростом числа знаков на визуальный элемент снижается процент доскроллов на мобильных устройствах и коэффициент вовлеченности ПК - этот фактор оказывает отрицательное влияние в двух регрессионных моделях из четырех. Посетителям тяжелее воспринимать большие куски текста, не разбавленные визуальными элементами, и сохранять концентрацию, необходимую для вдумчивого чтения. Для Lady. mail.ru дочитываемость начинает снижаться, когда число знаков превышает. 600 -- это приводит к тому, что более 30% аудитории мобильных устройств уходит со страницы материала. Для десктопа допустимый уровень больше -- до 1 500 знаков на визуальный элемент.
Процент статичных элементов (от общего числа визуальных элементов). Чем больше процент статичных элементов в материале, тем выше процент доскроллов на всех типах устройств. То есть с увеличением доли интерактивных визуальных элементов (видео, слайдеры, анимация) дочитываемость материала падает.
Число визуальных элементов. Рост количества иллюстраций в материале отрицательно влияет только на процент доскроллов только на ПК. Материал чаще бросают с ростом количества визуальных элементов в нем.
Раздел. Интересы читателей влияют на вовлеченность больше на ПК -- мы видим, что фактор раздел значимо влияет на показатели вовлеченности.
Время публикации. Этот фактор в разбивке по часам влияет только на процент доскроллов на мобильных устройствах, к вечеру дочитываемость растет. В остальных регрессионных моделях день недели и время публикации не являются значимо влияющими факторами.
Далее в таблицах -- сравнение влияния факторов на каждую из переменных на мобильных устройствах и ПК. В них вошли только значимые факторы из каждой регрессионной модели, незначимые были исключены. А именно: по итогам регрессионного анализа факторы тип заголовка. (назывной/транзитивный) и маркеры в заголовке не влияют на вовлеченность по результатам исследования ни на одном наборе данных. Вывод: маркеры порядка и формата в заголовке и тип заголовка не имеют значения для вовлеченности читателя. Факторы день недели, количество цитат-врезок и тип материала также не влияют на вовлеченность ни в одном регрессионном анализе. То есть день публикации, жанр материала и разнообразие верстки не важны с точки зрения вовлеченности.
Степень значимости влияния каждого фактора отражена в столбце значимость и основана на p-критерии: `***' означает, что p < 0.001, `**' означает, что p < 0.01, а `*' -- что p < 0.05, то есть в таблицы вошли только те факторы, влияние которых по итогам регрессионного анализа статистически значимо. Во втором столбце присутствует коэффициент корреляции из матрицы парных корреляций, который говорит о силе взаимосвязи конкретного фактора и переменной, без учета взаимовлияния других факторов. (см. табл. 2).
У факторов количество просмотров и рекламность очень маленький коэффициент корреляции, поэтому силу их влияния на процент доскроллов стоит поставить под сомнение. Тем не менее по результатам регрессионного анализа в комплексе с другими факторами их влияние признано значимым (см. табл. 3).
На дочитываемость материала. -- процент доскроллов -- сильнее всего влияет количество знаков в нем: чем больше знаков, тем меньше людей долистает материал до конца, независимо от типа устройства.
Фактор количество визуальных элементов на ПК, судя по коэффициенту корреляции, очень слабо влияет на дочитываемость сам по себе, занимая шестое место в рейтинге факторов. Можно сделать вывод, что рост числа элементов снижает дочитываемость, но это также может быть связано с ростом объема материала. На мобильных устройствах этот фактор вообще не имеет значения, так же как и в случае с временем чтения. Факторы рекламность, раздел и количество просмотров. сами по себе влияют на процент доскроллов на ПК очень слабо (см. табл. 4).
В случае с числовыми факторами рекламность (от 0 до 5). и количество знаков мы можем сказать, что их рост вызывает сокращение времени чтения. Наличие слов-триггеров почти во всех случаях отрицательно влияет на вовлеченность. И можно сказать, что материалы определенных тематик, по интересам аудитории Lady. mail.ru, читают больше времени, других -- меньше. На ПК для переменной коэффициент вовлеченности значимы также четыре фактора -- те же, что и на мобильных устройствах, только фактор тематика меняется на фактор раздел (см. табл. 5).
Числовых факторов здесь всего два -- это рекламность (от 0 до 5) и количество знаков, их рост вызывает уменьшение коэффициента вовлеченности на ПК. Коэффициенты корреляции всех факторов, которые по итогам регрессионного анализа влияют на коэффициент вовлеченности, небольшие, поэтому нельзя сделать вывод о том, что какой-либо из них действительно сильно влияет на время чтения.
Выводы по результатам анализа
Результаты исследования только подтвердили тезисы, с которых начался теоретический обзор: со временем способность к длительной концентрации человека падает и медиа должны с этим считаться. Показатели вовлеченности, используемые в данной статье, -- коэффициент вовлеченности, основанный на времени чтения, и процент доскроллов -- позволяют делать выводы об удержании внимания аудитории конкретного материала, что является одним из важнейших признаков ее вовлеченности и говорит о качестве самого текста и его представления -- верстки и структуры.
В процессе исследования получилось выявить факторы, которые влияют на вовлеченность отрицательно и положительно и которые никак не влияют. Исследование подтвердило, что увеличение числа знаков в тексте снижает среднее время его чтения и процент дочитавших до конца, то есть аудитории все сложнее читать длинные тексты. Эта тенденция говорит о том, что медиа пора смещать свой фокус в сторону емких коротких текстов. А отрицательное влияние соотношения числа знаков к числу визуальных элементов на дочитываемость на мобильных устройствах указывает на важность разнообразия верстки -- разбивки сплошных кусков текста визуальными элементами. Можно предположить, что идеальное соотношение числа знаков к числу визуальных элементов будет разное в разных медиа и для разных типов устройств. Но для Lady.mail.ru больше 30% аудитории мобильных устройств уходит со страницы материала, не дочитав до конца, если на одну иллюстрацию или видео приходится более 600 знаков. Большие куски текста с минимумом визуальных вставок ухудшают легкость восприятия материала на мобильном устройстве. На ПК этот фактор не влияет значимо на дочитываемость, так же как и на время чтения на обоих типах устройств. Этот фактор также необходимо учитывать, если медиа планируют увеличивать мобильную аудиторию, На ПК значимым оказался фактор число визуальных элементов, вкупе с предыдущим выводом это может говорить о том, что аудитории ПК проще воспринимать и читать тексты, в то время как с мобильных устройств, наоборот, внимание лучше привлекают и удерживают изображения. В связи с тем что «стремительно растет доля пользователей mobile only, которые выходят в интернет только со смартфонов» (Градюшко, 2019: 5), для медиа имеет смысл ставить восприятие контента на этом типе устройств на первое место. Фактор наличия цитат-врезок никак не повлиял на вовлеченность, таким образом, в отличие от изображений, разнообразие верстки шрифтов в тексте не отражается на вовлеченности материалов Lady.mail.ru.