Критерий Фридмана (Однофакторный дисперсионный анализ для связанных выборок)
Для того, чтобы проверить, значима ли разница в средних между оцениваемыми факторами, необходимо использовать критерий Фридмана, позволяющий проанализировать несколько зависимых выборок (факторы оценивались одними и теми же людьми).
Статистика критерия говорит о его значимости, но не уточняет между какими именно факторами средние различаются значительно. Так как попарное сравнение 17 факторов с помощью критерия Уилкоксона не представляется возможным в силу большого количества наблюдений, обратимся к таблице рангов. На таблице видно, что значение среднего падает значительно после фактора персонализации. Действительно, сравнивая средние факторов персонализации и офлайн-доступа (идущий за ним фактор) - мы обнаруживаем значимый критерий Фридмана. Если же сравнить средние экономии времени (предшествующий фактор) и персонализации, то критерий не значим, что оправдывает отбор 10 факторов, которые были оценены по шкале важности для респондентов выше других.
Таблица 11 -- Статистики критерия Фридмана для факторов, влияющих на желание пользователя оформить/продлить подписку на онлайн-кинотеатр.
|
Статистики критерияa |
||||
|
N |
411 |
|||
|
Хи-квадрат |
1678,381 |
|||
|
ст.св. |
16 |
|||
|
Асимпт. знч. |
,000 |
|||
|
Знч. Монте-Карло |
Знч. |
,000 |
||
|
99%-й доверит. интервал |
Нижняя граница |
,000 |
||
|
Верхняя граница |
,000 |
|||
|
a. Критерий Фридмана |
Таблица 12 -- Средние ранги факторов.
|
Ранги |
||
|
Средний ранг |
||
|
Качество |
10,41 |
|
|
UX |
11,16 |
|
|
Устройства |
10,37 |
|
|
Персонализ |
9,36 |
|
|
Скачивание |
8,14 |
|
|
Реклама |
11,70 |
|
|
Цена_качво |
11,21 |
|
|
Цена_пакеты |
7,08 |
|
|
Цена_промо |
5,93 |
|
|
Персон_данные |
11,64 |
|
|
UI |
10,45 |
|
|
Соц_круг |
6,00 |
|
|
Альтер_кино |
6,59 |
|
|
Альтер_время |
9,61 |
|
|
Бесплат_доступ |
7,55 |
|
|
Широта_выбора |
9,91 |
|
|
Живые_трансл |
5,89 |
Регрессионный анализ
Регрессионная модель предполагает, что зависимые и независимые переменные измерены по интервальной или бинарной шкалам. Так как большинство переменных представляют измерены в порядковой шкале, они представляют собой псевдоинтервальную шкалу. Для точности измерений множественная регрессия была подкреплена бинарной логистической регрессией, где порядковые переменные были перекодированы в фиктивные. Результаты бинарной логистической регрессии доступны в Приложении 5.
Множественная регрессия
Факторы и зависимые переменные представляют собой порядковые шкалы, которые могут быть рассмотрены в качестве псевдоинтервальных, делая возможным проведение множественной регрессии. Сначала в модель были введены социально-демографические переменные, вторым блоком добавлены непосредственно факторы.
Вероятность оформления подписки. Корреляции между параметрами не превышают 0,9 и значения VIF не превышают 10, что говорит об отсутствии мультиколлинеарности между предикторами. Индекс Дурбина-Уотсона равен 2,03 (норма: от 1 до 3) - делаем вывод о независимости ошибок. Первая модель предсказывает 8,9% дисперсии, с добавлением факторов процент увеличивается до 14,6%. Однако, если первая модель объясняет разбросы в данных на статистически значимом уровне, то добавление факторов не является существенно значимым для объяснения распределения результатов.
Таблица 13 -- Сводка для модели, предсказывающей вероятность оформления подписки.
|
Сводка для модели |
||||
|
Модель |
||||
|
1 |
2 |
|||
|
R |
,299 |
,382 |
||
|
R-квадрат |
,089 |
,146 |
||
|
Скорректированный R-квадрат |
,062 |
,062 |
||
|
Стд. ошибка оценки |
1,606 |
1,607 |
||
|
Изменения статистик |
Изменение R квадрат |
,089 |
,057 |
|
|
изменения F |
3,304 |
,985 |
||
|
ст.св.1 |
8 |
17 |
||
|
ст.св.2 |
269 |
252 |
||
|
Знч. изменения F |
,001 |
,475 |
||
|
Дурбин-Уотсон |
2,030 |
Тем не менее, вторая модель имеет право на существование, так как основана на базисе первой и в целом также является статистически значимой.
Таблица 14 -- Дисперсионный анализ моделей.
|
Дисперсионный анализ |
|||||||
|
Модель |
Сумма квадратов |
ст.св. |
Средний квадрат |
F |
Знч. |
||
|
1 |
Регрессия |
68,156 |
8 |
8,519 |
3,304 |
,001 |
|
|
Остаток |
693,719 |
269 |
2,579 |
||||
|
Всего |
761,874 |
277 |
|||||
|
2 |
Регрессия |
111,390 |
25 |
4,456 |
1,726 |
,020 |
|
|
Остаток |
650,484 |
252 |
2,581 |
||||
|
Всего |
761,874 |
277 |
Ниже представлены результаты по тем коэффициентам, которые оказались значимы в отношении предсказания зависимой переменной. Так, множественная регрессия подтвердила результаты бинарной логистической регрессии и выявила значимость переменных возраста и поддержки авторского права. С увеличением года возраста респондента (тенденция сохраняется до 44 лет) вероятность оформления подписки растет в 0,046 раза (+4,6%), а с повышением балла важности поддержки авторского права на 11,2% повышается склонность к оформлению подписки.
Таблица 15 -- Статистически значимые коэффициенты модели, предсказывающей вероятность оформления подписки.
|
Коэффициенты |
|||||||||
|
Модель |
Нестандартизованные коэффициенты |
Стандартизованные коэффициенты |
t |
Знч. |
95,0% доверительный интервал для B |
||||
|
B |
Стд. Ошибка |
Бета |
Нижняя граница |
Верхняя граница |
|||||
|
1 |
(Константа) |
-89,613 |
25,437 |
-3,523 |
,001 |
-139,694 |
-39,531 |
||
|
Укажите, пожалуйста, год Вашего рождения |
,046 |
,013 |
,305 |
3,593 |
,000 |
,021 |
,071 |
||
|
2 |
(Константа) |
-91,378 |
26,806 |
-3,409 |
,001 |
-144,169 |
-38,586 |
||
|
Укажите, пожалуйста, год Вашего рождения |
,046 |
,013 |
,307 |
3,441 |
,001 |
,020 |
,073 |
||
|
Мне важно, чтобы подписка на онлайн-кинотеатр позволяла мне смотреть лицензионный контент и поддерживать авторское право |
,112 |
,055 |
,143 |
2,054 |
,041 |
,005 |
,220 |
При проверке стандартизированных остатков полученные результаты удовлетворяют условию о том, что не более 5% значений превышают значение 2, и ни одно из значений не превышает 3. Графики частной регрессии рассеяны равномерно и случайно по телу графика, подтверждая предположения линейной регрессии о линейном соотношении независимых и зависимой переменных и нормальности дисперсии. Гистограмма стандартизированного остатка представляет форму колоколообразной кривой, а вероятностный график сосредоточен вокруг нормальной прямой.
Удовлетворенность сервисом подписки. В отношении удовлетворенности пользования сервисом множественная регрессия, как и логистическая, показывает отсутствие значимости F-критерия, что не позволяет рассматривать предсказательную силу факторов на зависимые переменные.
Вероятность продления подписки. Предикторы проверены на отсутствие мультиколлинеарности (индекс корреляций не превышает 0,9 и значения VIF не превышают 10) и предположения о независимости ошибок (индекс Дурбина-Уотсона равен 2,23). Первая модель (социально-демографические показатели и контрольные переменные) предсказывает 14,5% дисперсии, вторая модель - 35,5%. Обе модели статистически значимы.
Таблица 16 -- Сводка для модели, предсказывающей вероятность продления подписки.
|
Сводка для модели |
||||
|
Модель |
||||
|
1 |
2 |
|||
|
R |
,381 |
,595 |
||
|
R-квадрат |
,145 |
,355 |
||
|
Скорректированный R-квадрат |
,090 |
,204 |
||
|
Стд. ошибка оценки |
1,850 |
1,731 |
||
|
Изменения статистик |
Изменение R квадрат |
,145 |
,209 |
|
|
изменения F |
2,635 |
2,041 |
||
|
ст.св.1 |
8 |
17 |
||
|
ст.св.2 |
124 |
107 |
||
|
Знч. изменения F |
,011 |
,015 |
||
|
Дурбин-Уотсон |
2,233 |
Таблица 17 -- Статистически значимые коэффициенты модели, предсказывающей вероятность продления подписки.
|
Коэффициенты |
|||||||||
|
Модель |
Нестандартизованные коэффициенты |
Стандартизованные коэффициенты |
t |
Знч. |
95,0%% доверительный интервал для B |
||||
|
B |
Стд. Ошибка |
Бета |
Нижняя граница |
Верхняя граница |
|||||
|
1 |
(Константа) |
-28,148 |
42,456 |
-,663 |
,509 |
-112,181 |
55,884 |
||
|
Как Вы оцениваете собственное материальное положение? |
,564 |
,165 |
,287 |
3,426 |
,001 |
,238 |
,890 |
||
|
Как часто Вы смотрите фильмы и сериалы? |
,234 |
,106 |
,190 |
2,196 |
,030 |
,023 |
,444 |
||
|
2 |
(Константа) |
-8,341 |
41,834 |
-,199 |
,842 |
-91,271 |
74,590 |
||
|
Как Вы оцениваете собственное материальное положение? |
,504 |
,158 |
,256 |
3,184 |
,002 |
,190 |
,818 |
||
|
Сколько часов в день примерно Вы проводите в интернете? |
-,248 |
,120 |
-,193 |
-2,059 |
,042 |
-,486 |
-,009 |
||
|
Как часто Вы смотрите фильмы и сериалы? |
,228 |
,102 |
,185 |
2,227 |
,028 |
,025 |
,430 |
||
|
Мне важно, чтобы подписка на онлайн-кинотеатр позволяла мне смотреть фильмы и сериалы без рекламы |
,633 |
,194 |
,391 |
3,263 |
,001 |
,248 |
1,018 |
В отношении предсказания зависимой переменной значимыми оказались критерии уровня дохода (с изменением группы, в которую попадает респондент, вероятность продления подписки растет на 56,4%), времени использования интернета (продвинутые интернет-пользователи на 24,8% менее вероятны к оформлению подписки), частоты просмотра фильмов и сериалов (“опытные киноманы” на 23,4% более склонны продлить подписку) и увеличение значения, присваиваемого важности отсутствия рекламы, на 63,3% повышает вероятность продления подписки. Проверка остатков соответствует критериям нормы, указанным в модели выше.
4.3 Обсуждение результатов опроса
Первый блок опроса снимал характерное для респондентов поведение в сети. Закономерно, с повышением возраста снижалось время, проводимое в интернете, интенсивность шопинга и сужался круг деятельности, проводимой в нем. Менее активные интернет-пользователи получают доступ к кино посредством торрент-трекеров и телевидения, в то время как продвинутые пользуются онлайн-ресурсами, социальными сетями и видеостриминговыми сервисами. Среди основных причин отсутствия подписки взрослые люди выделяют отсутствие потребности в кино как таковой и предпочтение телевидения, а более молодые - наличие бесплатных фильмов и сериалов в интернете и высокую цену подписки. Самыми популярными легальными площадками стали Netflix (популярен среди женщин) и Кинопоиск HD (популярен у мужчин), у взрослых - Ivi и Okko. Среднее количество подписок на онлайн-кинотеатры среди пользователей, имеющих подписку, оказалось равно 2,54 по выборке, что удивительно, так как в обзоре литературы было выявлено, что российский пользователь не готов оформлять более 1 подписки.
Типичными потребителями услуг онлайн-кинотеатров являются киноманы 25-34 лет с высшим образованием, большим опытом использования интернета и совершения покупок товаров и услуг, живущие в больших городах и мегаполисах. На основе полученных результатов не было выявлено зависимости от пола респондента. Однако, мужчины отмечали значительно большую важность фактора доступа к онлайн-трансляциям, в то время как женщины были более склонны выделять фактор качества изображения.
Пользователям без подписки важно смотреть сериалы без доступа к интернету, а пользователям с ее наличием важнее иметь доступ к фильмам и сериалам с различных устройств, не прерываться на рекламу и экономить время и усилия на поиск нужного фильма в интернете. Однако, на уровне статистического предположения (p<0,05) различие было подкреплено только в отношении широты выбора контента, что вероятнее всего связано с тем, что только подписчики кинотеатров могут ознакомиться со всем перечнем доступного контента на платформе.