Заметно, что кластеру с низким уровнем качества сайта соответствуют также более низкие показатели эффективности деятельности, а с ростом уровня растут и показатели эффективности.
Простого сравнения медиан недостаточно, так как они могут различаться, но незначительно. Поэтому далее необходимо провести тест Краскела-Уоллиса для проверки равенства медиан. Нулевой гипотезой данного теста является предположение о равенстве медиан среди нескольких выборок. Результаты представлены в таблице 12.
Таблица 12
Тест на равенство медиан
|
Значение статистики |
P-value |
||
|
Рентабельность активов (ROA) |
4.02 |
0.13 |
|
|
Оборачиваемость активов |
21.60 |
0.00 |
|
|
Выручка |
103.59 |
0.00 |
|
|
Рыночная стоимость |
192.03 |
0.00 |
Гипотеза о равенстве медиан выручки, рыночной стоимости и оборачиваемости активов среди кластеров отвергается на любом уровне значимости. Вывод о различиях рентабельности активов среди трех кластеров можно сделать лишь на 15% уровне значимости. Таким образом, можно подтвердить, что компании с более высоким уровнем качества сайта имеют более высокие показатели эффективности работы.
4. Результаты исследования
Для проверки гипотез, в первую очередь, рассчитывается общий индекс, отражающий уровень качества сайта, учитывающий значения восьми веб метрик. Описательные статистики данного индекса представлены в таблице 13. Индекс принимает значения от 160 до 678, со средним чуть больше 350.
Таблица 13
Описательные статистики рассчитанного индекса
|
Медиана |
Среднее |
Стандартное отклонение |
Минимум |
Максимум |
||
|
Website Quality |
354.3 |
351.8 |
48.5 |
160.4 |
678.2 |
В таблице 14 представлены корреляции веб метрик с рассчитанным индексом. Стоит отметить, что индекс качества сайта, рассчитанный с использованием восьми веб метрик, имеет достаточно сильную прямую связь со всеми веб метриками кроме SEMrush, связь с которым является обратной. Кроме того, имеют отличия Bing и Google, связь с которыми ниже чем с другими показателями, что может быть связано с несогласованностью данных метрик с другими.
Таблица 14
Корреляции индекса и веб метрик
|
Website Quality |
||
|
MozRank |
0.61 |
|
|
Alexa |
0.42 |
|
|
Citation Flow |
0.87 |
|
|
|
0.26 |
|
|
SEMrush |
-0.38 |
|
|
Trust Flow |
0.88 |
|
|
Bing |
0.24 |
|
|
Web of Trust |
0.67 |
Включение в модель таких факторов как регион и сектор подразумевает наличие различий в значениях качества сайта компании на разных уровнях. Для контроля влияния качества сайта компании на регионах и секторах в таблице 15 отмечены медианы используемого индекса, демонстрирующего уровень качества сайта компании. В связи с недостаточностью простого сравнения медиан также в таблице представлены результаты теста Краскела-Уолиса на равенство медиан в нескольких выборках.
Таблица 15
Медианы индекса на уровне регионов и секторов
|
Уровень |
Медиана |
Тест Краскела-Уоллиса |
|
|
Информационные технологии |
397.38 |
Значение статистики |
|
|
Телекоммуникации |
373.32 |
117.68 |
|
|
Здравоохранение |
366.30 |
p-value |
|
|
Второстепенные потребительские товары |
360.77 |
0.00 |
|
|
Индустриальный сектор |
360.59 |
||
|
Первостепенные потребительские товары |
346.80 |
||
|
Финансовый сектор |
346.09 |
||
|
Материалы |
345.36 |
||
|
Энергетический сектор |
344.28 |
||
|
Коммунальные услуги |
338.06 |
||
|
Недвижимость |
319.66 |
||
|
Америка |
365.80 |
Значение статистики |
|
|
Европа |
354.75 |
61.18 |
|
|
Австралия |
354.26 |
p-value |
|
|
Азия |
342.48 |
0.00 |
|
|
Африка |
318.41 |
Как и следовало предполагать, максимальное медианное значение соответствует сектору информационных технологий. Также высокие значения уровня качества сайта имеют компании из таких секторов, как: телекоммуникации, здравоохранение и индустриальный сектор. Минимальные значения медиан индекса соответствуют сектору коммунальных услуг и недвижимости. Тест Краскела-Уолиса показал, что гипотеза о равенстве медиан отвергается на любом уровне значимости. Среди регионов результаты проверки медиан индекса оказались также достаточно очевидны. Максимальное значение соответствует Америке, затем следует Европа, Австралия и Азия. Африке соответствует минимальное значение. Результаты теста Краскела-Уолиса также показали, что гипотеза о равенстве медиан отвергается на любом уровне значимости.
Результаты построения регрессии для оценки влияния качества сайта компании на результаты ее деятельности для проверки первой гипотезы с использованием выручки в качестве зависимой переменной представлены в таблице 16.
Таблица 16
Результаты регрессионного анализа c использованием выручки в качестве зависимой переменной
|
модель 1 (y=sales) |
|||||||||
|
|
оценка |
p-value |
оценка |
p-value |
оценка |
p-value |
оценка |
p-value |
|
|
Качество сайта |
0.92*** |
0.00 |
0.74*** |
0.00 |
0.51*** |
0.00 |
0.40** |
0.01 |
|
|
Константа |
-3.58*** |
0.00 |
-3.35*** |
0.00 |
-2.20** |
0.01 |
-1.93** |
0.03 |
|
|
Возраст |
-0.02 |
0.40 |
-0.02 |
0.47 |
0.01 |
0.66 |
0.01 |
0.62 |
|
|
Количество работников |
0.45*** |
0.00 |
0.45*** |
0.00 |
0.29*** |
0.00 |
0.29*** |
0.00 |
|
|
Активы |
0.30*** |
0.00 |
0.31*** |
0.00 |
0.58*** |
0.00 |
0.58*** |
0.00 |
|
|
Регион |
|
|
вкл. |
4/4 знач. |
|
|
вкл. |
2/4 знач. |
|
|
Сектор |
|
|
|
|
вкл. |
7/10 знач. |
вкл. |
7/10 знач. |
|
|
R2 |
0.60 |
|
0.60 |
|
0.72 |
|
0.73 |
|
|
|
adj R2 |
0.60 |
|
0.60 |
|
0.72 |
|
0.72 |
|
|
|
N |
1086 |
|
1086 |
|
1086 |
|
1086 |
|
Коэффициент значим *на уровне 10%; ** на уровне 5%, *** на уровне 1%
В первую очередь, стоит отметить, что из данных были исключены два наблюдения с нулевыми активами. Так, количество наблюдений составило 1086. Модель демонстрирует, что возраст компании не оказывает значимого влияния на размер выручки, однако количество работников и активы положительно влияют на выручку. Качество сайта также оказалось положительно связано с размерами выручки компании. Включение в модель таких факторов как сектор и регион, в которых осуществляет деятельность компания, позволяет сделать вывод о существовании значимых отличий между различными регионами и секторами, так как большая часть включенных переменных оказалась значима.
Таблица 17
Результаты регрессионного анализа c использованием рыночной стоимости в качестве зависимой переменной
|
модель 2 (y=MV) |
|||||||||
|
|
оценка |
p-value |
оценка |
p-value |
оценка |
p-value |
оценка |
p-value |
|
|
Качество сайта |
2.62*** |
0.00 |
2.29*** |
0.00 |
1.81*** |
0.00 |
1.59*** |
0.00 |
|
|
Константа |
-9.80*** |
0.00 |
-7.92*** |
0.00 |
-6.59*** |
0.00 |
-4.85*** |
0.00 |
|
|
Возраст |
-0.09*** |
0.00 |
-0.09*** |
0.00 |
-0.03 |
0.33 |
-0.03 |
0.31 |
|
|
Количество работников |
0.18*** |
0.00 |
0.19*** |
0.00 |
0.04** |
0.06 |
0.05** |
0.02 |
|
|
Активы |
0.27*** |
0.00 |
0.28*** |
0.00 |
0.56*** |
0.00 |
0.57*** |
0.00 |
|
|
Регион |
|
|
вкл. |
0/4 знач. |
|
|
вкл. |
2/4 знач. |
|
|
Сектор |
|
|
|
|
вкл. |
6/10 знач. |
вкл. |
5/10 знач. |
|
|
R2 |
0.37 |
|
0.39 |
|
0.51 |
|
0.53 |
|
|
|
adj R2 |
0.36 |
|
0.39 |
|
0.50 |
|
0.52 |
|
|
|
N |
1086 |
|
1086 |
|
1086 |
|
1086 |
|
Коэффициент значим *на уровне 10%; ** на уровне 5%, *** на уровне 1%
Также стоит отметить, что качество модели является достаточно высоким, без включения сектора и региона скорректированный коэффициент детерминации имеет значение 0.6, а в финальной модели уже 0.72.Результаты второй модели с использованием рыночной стоимости компании говорят об обратной зависимости возраста компании и ее рыночной стоимости, а также о прямой зависимости количества работников и величины активов. Индекс, отражающий уровень качества сайта компании значим с положительным знаком. Включение в модель факта принадлежности компании к определенному региону или сектору значительно улучшило качество модели, повысив скорректированный коэффициент детерминации с 0.36 до 0.52.
Таблица 18
Результаты регрессионного анализа c использованием рентабельности активов в качестве зависимой переменной
|
модель 3 (y=ROA2017) |
|||||||||
|
|
оценка |
p-value |
оценка |
p-value |
оценка |
p-value |
оценка |
p-value |
|
|
Качество сайта |
0.12*** |
0.00 |
0.10** |
0.01 |
0.03 |
0.41 |
0.02 |
0.57 |
|
|
Константа |
0.00 |
1.00 |
-0.36 |
0.27 |
0.44*** |
0.00 |
0.34 |
0.28 |
|
|
Возраст |
-0.08** |
0.02 |
-0.08** |
0.03 |
-0.03 |
0.40 |
-0.04 |
0.29 |
|
|
Количество работников |
0.01 |
0.77 |
0.01 |
0.72 |
-0.06 |
0.11 |
-0.06 |
0.11 |
|
|
ROA2010 |
0.28*** |
0.00 |
0.28*** |
0.00 |
0.18*** |
0.00 |
0.18*** |
0.00 |
|
|
Регион |
|
|
вкл. |
0/4 знач. |
|
|
вкл. |
0/4 знач. |
|
|
Сектор |
|
|
|
|
вкл. |
6/10 знач. |
вкл. |
6/10 знач. |
|
|
R2 |
0.10 |
|
0.10 |
|
0.24 |
|
0.25 |
|
|
|
adj R2 |
0.09 |
|
0.09 |
|
0.23 |
|
0.23 |
|
|
|
N |
705 |
|
705 |
|
705 |
|
705 |
|