Таблица 5
Статистика по регионам
|
Регион |
Число компаний |
Страна |
% |
|
|
Америка |
427 (39%) |
США |
33% |
|
|
Канада |
3% |
|||
|
Бразилия |
1% |
|||
|
Мексика |
1% |
|||
|
Другие |
1% |
|||
|
Европа |
354 (33%) |
Соединенное Королевство |
6% |
|
|
Франция |
4% |
|||
|
Германия |
4% |
|||
|
Швейцария |
3% |
|||
|
Швеция |
2% |
|||
|
Италия |
2% |
|||
|
Россия |
2% |
|||
|
Другие |
9% |
|||
|
Азия |
272 (25%) |
Япония |
7% |
|
|
Индия |
4% |
|||
|
Китай |
3% |
|||
|
Гонконг |
2% |
|||
|
Южная Корея |
2% |
|||
|
Другие |
7% |
|||
|
Австралия |
26 (2%) |
Австралия |
2% |
|
|
Африка |
9 (1%) |
Южная Африка |
1% |
Компании из базы данных ведут деятельность более чем 80 индустриях, которые объединены в 11 секторов (таблица 6). Четверть компаний из базы данных ведут финансовую деятельность, при этом максимальный процент составляют региональные банки (11%). По 16% компаний вошли в сектор товаров не первой необходимости и индустриальный сектор. Далее следуют сектор производства материалов, и информационные технологии, которые составили по 9% и 7% соответственно.
Таблица 6
Статистика по секторам
|
Сектор |
Число компаний |
Индустрия |
% |
|
|
Финансовый сектор |
270 (25%) |
|||
|
Региональные банки |
11% |
|||
|
Ведущие банки |
4% |
|||
|
Инвестиционные услуги |
3% |
|||
|
Страхование |
3% |
|||
|
Другие |
4% |
|||
|
Второстепенные потребительские товары |
168 (16%) |
|||
|
Уход за собой и домом |
2% |
|||
|
Автозапчасти |
2% |
|||
|
Авто производители |
2% |
|||
|
Электроника |
1% |
|||
|
Другие |
9% |
|||
|
Индустриальный сектор |
163 (16%) |
|||
|
Бизнес и персональные услуги |
3% |
|||
|
Конгломераты |
2% |
|||
|
Авиалинии |
2% |
|||
|
Строительство |
2% |
|||
|
Другие |
7% |
|||
|
Материалы |
99 (9%) |
|||
|
Добыча полезных ископаемых |
2% |
|||
|
Специализированные химические вещества |
2% |
|||
|
Многоотраслевые химические вещества |
2% |
|||
|
Другие |
3% |
|||
|
Информационные технологии |
80 (7%) |
|||
|
Полупроводники |
2% |
|||
|
Программное обеспечение |
2% |
|||
|
Компьютерные услуги |
2% |
|||
|
Другие |
1% |
|||
|
Энергетический сектор |
70 (6%) |
|||
|
Нефтегазовые операции |
4% |
|||
|
Другое индустриальное оборудование |
1% |
|||
|
Нефтяные услуги и оборудование |
1% |
|||
|
Товары первой необходимости |
65 (6%) |
|||
|
Производство продуктов питания |
3% |
|||
|
Розничная торговля продуктами питания |
3% |
|||
|
Здравоохранение |
64 (6%) |
|||
|
Фармацевтические препараты |
3% |
|||
|
Другие |
3% |
|||
|
Коммунальные услуги |
48 (4%) |
|||
|
Электричество |
3% |
|||
|
Природный газ |
1% |
|||
|
Телекоммуникации |
34 (3%) |
|||
|
Телекоммуникации |
3% |
|||
|
Недвижимость |
27 (2%) |
|||
|
Недвижимость |
2% |
|||
Описательные статистики контрольных переменных представлены в таблице 7. Средний возраст компаний превысил 70 лет с максимальным значением 545. Максимальное количество работников превысило 600 тысяч человек при среднем около 56 тысяч. При этом среднее значение выручки составляет примерно 22 миллиарда долларов, а активов около 114 миллиардов долларов.
Таблица 7
Описательные статистики переменных
|
Среднее |
Стандартное отклонение |
Минимум |
Максимум |
||
|
Возраст (лет) |
70.45 |
54.12 |
1.00 |
545.00 |
|
|
Количество работников (чел.) |
55 766.83 |
84 402.75 |
7.00 |
626 715.00 |
|
|
Активы (млн. долларов) |
113 812.95 |
338 900.65 |
0.00 |
4 210 900.00 |
|
|
ROA2010 |
0.04 |
0.08 |
-0.46 |
1.05 |
|
|
Выручка (млн. долларов) |
22 229.90 |
34 841.13 |
11.00 |
321 800.00 |
|
|
ROA2017 |
0.05 |
0.12 |
-0.30 |
3.42 |
|
|
Рыночная стоимость (млн. долларов) |
36 580.84 |
69 405.96 |
337.00 |
926 900.00 |
Описательные статистики веб метрик представлены в таблице 8. Стоит отметить сильную неоднородность данных. В то время как значение Web of Trust изменяется только от одного до пяти и имеет среднее 4.51, максимальное количество проиндексированных страниц в Bing превышает 2 миллиарда при среднем в 73 миллиона.
Таблица 8
Описательные статистики веб метрик
|
Среднее |
Стандартное отклонение |
Минимум |
Максимум |
||
|
Citation Flow |
45.69 |
10.19 |
10.00 |
95.00 |
|
|
Number of Indexed Pages by Google |
233 809.86 |
5 189 781.32 |
0.00 |
167 000 000.00 |
|
|
Number of Indexed Pages by Bing |
2 962 046.43 |
73 443 297.49 |
1.00 |
2 290 000 000.00 |
|
|
Alexa Rank |
6 089.26 |
52 074.87 |
6.00 |
903 833.00 |
|
|
SEMrush Rank |
726 373.94 |
2 963 600.80 |
0.00 |
48 515 994.00 |
|
|
MozRank |
6.33 |
0.64 |
0.00 |
8.71 |
|
|
Trust Flow |
50.93 |
17.71 |
5.00 |
97.00 |
|
|
Web of Trust |
4.51 |
0.62 |
1.00 |
5.00 |
Корреляционная матрица веб метрик представлена в таблице 9. Преимущественно все веб метрики имеют слабую прямую связь. Исключением является SEMrush, так как у данной метрики минимальное значение соответствует максимально высокому уровню качества сайта, поэтому связь с другими метриками является обратной.
Таблица 9
Корреляционная матрица веб метрик
|
MozRank |
Alexa |
Citation Flow |
|
SEMrush |
Trust Flow |
Bing |
Web of Trust |
||
|
MozRank |
1.00 |
||||||||
|
Alexa |
0.18 |
1.00 |
|||||||
|
Citation Flow |
0.49 |
0.36 |
1.00 |
||||||
|
|
0.06 |
0.61 |
0.18 |
1.00 |
|||||
|
SEMrush |
-0.25 |
-0.03 |
-0.27 |
-0.01 |
1.00 |
||||
|
Trust Flow |
0.47 |
0.21 |
0.80 |
0.10 |
-0.26 |
1.00 |
|||
|
Bing |
0.09 |
0.49 |
0.17 |
0.21 |
-0.01 |
0.09 |
1.00 |
||
|
Web of Trust |
0.27 |
0.08 |
0.41 |
0.03 |
-0.12 |
0.44 |
0.03 |
1.00 |
Для лучшего понимания структуры данных о качестве сайта компаний, проводится кластерный анализ. В первую очередь, используется иерархический метод с помощью построения дендрограммы (рисунок 1).
Рис. 1. Дендрограмма
Такое графическое представление данных позволяет понять, на каких уровнях данные группируются и имеют минимальные различия. Так, представляется эффективным разделить данные на три кластера по уровню качества сайта.
График суммы квадратов расстояний по кластерам представлен на рисунке 2 и также подтверждает предположение об эффективности выделения трех кластеров.
Рис. 2. График суммы остатков
После определения оптимального количества кластеров, происходит само разделение на кластеры с помощью метода k-средних, которое заключается в минимизации отклонений точек от центра кластера. Отклонение рассчитывается с использование евклидового расстояния точек x и y в n-мерном пространстве:
, (9)
Для получения корректных результатов перед формированием кластеров данные стандартизируются, чтобы среднее каждой переменной стало равной нулю, а стандартное отклонение равнялось единице:
, (10)
где - новое значение переменной,
- первоначальное значение переменной,
- среднее значение,
- стандартное отклонение.
84% наблюдений были отнесены к одному и тому же кластеру с использованием иерархического подхода и метода k-средних. Описательные статистики показателей по каждому кластеру, определяемому с помощью метода k-средних, представлены в таблице 10.
Так, стоит отметить, что в первый кластер попали компании с самым низким уровнем качества сайтов, в то время как в третьем кластере компании с максимальными средними значениями веб метрик. Самым многочисленным, как и следовало ожидать, оказался кластер с компаниями со средним уровнем качества сайта.
Таблица 10
Средние величины показателей по кластерам
|
Кластер |
1 |
2 |
3 |
|
|
Citation Flow |
35.77 |
46.14 |
60.13 |
|
|
|
5 458.27 |
18 785.20 |
1 227 506.86 |
|
|
Bing |
3 517.25 |
32 677.86 |
16 257 450.83 |
|
|
Alexa |
352.30 |
1 381.20 |
29 017.82 |
|
|
SEMrush |
1 838 303.66 |
357 169.84 |
42 952.46 |
|
|
MozRank |
5.81 |
6.41 |
6.92 |
|
|
Trust Flow |
30.22 |
54.70 |
72.78 |
|
|
Web of Trust |
4.00 |
4.63 |
4.97 |
|
|
N |
313 |
578 |
197 |
|
|
29% |
53% |
18% |
Далее необходимо по каждому получившемуся кластеру сравнить показатели эффективности, в число которых вошли рентабельность активов (ROA), оборачиваемость активов, выручка и рыночная стоимость компании. В сравнении участвуют медианные, а не средние значения, так как они менее подвержены влиянию выбросов. Сравнение показатели эффективности среди кластеров представлено в таблице 11.
Таблица 11
Сравнение показателей эффективности компаний по кластерам
|
Кластер |
1 |
2 |
3 |
|
|
Рентабельность активов (ROA) |
0.03 |
0.04 |
0.05 |
|
|
Оборачиваемость активов |
0.37 |
0.48 |
0.60 |
|
|
Выручка |
7 200 |
11 700 |
17 800 |
|
|
Рыночная стоимость |
9 700 |
18 200 |
38 000 |