Дипломная работа: Влияние качества сайта компании на результаты ее деятельности

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Таблица 5

Статистика по регионам

Регион

Число компаний

Страна

%

Америка

427

(39%)

США

33%

Канада

3%

Бразилия

1%

Мексика

1%

Другие

1%

Европа

354

(33%)

Соединенное Королевство

6%

Франция

4%

Германия

4%

Швейцария

3%

Швеция

2%

Италия

2%

Россия

2%

Другие

9%

Азия

272

(25%)

Япония

7%

Индия

4%

Китай

3%

Гонконг

2%

Южная Корея

2%

Другие

7%

Австралия

26

(2%)

Австралия

2%

Африка

9

(1%)

Южная Африка

1%

Компании из базы данных ведут деятельность более чем 80 индустриях, которые объединены в 11 секторов (таблица 6). Четверть компаний из базы данных ведут финансовую деятельность, при этом максимальный процент составляют региональные банки (11%). По 16% компаний вошли в сектор товаров не первой необходимости и индустриальный сектор. Далее следуют сектор производства материалов, и информационные технологии, которые составили по 9% и 7% соответственно.

Таблица 6

Статистика по секторам

Сектор

Число компаний

Индустрия

%

Финансовый сектор

270

(25%)

Региональные банки

11%

Ведущие банки

4%

Инвестиционные услуги

3%

Страхование

3%

Другие

4%

Второстепенные потребительские товары

168

(16%)

Уход за собой и домом

2%

Автозапчасти

2%

Авто производители

2%

Электроника

1%

Другие

9%

Индустриальный сектор

163

(16%)

Бизнес и персональные услуги

3%

Конгломераты

2%

Авиалинии

2%

Строительство

2%

Другие

7%

Материалы

99

(9%)

Добыча полезных ископаемых

2%

Специализированные химические вещества

2%

Многоотраслевые химические вещества

2%

Другие

3%

Информационные технологии

80

(7%)

Полупроводники

2%

Программное обеспечение

2%

Компьютерные услуги

2%

Другие

1%

Энергетический сектор

70

(6%)

Нефтегазовые операции

4%

Другое индустриальное оборудование

1%

Нефтяные услуги и оборудование

1%

Товары первой необходимости

65

(6%)

Производство продуктов питания

3%

Розничная торговля продуктами питания

3%

Здравоохранение

64

(6%)

Фармацевтические препараты

3%

Другие

3%

Коммунальные услуги

48

(4%)

Электричество

3%

Природный газ

1%

Телекоммуникации

34

(3%)

Телекоммуникации

3%

Недвижимость

27

(2%)

Недвижимость

2%

Описательные статистики контрольных переменных представлены в таблице 7. Средний возраст компаний превысил 70 лет с максимальным значением 545. Максимальное количество работников превысило 600 тысяч человек при среднем около 56 тысяч. При этом среднее значение выручки составляет примерно 22 миллиарда долларов, а активов около 114 миллиардов долларов.

Таблица 7

Описательные статистики переменных

Среднее

Стандартное отклонение

Минимум

Максимум

Возраст (лет)

70.45

54.12

1.00

545.00

Количество работников (чел.)

55 766.83

84 402.75

7.00

626 715.00

Активы (млн. долларов)

113 812.95

338 900.65

0.00

4 210 900.00

ROA2010

0.04

0.08

-0.46

1.05

Выручка (млн. долларов)

22 229.90

34 841.13

11.00

321 800.00

ROA2017

0.05

0.12

-0.30

3.42

Рыночная стоимость (млн. долларов)

36 580.84

69 405.96

337.00

926 900.00

Описательные статистики веб метрик представлены в таблице 8. Стоит отметить сильную неоднородность данных. В то время как значение Web of Trust изменяется только от одного до пяти и имеет среднее 4.51, максимальное количество проиндексированных страниц в Bing превышает 2 миллиарда при среднем в 73 миллиона.

Таблица 8

Описательные статистики веб метрик

Среднее

Стандартное отклонение

Минимум

Максимум

Citation Flow

45.69

10.19

10.00

95.00

Number of Indexed Pages by Google

233 809.86

5 189 781.32

0.00

167 000 000.00

Number of Indexed Pages by Bing

2 962 046.43

73 443 297.49

1.00

2 290 000 000.00

Alexa Rank

6 089.26

52 074.87

6.00

903 833.00

SEMrush Rank

726 373.94

2 963 600.80

0.00

48 515 994.00

MozRank

6.33

0.64

0.00

8.71

Trust Flow

50.93

17.71

5.00

97.00

Web of Trust

4.51

0.62

1.00

5.00

Корреляционная матрица веб метрик представлена в таблице 9. Преимущественно все веб метрики имеют слабую прямую связь. Исключением является SEMrush, так как у данной метрики минимальное значение соответствует максимально высокому уровню качества сайта, поэтому связь с другими метриками является обратной.

Таблица 9

Корреляционная матрица веб метрик

MozRank

Alexa

Citation Flow

Google

SEMrush

Trust Flow

Bing

Web of Trust

MozRank

1.00

Alexa

0.18

1.00

Citation Flow

0.49

0.36

1.00

Google

0.06

0.61

0.18

1.00

SEMrush

-0.25

-0.03

-0.27

-0.01

1.00

Trust Flow

0.47

0.21

0.80

0.10

-0.26

1.00

Bing

0.09

0.49

0.17

0.21

-0.01

0.09

1.00

Web of Trust

0.27

0.08

0.41

0.03

-0.12

0.44

0.03

1.00

Для лучшего понимания структуры данных о качестве сайта компаний, проводится кластерный анализ. В первую очередь, используется иерархический метод с помощью построения дендрограммы (рисунок 1).

Рис. 1. Дендрограмма

Такое графическое представление данных позволяет понять, на каких уровнях данные группируются и имеют минимальные различия. Так, представляется эффективным разделить данные на три кластера по уровню качества сайта.

График суммы квадратов расстояний по кластерам представлен на рисунке 2 и также подтверждает предположение об эффективности выделения трех кластеров.

Рис. 2. График суммы остатков

После определения оптимального количества кластеров, происходит само разделение на кластеры с помощью метода k-средних, которое заключается в минимизации отклонений точек от центра кластера. Отклонение рассчитывается с использование евклидового расстояния точек x и y в n-мерном пространстве:

, (9)

Для получения корректных результатов перед формированием кластеров данные стандартизируются, чтобы среднее каждой переменной стало равной нулю, а стандартное отклонение равнялось единице:

, (10)

где - новое значение переменной,

- первоначальное значение переменной,

- среднее значение,

- стандартное отклонение.

84% наблюдений были отнесены к одному и тому же кластеру с использованием иерархического подхода и метода k-средних. Описательные статистики показателей по каждому кластеру, определяемому с помощью метода k-средних, представлены в таблице 10.

Так, стоит отметить, что в первый кластер попали компании с самым низким уровнем качества сайтов, в то время как в третьем кластере компании с максимальными средними значениями веб метрик. Самым многочисленным, как и следовало ожидать, оказался кластер с компаниями со средним уровнем качества сайта.

Таблица 10

Средние величины показателей по кластерам

Кластер

1

2

3

Citation Flow

35.77

46.14

60.13

Google

5 458.27

18 785.20

1 227 506.86

Bing

3 517.25

32 677.86

16 257 450.83

Alexa

352.30

1 381.20

29 017.82

SEMrush

1 838 303.66

357 169.84

42 952.46

MozRank

5.81

6.41

6.92

Trust Flow

30.22

54.70

72.78

Web of Trust

4.00

4.63

4.97

N

313

578

197

29%

53%

18%

Далее необходимо по каждому получившемуся кластеру сравнить показатели эффективности, в число которых вошли рентабельность активов (ROA), оборачиваемость активов, выручка и рыночная стоимость компании. В сравнении участвуют медианные, а не средние значения, так как они менее подвержены влиянию выбросов. Сравнение показатели эффективности среди кластеров представлено в таблице 11.

Таблица 11

Сравнение показателей эффективности компаний по кластерам

Кластер

1

2

3

Рентабельность активов (ROA)

0.03

0.04

0.05

Оборачиваемость активов

0.37

0.48

0.60

Выручка

7 200

11 700

17 800

Рыночная стоимость

9 700

18 200

38 000