Рисунок 27. Наблюдаемые и расчетные значения модели 6
(7)
Модифицированная показательная модель хорошо объясняет связь между индексом человеческого развития и индексом сетевой готовности. Модель 7 статистически значима, и ее объясняющая способность высокая (R2=0,815), остатки подчиняются нормальному закону распределения (Таблица 11). Модельные значения хорошо аппроксимируют наблюдаемые (Рисунок 28).
Таблица 11. Регрессионная модель модифицированной экспоненты (7) с зависимой переменной HDI и независимой NRI
|
Параметры модели |
Значения |
|
|
k |
1,205 |
|
|
-1,654 |
||
|
0,731 |
||
|
ESS |
0,5799 |
|
|
TSS |
3,133 |
|
|
0,815 |
||
|
F-статистика |
607,602 |
|
|
p-value |
0 |
|
|
N |
140 |
|
|
AIC |
-361,785 |
|
|
Тест на нормальность распределения ошибок |
||
|
Статистика Шапиро-Уилкса |
0,986 |
|
|
Значимость |
0,153 |
Рисунок 28. Наблюдаемые и расчетные значения модели 7
Итак, все модели и их параметры статистически значимы. Объясняющая способность всех моделей высокая (R2>0,8), особенно, она выше у нелинейных моделей, остатки по всем моделям распределены нормально. Для объяснения влияния индекса сетевой готовности на индекс человеческого развития подходит как логистическая модель, так и модель модифицированной экспоненты. Однако модель модифицированной экспоненты обладает наилучшими информационными критериями. Наибольшее влияние изменения в цифровом развитии оказывают на качество жизни в развивающихся странах, в отстающих странах и развитых странах эта связь слабее. Связь между глобальным индексом подключенияи индексом человеческого развития представляется в форме модифицированной экспоненты: для развивающихся стран влияние улучшения в цифровом развитие больше сказывается на качестве жизни, чем в развитых странах.
3.2 Разбиение стран на кластеры в зависимости от уровня их цифрового развития. Описание и сравнение полученных кластеров
Страны мира характеризуются высокой дифференциацией по развитию цифровых технологий. В связи с неоднородностью показателей и нелинейностью изучаемых связей, возникает проблема гетероскедастичности и неэффективности оценок. Данную проблему можно решить путем разбиения стран на однородные группы и выявления связей между показателями в каждой из групп. Кроме того, для оценки структуры развития цифровых технологий по миру необходимо выявить группы стран, схожих по показателям доступности цифровых технологий, их использования и влияния на экономическую и социальную сферы.
Чтобы оценить влияние каждой сферы развития цифровых технологий, среды, готовности, использования и влияния ИКТ, на выделение однородных групп и состав этих групп, были проведены кластерный и дискриминантный анализы. Методом к-средних страны были разбиты на три группы по уровню развития цифровых технологий на основе десяти компонент индекса сетевой готовности. Третий кластер включает 37 стран, которые обладают максимальными средними значениями по всем показателем (Таблица 12). Данный кластер характеризует страны-лидеры с высоким развитием цифровых технологий. К странам-лидерам по развитию цифровых технологий относятся страны Западной Европы и Северной Америки, а такие нефтедобывающие страны, как Катар и Саудовская Аравия, а также Малайзия (Таблица 32). Наиболее характерные для данного кластера следующие страны: Франция, Бельгия, Эстония, они наиболее близко расположены к центру кластера. Средние значения по показателям первого кластера лежат между значениями второго и третьего кластеров (Рисунок 29). Однако по четвертой компоненте, доступности цифровых технологий, кластеры не отличаются. Страны первого кластера отстают от стран-лидеров по цифровому развитию и являются развивающимися в сфере цифровых технологий и их использования. Кластер является самым многочисленным и включает 58 стран. В основном, это страны Восточной Европы, Азии и развитые страны Африки. Наиболее характерные страны для этого кластера: Таиланд, Молдова, Румыния. Также к кластеру развивающихся в области цифровых технологий относится и Россия (Таблица 32).
Второй кластер - кластер отстающих по развитию цифровых технологий. Средние значения по всем показателям ниже, чем у первого и третьего кластеров. В основном, кластер состоит из стран Африки, всего, к этому кластеру относится 42 страны. Наиболее типичные страны для второго кластера: Габон, Танзания, Нигерия.
Таблица 12. Конечные центры кластеров
|
Кластеры |
||||
|
Показатели |
1 |
2 |
3 |
|
|
pil1 |
3,58 |
3,25 |
4,98 |
|
|
pil2 |
4,26 |
3,60 |
5,15 |
|
|
pil3 |
3,98 |
2,39 |
6,08 |
|
|
pil4 |
5,51 |
3,62 |
5,48 |
|
|
pil5 |
4,95 |
3,26 |
5,83 |
|
|
pil6 |
3,95 |
2,19 |
5,92 |
|
|
pil7 |
3,55 |
3,16 |
4,94 |
|
|
pil8 |
3,95 |
3,18 |
4,98 |
|
|
pil9 |
3,18 |
2,65 |
4,79 |
|
|
pil10 |
4,13 |
3,06 |
5,32 |
Рисунок 29. График средних значений показателей в кластерах
С помощью дискриминантного анализа определим роль каждой переменной в разбиении стран на кластеры. Лямбда Уилкса позволяет оценить дискриминирующую способность переменных. Так, наилучшей дискриминирующей способностью обладает шестая компонента индекса сетевой готовности, отвечающая за индивидуальное использование цифровых технологий. Наибольшей разностью средних значений по кластерам (F) обладает также шестая компонента (292,9) (Таблица 13). Все переменные значимы на уровне значимости 0,01. Между переменными, включенными в дискриминантный анализ отсутствует высокая корреляция (Таблица 33).
Таблица 13. Критерии равенства групповых средних
|
Лямбда Уилкса |
F |
df1 |
df2 |
Значимость |
||
|
pil1 |
,389 |
105,080 |
2 |
134 |
,000 |
|
|
pil2 |
,310 |
149,272 |
2 |
134 |
,000 |
|
|
pil3 |
,231 |
223,203 |
2 |
134 |
,000 |
|
|
pil4 |
,573 |
49,837 |
2 |
134 |
,000 |
|
|
pil5 |
,270 |
181,299 |
2 |
134 |
,000 |
|
|
pil6 |
,186 |
292,881 |
2 |
134 |
,000 |
|
|
pil7 |
,286 |
167,562 |
2 |
134 |
,000 |
|
|
pil8 |
,425 |
90,796 |
2 |
134 |
,000 |
|
|
pil9 |
,227 |
228,535 |
2 |
134 |
,000 |
|
|
pil10 |
,277 |
174,966 |
2 |
134 |
,000 |
Согласно тесту Бокса о равенстве ковариационных матриц, гипотеза о принадлежности многомерному нормальному закону отвергается с вероятностью ошибки б=0,05, следовательно, нарушается многомерное нормальное распределение. Однако, это не говорит о плохом качестве модели. В Таблица 15представлены собственные значения дискриминантных функций. Собственное значение характеризует отношение межгрупповой дисперсии к внутригрупповой дисперсии выборочных значений дискриминантной функции. Так, более точной оказалась первая дискриминантная функция, ее собственное значение выше, чем у второй функции. Кроме того, первая дискриминантная функция обладает максимальным значением канонической корреляции, что свидетельствует о высоком качестве достоверности дискриминации.
Таблица 14 Критерий Бокса равенства ковариационных матриц
|
М Бокса |
307,058 |
||
|
F |
Примерная |
2,482 |
|
|
df1 |
110 |
||
|
df2 |
38557,040 |
||
|
Значимость |
,000 |
Таблица 15. Собственные значения дискриминационных функций
|
Функция |
Собственное значение |
% дисперсии |
Суммарный % |
Каноническая корреляция |
|
|
1 |
6,809 |
86,2 |
86,2 |
,934 |
|
|
2 |
1,091 |
13,8 |
100,0 |
,722 |
Лямбда Уилкса характеризует долю дисперсии значений дискриминантной функции, не обусловленную различиями между группами. Наименьшим значением лямбды Уилкса обладает первая дискриминантная функция (0,061,Таблица 16). Итак, первая дискриминантная функция обладает лучшими характеристиками, следовательно, в дальнейшем анализе будем рассматривать только ее.
Таблица 16. Лямбда Уилкса дискриминационных функций
|
Критерий для функций |
Лямбда Уилкса |
Хи-квадрат |
df |
Значимость |
|
|
1 through 2 |
,061 |
361,688 |
20 |
,000 |
|
|
2 |
,478 |
95,529 |
9 |
,000 |
Коэффициенты стандартизованной канонической дискриминантной функции (Таблица 17) определяют приоритетность факторов при включении новых объектов в кластеры. Так, значительную роль при включении элементов в кластеры играет шестая компонента индекса сетевой готовности, характеризующая индивидуальное использование цифровых технологий, также значительную роль играют восьмая и третья компоненты, отвечающие за государственное использование и инфраструктуру.
Таблица 17. Коэффициенты стандартизованной канонической дискриминантной функции
|
Функция |
|||
|
1 |
2 |
||
|
pil1 |
-,127 |
-,390 |
|
|
pil2 |
,107 |
,114 |
|
|
pil3 |
,217 |
-,245 |
|
|
pil4 |
,205 |
,527 |
|
|
pil5 |
,240 |
,643 |
|
|
pil6 |
,388 |
,018 |
|
|
pil7 |
,057 |
-,139 |
|
|
pil8 |
,252 |
,009 |
|
|
pil9 |
,195 |
-,550 |
|
|
pil10 |
,087 |
,274 |
Коэффициенты корреляции также характеризуют, какие переменные обладают высоким значением в модели. Так, наибольшую часть берет на себя шестая (индивидуальное использование) компонента, а также третья (инфраструктура), девятая (экономическое влияние) и десятая (социальное влияние) компоненты, они в большей степени определяет, какой объект к какому кластеру будет отнесен (Таблица 18). Ненормированные коэффициенты позволяют вычислить значение дискриминантной функции для новых объектов (Таблица 19).
Таблица 18. Матрица структуры дискриминантных функций
|
Функция |
|||
|
1 |
2 |
||
|
pil6 |
,801* |
-,055 |
|
|
pil3 |
,697* |
-,144 |
|
|
pil9 |
,674* |
-,539 |
|
|
pil10 |
,619* |
-,046 |
|
|
pil5 |
,617* |
,327 |
|
|
pil7 |
,570* |
-,514 |
|
|
pil2 |
,570* |
-,122 |
|
|
pil8 |
,444* |
-,099 |
|
|
pil4 |
,275 |
,457* |
|
|
pil1 |
,445 |
-,447* |
Модель обладает хорошим качеством, так как значение лямбды Уилкса невысокое, а достоверность дискриминации высокая. В распределении стран на кластеры наибольшее влияние оказывают индивидуальное использование цифровых технологий, инфраструктура и социально-экономическое влияние.