Статья: Многомерная классификация субъектов РФ по показателям научно-инновационной активности организаций

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

9

МНОГОМЕРНАЯ КЛАССИФИКАЦИЯ СУБЪКТОВ РФ ПО ПОКАЗАТЕЛЯМ НАУЧНО-ИННОВАЦИОННОЙ АКТИВНОСТИ ОРГАНИЗАЦИЙ

Морозова С.Н., канд. экон. наук, Балашова В.В.

Оренбургский государственный университет

При анализе инновационной активности предприятий важно анализировать не только состав, структуру и динамику важнейших показателей научной и инновационной деятельности, но также выявлять факторы, оказывающих влияние на инновационную активность.

В качестве исходных данных примем 85 субъектов Российской Федерации за 2016 год, каждый из которых характеризуется 7 показателями, влияние которых мы будем исследовать:

- инновационная активность организаций в РФ, %;

- среднедушевые доходы, рублей в месяц;

- потребительские расходы в среднем на душу населения, рублей в месяц;

- объем ВРП на душу населения, тыс. рублей в год;

- объем инвестиций в основной капитал на душу населения, тыс. рублей в год;

- оборот розничной торговли на душу населения, тысяч рублей в год;

- уровень занятости населения, %;

- уровень безработицы, %.

Субъекты Российской Федерации имеют разный уровень инновационной активности. Для более полного анализа инновационной деятельности необходимо классифицировать объекты наблюдения по всем признакам, чтобы образовать группы схожих между собой объектов. Эта задача решается с помощью кластерного анализа, который позволяет построить научно обоснованные классификации, выявить внутренние связи между единицами наблюдаемой совокупности.

На основании данных за 2016 год проведем многомерную классификацию субъектов Российской Федерации с помощью кластерного анализа.

В кластерном анализе существуют итеративные методы, в частности, метод - средних и метод поиска сгущений. Их характерная особенность в том, что кластеры формируются исходя из задаваемых условий разбиения, которые в процессе работы алгоритма могут быть изменены пользователем для достижения желаемого качества разбиения. Итеративные методы относятся к быстродействующим, что позволяет использовать их для обработки больших массивов исходной информации.

Перед нами ставится задача провести классификацию объектов с учетом признаков, отражающих сущность, природу объектов. Применительно к решаемой нами задаче используем агломеративный метод кластеризации, который относится к иерархическим процедурам. Данный выбор объясняется отсутствием предварительной информации о количестве кластеров (групп), на которое необходимо разбивать имеющуюся совокупность объектов.

Для реализации процедуры кластерного анализа воспользуемся ППП STATISTICA. Для классификации субъектов воспользуемся методом Уорда. Метод Уорда минимизирует сумму квадратов для любых двух (гипотетических) кластеров, которые могут быть сформированы на каждом шаге. Имеющиеся в нашем распоряжении данные относятся к натуральным, поэтому в качестве меры расстояния используем Евклидово расстояние. Полученную вертикальную дендограмму представим на рисунке 1.

Из рисунка 1 можно сделать вывод о том, что всю совокупность субъектов Российской Федерации можно разбить на 3 группы. Первая заключена между республикой Северная Осетия и Магаданской областью, вторая - между Курганской и Московской областями, третья - между Приморским краем и Белогородской областью.

В силу наличия значительного количества рассматриваемых объектов читаемость на графике имен единиц очень низкая, поэтому дендограмму можно использовать лишь в качестве «разведочного» анализа для получения предварительной информации о количестве групп, на которое необходимо разбить совокупность.

Рисунок 1 - Вертикальная дендограмма объединения в классы субъектов РФ в 2016 году методом Уорда

Использование различных методов иерархического агломеративного кластерного анализа приводит к одинаковым результатам классификации, но метод - средних позволяет получить более устойчивое разбиение. Этот метод требует задания некоторых начальных условий (количество образуемых кластеров, порог завершения процесса классификации и др).

С помощью иерархических агломеративных методов кластерного анализа было выявлено, что 79 субъектов Российской Федерации целесообразно разбить на три класса (рисунок 1). График средних значений в каждом кластере представлен на рисунке 2.

Рисунок 2 - График средних значений по каждой однородной группе

Анализируя график средних значений в каждом кластере, можно сделать следующие выводы:

- первый класс характеризуется, по сравнению с другими классами, наибольшими средними значениями таких показателей как - среднедушевые доходы, рублей в месяц; - потребительские расходы в среднем на душу населения, рублей в месяц; - уровень занятости населения, %, но при этом при достаточно низком уровне безработицы, %.

- показатели второго класса, куда вошли наибольшее количество субъектов Российской Федерации, характеризуются по сравнению с другими кластерами достаточно средним уровнем всех выбранных показателей, при этом средние уровни колеблются от 0 до 0,1 единиц измерения.

- значения третьего кластера характеризуются наименьшими следующими показателями: - среднедушевые доходы, рублей в месяц; - потребительские расходы в среднем на душу населения, рублей в месяц; - уровень занятости населения, %, но при этом при достаточно высоком уровне безработицы. По всем показателям элементы третьего класса являются полной противоположностью элементам первого класса.

Для анализа полученного разбиения объектов на кластеры проведем дисперсионный анализ, рассчитав межгрупповую и внутригрупповую дисперсию. Данные показатели определяем, обратившись к F-статистике Фишера, значения которой показаны в таблице 1.

Таблица 1 - Результаты дисперсионного анализа

Признаки

Межгрупповая дисперсия

SS

Внутригрупповая дисперсия

SS

F

Значимость Р

52,85

2

25,11

75

78,94

0,00

37,41

2

38,79

75

36,17

0,00

21,91

2

55,96

75

14,68

0,04

21,91

2

55,96

75

14,68

0,04

21,91

2

55,96

75

14,68

0,04

42,84

2

35,13

75

45,74

0,01

37,5

2

39,5

75

35,6

0,01

Источник: Составлено автором.

В Таблице 1 содержится наблюденное значение F-статистики Фишера, а также значимость нулевой гипотезы о равенстве межгрупповой и внутригрупповой дисперсий. На уровне значимости 0,05 по всем признакам нулевая гипотеза отвергается. Это говорит о том, что каждый из признаков вносит существенный вклад в разделение субъектов РФ на три группы.

После того, как мы определились, на сколько кластеров мы разбили нашу исходную совокупность, необходимо рассмотреть количество объектов в кластерах, состав кластеров.

В первый кластер вошли 9 объектов - Московская область, Мурманская область, Тюменская область, Ханты-Мансийский Автономный округ, Республика Саха, Камчатский край, Хабаровский край, Магаданская область и Сахалинская область. В третий кластер вошли 14 объектов - республика Карелия, республика Адыгея, республика Калмыкия, г. Севастополь, Кабардино-Балкарская республика, Карачаево-Черкесская республика, республика Северная Осетия, Чеченская республика, Курганская область, республика Алтай, республика Бурятия. Республика Хакасия, Забайкальский край, еврейская Автономная область.

Все остальные 55 субъектов, в том числе и Оренбургская область, которые не были включены в предыдущие два кластера, относятся ко второму.

В таблице 2 представлены Евклидовы расстояния между классами по методу - средних.

Таблица 2 - Евклидовы расстояния между кластерами

Номер кластера

Кластер № 1

Кластер № 2

Кластер № 3

Кластер № 1

0,00

1,92

3,86

Кластер № 2

1,39

0,00

1,55

Кластер № 3

1,97

1,25

0,00

Источник: Составлено автором

Из таблицы 2 можно сделать вывод о том, что наименьшее расстояние наблюдается между вторым и третьим кластером (1,25). Причем ниже главной диагонали указаны расстояния между классами, рассчитанные по метрике обычного евклидового расстояния, а выше главной диагонали - расстояния между классами, рассчитанные по метрике квадратичного евклидового расстояния.

По полученным классификациям субъектов Российской Федерации в 2016 году по уровню инновационной активности были рассчитаны функционалы качества, представленные в таблице 3.

Таблица 3 - Значения функционала качества для классификаций субъектов РФ в 2016 году по уровню инновационной активности различными методами

Название метода

классификации

Сумма квадратов расстояний от

каждого объекта до центра

Значение

функционала

качества

1 кластера

2 кластера

3 кластера

Метод Уорда

137,46

20,72

17,47

180,5

Метод -средних

137,46

4,95

23,71

180,6

Источник: Составлено автором

Согласно данным таблицы 3 по выбранному функционалу качества (суммы квадратов расстояний от каждого объекта до центра кластера) наилучшей является классификация, полученная методом - средних.

Согласно классификации методом - средних первый класс субъектов Российской Федерации характеризуется наибольшими средними значениями таких признаков, как - среднедушевые доходы, рублей в месяц; - потребительские расходы в среднем на душу населения, рублей в месяц; - уровень занятости населения, %, но при этом при достаточно низком уровне безработицы, %. Исходя из полученных данных, можно сказать что объекты, вошедшие в первый кластер, имеют высокий уровень инновационного развития. Третий класс характеризуются абсолютно противоположными значениями по сравнению с первым классом.

Субъекты второго класса характеризуются средними значениями таких признаков как - среднедушевые доходы, рублей в месяц; - потребительские расходы в среднем на душу населения, рублей в месяц; - объем ВРП на душу населения, тыс. рублей в год; - объем инвестиций в основной капитал на душу населения, тыс. рублей в год; - оборот розничной торговли на душу населения, тысяч рублей в год; - уровень занятости населения, %; - уровень безработицы, %. Поэтому вошедшие во второй кластер объекты можно охарактеризовать как объекты со средним уровнем инновационного развития.

Элементы третьего класса характеризуются такими низкими средними значениями, как среднедушевые доходы, средние потребительские расходы, низким уровнем занятости населения и высоком уровне безработицы. Поэтому данный класс можно охарактеризовать как регионы с низким уровнем инновационного развития предприятий.

В состав каждого кластера входят следующие субъекты:

- 9 субъектов РФ (Московская область, Мурманская область, Тюменская область, Ханты-Мансийский Автономный округ, Республика Саха, Камчатский край, Хабаровский край, Магаданская область и Сахалинская область) являются регионами с высоким уровнем инновационного развития предприятий;

- 14 субъектов (республика Карелия, республика Адыгея, республика Калмыкия, г. Севастополь, Кабардино-Балкарская республика, Карачаево-Черкесская республика, республика Северная Осетия, Чеченская республика, Курганская область, республика Алтай, республика Бурятия. Республика Хакасия, Забайкальский край, Еврейская Автономная область) можно охарактеризовать как регионы с низким уровнем развития научно-инновационной деятельности предприятий.