Технологический университет
Московский государственный областной университет
Кластеризация организаций высшего образования Московского региона по результатам мониторинга их деятельности
Исаев В.Г.
Протасов Ю.М.
Юров В.М.
Аннотация
Цель. Исследовать возможность использования методов кластерного анализа больших объёмов данных для оценки и выявления особенностей деятельности вузов по результатам их мониторинга.
Процедура и методы. Кластеризация проводилась по ключевым показателям эффективности и качества деятельности вузов Московского региона методом k-means с использованием аналитической платформы «Deductor».
Результаты. Исследование показало возможность применения кластерного анализа для деления образовательных организаций на однородные группы. Проведён сравнительный анализ каждого выделенного кластера, и на этой основе каждому кластеру дана содержательная характеристика с выявлением его особенностей. Определена обобщающая оценка каждого кластера, позволяющая провести их ранжирование.
Теоретическая и / или практическая значимость. Полученные результаты кластерного анализа могут стать основой для повышения обусловленности и качества принимаемых органами государственной власти, учредителями и руководством вузов управленческих решений в области обеспечения конкурентоспособности, эффективности и качества российского высшего образования, а для работодателей и абитуриентов - способствовать рациональному выбору вуза для обучения.
Ключевые слова: мониторинг, ключевые показатели, кластеризация, значимость, среднее значение, коэффициент вариации.
Abstract
Clusterization of Moscow region higher education organizations according to the results of monitoring their activities
V. Isaev, Yu. Protasov, V. Yurov
Technological University
42, Gagarina ul., Korolev, 141070, Moscow region, Russian Federation
Moscow Region State University
24, Very Voloshinoy ul., Mytishchi, 141014, Moscow Region, Russian Federation © CC BY Исаев В.Г., Протасов Ю.М., Юров В.М., 2021.
Aim. To study the possibility of using methods of cluster analysis of large amounts of data to assess and identify the features of the activities of universities based on the results of their monitoring. Methodology. Clustering was carried out according to key indicators of the efficiency and quality of the activities of universities in Moscow region using the k-means method using the analytical platform «Deductor».
Results. The study showed the possibility of using cluster analysis for dividing educational institutions into homogeneous groups. A comparative analysis of each selected cluster is carried out, and on this basis, each cluster is given a meaningful characteristic with the identification of their features. A generalizing assessment of each cluster has been determined, which makes it possible to rank them.
Research implications. The obtained results of cluster analysis can become the basis for increasing the validity and quality of management decisions taken by public authorities, founders and management of universities in the field of ensuring the competitiveness, efficiency and quality of Russian higher education, and for employers and applicants to help in the competent choice of a university for training.
Keywords, monitoring, key indicators, clustering, significance, average value, coefficient of variation
Введение
Развитие отечественной системы образования направлено на повышение его конкурентоспособности и качества Указ Президента Российской Федерации № 204 от 07.05.2018 «О национальных целях и стратегических задачах развития Российской Федерации на период до 2024 года» // Президент России: [сайт]. URL: http://www.kremlin. ru/acts/bank/43027 (дата обращения: 20.01.2021).
Постановление Правительства РФ от 23.05.2015 № 497 «О Федеральной целевой программе развития образования на 2016-2020 годы» (утратило силу) // Гарант: [сайт]. URL: https://base.garant.ru/71044750 (дата обращения: 20.01.2021).. В основе принятия управленческих решений в этой области лежат оценка, мониторинг и сравнительный анализ деятельности вузов [2]. В настоящее время все вузы по результатам мониторинга делятся на 2 группы - «эффективные» и «неэффективные». Это очень грубое деление. Целесообразно использовать более тонкий инструмент деления вузов на группы и описать эти группы для выявления их особенностей. Таким инструментом может стать кластерный анализ. Так, в своей работе О.А. Кузнецова и М.В. Клевина [8] кластерный анализ используют для оценки эффективности 11 университетов из списка «5-100» по разным параметрам и по их совокупности. В итоге получены 2 группы - «лидеры» и «отстающие». Другие исследователи [1; 7] метод кластеризации применяют для деления вузов на группы по результатам вступительных испытаний, а М.В. Забоев и М.И. Мелешкин [5] - для оценки перспектив вхождения российских университетов в первую сотню ведущих мировых университетов.
В данном исследовании мы хотим обосновать возможность использования методов кластерного анализа больших объёмов данных [6] для оценки и выявления особенностей деятельности вузов по результатам их мониторинга. Кластеризация проводилась по ключевым показателям эффективности и качества деятельности вузов Московского региона методом k-means с использованием аналитической платформы «Deductor». Информационной базой для проведения кластеризации являются результаты мониторинга 2018 г. Характеристика системы высшего образования в РФ за 2018 г. // Miccedu.ru. URL: http://indicators.miccedu.ru/ monitoring/2019/index.php?m=vpo (дата обращения: 20.01.2021).. Рассматривались вузы, не имеющие специфики. Результаты мониторинга содержат сведения о 135 организациях высшего образования Московского региона такого профиля. Из этого списка были исключены вузы, по которым отсутствовали данные о трудоустройстве выпускников и о среднем балле поступивших в учебное заведение.
Процедура кластеризации
Кластеризация представляет собой группировку изучаемых объектов по близости их свойств. В каждый кластер входят схожие объекты, они при этом существенно отличаются от объектов, включённых в другие кластеры. Разбиение множества объектов на кластеры даёт возможность выявить закономерности и знания, выдвинуть новые гипотезы, оценить информативность свойств объектов [4].
Использование большого числа показателей при кластеризации приводит к тому, что выделенные кластеры могут и не иметь чёткой структуры [3; 9], поэтому кластеризация проводилась только по ключевым показателям эффективности деятельности вузов. Такими показателями являются:
- ОД - средний балл ЕГЭ поступивших в вуз - показатель эффективности образовательной деятельности;
- НИД - показатель эффективности научно-исследовательской деятельности, представленный объёмом научно-исследовательских и опытно-конструкторских работ на одного научно-педагогического сотрудника (НПР), тыс. руб.;
- МД - доля иностранных студентов (%) - показатель международной деятельности;
- ФЭД - доходы вуза в расчёте на одного НПР - показатель эффективности финансовой и экономической деятельности, тыс. руб.;
- ЗП - отношение заработной платы профессорско-преподавательского состава (ППС) к средней заработной плате по экономике региона, %;
- ТР - доля трудоустроившихся выпускников - показатель уровня востребованности, %;
- ППС - численность остепенённых сотрудников из числа ППС (приведённых к доле ставки) в расчёте на 100 студентов, ед.
Аналитическая платформа «Deductor», используемая для кластеризации, позволила вычислить для каждой характеристики вуза следующие показатели: значимость, среднее значение, стандартное отклонение, стандартную ошибку и другие. В анализе кластеров учитывались 3 показателя: значимость, среднее значение и коэффициент вариации.
Значимость (в%) устанавливается в зависимости от отклонения среднего значения показателя в данном кластере от среднего значения показателя по всей выборке [9]. Коэффициент вариации был рассчитан дополнительно для проверки однородности данных.
Поскольку рассматриваемые показатели деятельности вузов являются метрическими данными, для кластеризации данных использовался эффективный и широко применяемый в этом случае метод k-means. Число кластеров определилось в процессе анализа полученных кластеров. Для этого было построено несколько моделей при различных значениях k, а затем было выбрано наиболее подходящее число кластеров на основе их содержательного анализа. Все характеристики вузов, используемые для кластеризации, считались равнозначными.
Результаты кластеризации
Использование процедуры кластеризации позволило выявить 1 нетипичный объект и 7 кластеров (табл. 1). Для определения формального рейтинга кластеров делалась обобщённая оценка каждого кластера, представляющая собой среднее нормированных средних значений всех характеристик каждого кластера.
Таблица 1. Сравнительный анализ выявленных кластеров
Тable 1. Результаты кластеризации / Clustering Results
|
Кластеры |
Объём кластера |
Обобщённая оценка, баллы |
Характеристики |
||||||||
|
Показатели |
ОД, балл |
МД, % |
НИД, тыс. руб. |
ФЭД, тыс. руб. |
ТР, % |
ЗП, % |
ППС, ед |
||||
|
1 |
22 |
21,94 |
Значимость, % |
97,4 |
37,1 |
92,2 |
55 |
33,9 |
99,6 |
99,9 |
|
|
Среднее знач. |
61,01 |
8,39 |
242,4 |
4133 |
68,4 |
215 |
2,91 |
||||
|
Коэф. вариации, % |
9,33 |
37,6 |
38,26 |
23,37 |
9,93 |
16,24 |
53,95 |
||||
|
2 |
17 |
15,83 |
Значимость, % |
100 |
95,2 |
89,1 |
100 |
98,9 |
97,7 |
42,3 |
|
|
Среднее знач. |
56,25 |
5,42 |
180 |
2513 |
62,35 |
142,7 |
4,58 |
||||
|
Коэф. вариации, % |
7,06 |
41,7 |
45,92 |
29,45 |
19,45 |
49,64 |
27,51 |
||||
|
3 |
16 |
26,79 |
Значимость, % |
52,9 |
99,3 |
20,2 |
42 |
99,8 |
14,7 |
36,7 |
|
|
Среднее знач. |
64,03 |
3,66 |
430,2 |
3668 |
79,37 |
183,3 |
4,62 |
||||
|
Коэф. вариации, % |
6,01 |
46,17 |
72,56 |
15,24 |
8,87 |
21,28 |
25,11 |
||||
|
4 |
17 |
31,55 |
Значимость, % |
99,8 |
94,8 |
14,9 |
74,7 |
41,6 |
59,0 |
89 |
|
|
Среднее знач. |
73,45 |
4,92 |
441,6 |
3446 |
71,17 |
169,86 |
6,05 |
||||
|
Коэф. вариации, % |
5,68 |
51,83 |
74,05 |
27,13 |
9,78 |
20,12 |
35,37 |
||||
|
5 |
9 |
43,02 |
Значимость, % |
93,3 |
100 |
81,0 |
15,0 |
99,3 |
81,6 |
99,9 |
|
|
Среднее знач. |
72,08 |
20,15 |
206 |
3978 |
57,8 |
156 |
8,56 |
||||
|
Коэф. вариации, % |
16,65 |
27,79 |
46,94 |
39,29 |
29,9 |
37,69 |
59,35 |
||||
|
6 |
9 |
55,89 |
Значимость, % |
99,9 |
100 |
86,9 |
86,9 |
89,9 |
93,8 |
48,1 |
|
|
Среднее знач. |
77,75 |
10,95 |
1957 |
6929 |
77,22 |
209,7 |
5,53 |
||||
|
Коэф. вариации, % |
12,18 |
64,29 |
39,55 |
16,99 |
12,59 |
6,49 |
25,68 |
||||
|
7 |
4 |
40,34 |
Значимость, % |
80,3 |
55,5 |
63,7 |
100 |
90,1 |
88,9 |
76,9 |
|
|
Среднее знач. |
59,25 |
4,91 |
714 |
13718 |
80 |
253 |
3,29 |
||||
|
Коэф. вариации, % |
11,31 |
55,6 |
80,67 |
10,96 |
20,41 |
31,75 |
60,49 |
||||
|
Нетипичный объект |
1 |
62,43 |
Значимость, % |
99,9 |
44,7 |
70,9 |
99,9 |
100 |
99,4 |
84,4 |
|
|
Среднее знач. |
99,31 |
1,4 |
838 |
13735 |
35 |
687 |
8,75 |
||||
|
В целом |
95 |
29,79 |
Среднее знач. |
65,78 |
7,77 |
469,5 |
3878 |
66,55 |
180,7 |
4,95 |
Нетипичным объектом является Российская экономическая школа (РЭШ). Этот вуз имеет 5 из 7 показателей с высокой значимостью. Учебное заведение отличают самые высокие значения 4 показателей: среднего балла ЕГЭ (99,31), доходы из всех источников в расчёте на одного НПР (13 735 тыс. руб.), средняя заработанная плата (687%) и численность остепенённых ППС в расчёте на 100 студентов (8,75 ед.). Расходы на НИД также существенно превышают среднее значение по всем рассматриваемым вузам.
Несмотря на высокие значения этих показателей, РЭШ имеет одни из самых низких значений международной деятельности (1,4%) и трудоустройства (35%). В результате вуз имеет самую высокую обобщённую оценку - 62,43 балла.
Первый кластер является смешанным и самым многочисленным. Включает в себя 22 учебных заведения (24,4%), в их числе 4 государственных вуза Москвы (Российский государственный университет имени А.Н. Косыгина, МГУТУ им. К. Разумовского, Московский Политех, РГСУ) и 3 вуза Московской области (Технологический университет, Гжельский государственный университет, РГУТиС). Остальные вузы - негосударственные (Московский архитектурно-строительный институт, Российский новый университет, Московский финансово-юридический университет и др.).
Средние показатели вузов данного кластера имеют противоречивую направленность: если по 2-м направлениям деятельности имеются хорошие результаты (по ФЭД - 2 место, по заработной плате - 3 место), то по 3-м направлениям (ОД, НИД и ППС) имеется существенное отставание (по НИД и ППС - в 1,7 и 1,9 раза). Два других показателя кластера близки к общим средним значениям.
Учебные заведения данного кластера по 6 ключевым показателям являются однородными. И только по 1 показателю (ППС) наблюдается достаточно высокий разброс значений - от 0,67 до 5,99. Обобщённая оценка данного кластера - 21,94. Это существенно ниже средневзвешенной обобщённой оценки - 29,8 (отставание на 26,7%). Данный кластер занимает 6 место из 7.
На основе данного анализа можно предположить, что многие вузы данного кластера в целях повышения показателя ФЭД увеличивают набор за счёт снижения среднего балла ЕГЭ и уменьшения числа остепенённых преподавателей в расчёте на 100 студентов. Это позволяет им увеличивать заработную плату.
Второй кластер включает в себя 17 (18,9%) вузов (практически все негосударственные - частные и автономные). Средние значения всех ключевых показателей вузов данного кластера ниже средних по всей совокупности. 6 из 7 оцениваемых показателей высоко значимы с т. зр. отличия объектов данного кластера от общих средних (значимость на уровне 90% и более), и только по показателю ППС данный кластер не сильно отличается от общей средней.