На четвертом этапе сравнительной оценки инвестиционной привлекательности каждому региону присваивается рейтинг инвестиционной привлекательности - индекс, определяющий соотношение между уровнем интегрального инвестиционного риска и величиной совокупного инвестиционного потенциала региона. По соотношению величины совокупного потенциала и интегрального риска каждый регион России относится к одной из следующих рейтинговых категорий:
- высокий потенциал - минимальный риск (1A);
- высокий потенциал - умеренный риск (1B);
- высокий потенциал - высокий риск (1C);
- средний потенциал - минимальный риск (2A);
- средний потенциал - умеренный риск (2B);
- средний потенциал - высокий риск (2C);
- пониженный потенциал - минимальный риск (3A1);
- незначительный потенциал - минимальный риск (3A2);
- пониженный потенциал - умеренный риск (3B1);
- пониженный потенциал - высокий риск (3C1);
- незначительный потенциал - умеренный риск (3B2);
- незначительный потенциал - высокий риск (3C2);
- низкий потенциал - экстремальный риск (3D).
В отличие от агентства «РАЭКС-Аналитика» «Национальное Рейтинговое Агентство» в своей методике использует 7 групп показателей: географическое положение и природные ресурсы; трудовые ресурсы региона; региональная инфраструктура; внутренний рынок региона (потенциал регионального спроса); производственный потенциал региональной экономики; институциональная среда и социально-политическая стабильность; финансовая устойчивость регионального бюджета и предприятий региона. Всего используется набор из 55 показателей.
У агентства «Эксперт РА» рейтинг региона строится на основе анализа блоков факторов: самостоятельной кредитоспособности региона с учетом подверженности внутренним стресс-факторам и значимости внешних факторов поддержки и стресс-факторов. Изначально определяется рейтинг самостоятельной кредитоспособности региона, далее производится корректировка на внешние факторы поддержки и стресс-факторы для определения итогового рейтингового числа.
После оценки блоков факторов, отнесенных к внутренней кредитоспособности, агентство производит оценку внутренних стресс-факторов, в соответствии с которой корректирует ранее полученное рейтинговое число и получает рейтинговое число для рейтинга самостоятельной кредитоспособности.
По мнению кредитного рейтингового агентства, как правило, чем выше рейтинговое число, тем выше рейтинговая оценка и ниже риск невыполнения объектом рейтинга обязательств. Вместе с тем итоговое предложение по кредитному рейтингу должно учитывать то, что в отдельных случаях, оговоренных ниже, рейтинг присваивается вне зависимости от рейтингового числа [11].
Все исследованные агентства имеют свою рейтинговую шкалу: Национальное Рейтинговое Агентство использует разделение оценки на 3 категории, которые имеют деление на подкатегории; шкала агентства «РАЭКС-Аналитика» является более сложной, деление зависит от общего потенциала и риска региона; шкала агентства «Эксперт РА» делится на 11 категорий, при этом подкатегории не имеют подробного описания.
Отметим, что из рассмотренных агентств только «РАЭКС-Аналитика» предоставляет в открытом доступе подробное описание своей методологии.
2. Разработка оценочной модели инвестиционной привлекательности городских округов Краснодарского края
На основании результатов работы, описанной в статье «Использование методов машинного обучения и искусственного интеллекта для анализа социально-экономического развития городских округов, районов и поселений Краснодарского края» [12], использовались 13 статистических показателей, представленных в виде таблицы коэффициентов x1..x13 (рис. 9). Анализировались данные (рис. 10) с 2009 по 2018 по городским округам: Краснодар, Анапа, Армавир, Геленджик, Горячий Ключ, Новороссийск, Сочи. Переработав результаты работы [12], была разработана оценочная модель инвестиционной привлекательности городских округов Краснодарского края. Для анализа использовались статистические данные с сайта «Федеральная государственная статистика» [13].
Рисунок 9 Таблица коэффициентов
Рисунок 10 Фрагмент таблицы исходных данных
В связи с тем, что городские поселения сильно различаются по первому коэффициенту x1 (численность населения), остальные показатели были приведены на душу населения, исключая x2 «среднемесячная заработная плата работников организаций», х13 «Общая площадь жилых помещений, приходящаяся в среднем на одного жителя - всего», поскольку они являются приведёнными на душу населения. В дальнейшем x1 отбрасывается из анализа.
Для каждого коэффициента x2..x13 была найдена предварительная оценка, опираясь на минимальное, максимальное и среднее значение по каждому столбцу.
Рисунок 11 Гистограмма для х2, x3
Значения были разбиты на 5 интервалов пента-шкалы таким образом, чтобы каждому интервалу принадлежало одинаковое число наблюдений: очень низкий (ОН), низкий (Н), средний (С), высокий (В) и очень высокий (ОВ). В зависимости от попадания в один из интервалов по каждому из столбцов x2..x13 присваивается оценочный балл {0,1; 0,3; 05; 07; 0,9} соответственно (рис. 12).
К примеру, для показателя x2 были определены следующие интервалы:
1. Очень низкий [9000; 14000);
2. Низкий [14000; 17000);
3. Средний [17000; 20100);
4. Высокий [20100; 24100);
5. Очень высокий от 24100 и более.
Рисунок 12 Фрагмент пента-таблицы
Затем, для каждого наблюдения х2-х13, находилось среднее значение: для каждой строки (столбец «среднее значение» согласно рисунку 12) складывались все оценочные баллы, производилось деление на их число в каждой строке. Полученный итог переводился в пента-шкалу и присваивался рейтинг, в зависимости от принадлежности к оценочному интервалу: [0; 0,34) - очень низкий; [0,34; 0,44) - низкий; [0,44;0,6] - средний; [0,6;0,7) - высокий; [0,7;1] - очень высокий. Полученные данные обозначены как y.
Для оценки правильности предварительной оценки рассмотрим матрицы классификаций (рис. 13) - инструмент дискриминантного анализа в среде STATISTICA. На рисунке видно, что процент совпадений предварительной оценки городских округов и дискриминантного анализа достаточно высокий от 75 до 100%. Следовательно, интервалы, определённые при предварительной оценке являются верными.
Рисунок 13 Матрица классификации городских округов
Для проверки предварительной оценки используется дискриминантный анализ (квадратов расстояния Махаланобиса) в среде STATISTICA (рис. 14). Очевидно, что рейтинги: Краснодар 2010, Анапа 2011, Анапа 2017, Геленджик 2009, Геленджик 2017 - были определены не верно.
Рисунок 14 Проверка и корректировка предварительной оценки городских округов Краснодарского края
По наименьшему расстоянию до центра групп, скорректируем оценку. Так, например, минимальное расстояние для Анапа 2011 будет в столбце «высокий», а предварительная оценка показала статус - «среднее». Соответственно меняем оценку на «низкое».
Однако, иногда дискриминантный анализ может давать некорректные результаты. Армавир 2015 - предварительная оценка совпадает с расстоянием до центра группы, хотя дискриминантный анализ и выдает их как неправильно классифицированные (рис 15). Это происходит потому, что при дискриминантном анализе рассматривается только линейные зависимости. Чтобы проследить и изучить нелинейные зависимости лучше использовать нечеткие продукционные методы.
Рисунок 15 Пример ошибочной классификации
Лямбда Уилкса используется в стандартной статистике для обозначения статистической значимости мощности дискриминации в текущей модели. Ее значение меняется от 1.0 (нет никакой дискриминации) до 0.0 (полная дискриминация); чем ближе Лямбда Уилкса к 0, тем меньше вероятность ошибочного разделения. Частная лямбда Уилкса показывает одиночный вклад соответствующей переменной в дискриминацию между совокупностями.
В приведённых ниже итогах анализа дискриминации муниципальных районов Краснодарского края видно, что вероятность ошибочного разделения достаточна мала и особо выражена для переменных х7, x3, x4, x8 и x12 (рис.16). В ходе анализа алгоритмом STATISTICA из модели были исключены переменные x2, x5, x10, x13 из-за наличия значительной линейной зависимости.
Рисунок 16 - Итоги анализа дискриминантных функций муниципальных районов Краснодарского края
На основе дискриминантного анализа получены следующие уравнения:
С помощью корреляционного анализа выяснили, какие из коэффициентов х2 - х13 являются статистически зависимыми (рис. 17). Если коэффициента корреляции между показателями по модулю меньше 0,75, корреляция не является сильной, то коэффициенты являются независимыми.
Рисунок 17 Таблица попарных корреляций
Для наглядности воспользуемся графическими возможностями языка Python. Тепло-карта корреляционных зависимостей показывает, что сильную корреляцию (не менее 0.75) имеют переменные x4 и x5.
Рисунок 18 Тепло-карта корреляций
Показатели x4 «Объем производства продукции сельского хозяйства» и x5 «Объем производства продукции растениеводства» являются стратегически значимым в рамках оценки Краснодарского края и исключить их из оценочной модели невозможно.
В исследовании провели кластерный анализ в STATISTICA, разделив на 5 кластеров. Проанализировав разбиение, и, учтя скорректированную оценку, выявили закономерности в каждом из кластеров (рис. 19). В кластер номер 5 входят элементы всех рейтингов за исключением «очень высокий»: Анапа 2009 рейтинг «высокое», Анапа 2011 рейтинг «среднее», Армавир 2009 рейтинг «очень низкое». Выявили, что кластерный анализ ошибочно группирует наблюдения из-за того, что он не учитывает латентные нелинейные связи между коэффициентами (переменными) модели.
Рисунок 19 Элементы кластера номер 2. Кластерный анализ городских округов Краснодарского края
В исследовании использован метод деревьев классификации для прогнозирования принадлежности наблюдений (объектов) к тому или иному классу значений зависимой категориальной переменной на основании значений одной или нескольких предикторных переменных. Для построения дерева использованы возможности среды STATISTICA.
Построенное дерево классификаций для определения рейтинга городских округов Краснодарского края имеет структуру, представленную на рисунке 20.
Рисунок 20 Граф дерева классификаций
Построенное дерево совершает три ошибочных классификации (рис. 21) на стадии обучения: классифицирует два объекта класса «низкое» как класс «среднее», и один объект из класса «высокое» как объект класса «низкое». Так же оно успешно определило все 5 классов.
Рисунок 21 Ошибки классификаций на обучающей выборке
Однако, на стадии кросс-проверки дерево ошибочно классифицирует 36 объектов из выборки (рис. 22).
Рисунок 22 Матрица ошибок классификации на стадии кросс-проверки
Данное исследование позволило заключить, что линейных методов многомерного статистического анализа данных [12, 14, 29, 30] недостаточно для составления подобных рейтинговых систем. Для адекватной и достоверной оценки данных, имеющих латентные не линейные связи, необходимо использовать системы искусственного интеллекта, нейросетевые технологии и т. д. [15-28].
Заключение
В данной работе при сопоставительном анализе оценок рейтинговых агентств «РАЭКС-Аналитика», «Национальное Рейтинговое Агентство» и «Эксперт РА» было выявлено, что Краснодарский край имеет высокую инвестиционную привлекательность и высокий уровень кредитоспособности.
При анализе методологий рейтинговых агентств «РАЭКС-Аналитика», «Национальное Рейтинговое Агентство» и «Эксперт РА» были обнаружены следующие недостатки: некоторые из рассмотренных агентств не предоставляют ссылки на источники, из которых берутся статические показатели, в том числе агентство «Национальное Рейтинговое Агентство»; только у агентства «РАЭКС-Аналитика» имеется в открытом доступе подробная методология присвоения рейтинговых оценок; не все агентства дают однозначную характеристику рейтинговых оценок.
На основе проведенных в [12] исследований в данной статье была разработана модель дискриминантного анализа в среде STATISTICA для оценки социально-экономического развития городских округов Краснодарского края (1) с достоверностью 85%, включающая показатели, нормированные на душу населения, за исключением уже приведённых показателей «среднемесячная заработная плата работников организаций», «Общая площадь жилых помещений, приходящаяся в среднем на одного жителя - всего»: Текущие (эксплуатационные) затраты на охрану окружающей среды, включая оплату услуг природоохранного назначения; Объем производства продукции сельского хозяйства; Объем производства продукции растениеводства; Объем производства продукции животноводства; Ввод в действие жилых домов на территории муниципального образования; Общий объем всех продовольственных товаров, реализованных в границах муниципального района, в денежном выражении; Профицит (+), дефицит (-) бюджета муниципального образования (местного бюджета); Прибыль (убыток) до налогообложения отчетного года; Дебиторская задолженность; Кредиторская задолженность.