По мере того, как все больше исследователей использовали логистическую регрессию в качестве инструмента анализа дефолтов, авторы стали сравнивать качество дискриминантного анализа и логит моделей. Одной из таких работ является исследование Мартина (1977), который на разных промежутках времени тестировал 3 модели: логит, линейный дискриминантный анализ и квадратичный дискриминантный анализ. В выборке участвовали 5700 американских банков, 58 из которых обанкротились в течение 1970-1976 гг. В качестве независимых переменных выступали 25 финансовых показателей, отражающих риск активов, ликвидность, достаточность капитала и доход. Сначала модели были построены на данных отчетности 1974 г. для прогнозирования банкротства в 1975-1976 гг. В среднем все модели достаточно хорошо показали предсказательную мощность-87%, при чем среди наиболее значимых факторов оказались достаточность капитала и отношение коммерческих кредитов к общим кредитам; показатели ликвидности оказались незначимыми. Те же модели были протестированы и на данных 1970 г. для предсказания банкротства в 1971-1972 гг. Качество предсказания значительно ухудшилось, при чем показатели ликвидности становятся значимыми, а достаточность капитала в большинстве случаев- незначимой. Различия объясняются тем, что в начале 1970 -ых гг. банкротство банков являлось нечастым событием, однако начиная с 1973 г. у банков начались проблемы с качеством выдаваемых кредитов, появились проблемы с достаточностью капитала, доходность активов упала, количество банкротств возросло. То есть появилась тесная зависимость между вероятностью банкротства и финансовыми показателями банка. Что же касается сравнения разных моделей, то автор утверждает, что у всех моделей точность классификации банка к банкротам и не банкротам оказалась примерно одинаковой.
Следующим шагом на пути совершенствования моделей предсказания банкротства выступила работа Laneet al. (1986), в которой авторы впервые использовали Модель Кокса (Cox Proportional Hazards Model) для моделирования банкротства банков. Прежде данная модель использовалась преимущественно в медицинских исследованиях. Модель Кокса примечательна тем, что она полупараметрическая, т.е. она не требует большого количества предпосылок, а также она позволяет оценить количество времени до банкротства, что невозможно посчитать, используя традиционные модели. То есть модель Кокса может устанавливать связи между временем до банкротства и финансовыми показателями. Было проведено сравнение между моделью Кокса и множественным дискриминантным анализом, в результате чего установлено, что они обладают одинаковой классификационной мощностью, хотя модель Кокса приводит к меньшей ошибке I рода, что представляет больший интерес для исследователей, т.к. банки несут большие потери, если ошибка I рода значительна. Еще одна особенность данной работы- использование финансовых показателей в качестве факторов по методологии CAMEL, которая была создана в 1978 г. для рейтинговой оценки американских банков.
В последующем исследовании Whalen (1991) также использовалась Модель Кокса для оценки ее эффективности (предсказания банкротства) по сравнению с традиционными моделями. В качестве выборки использовались данные по американским банкам за 1987-1990 гг. В качестве объясняющих переменных помимо обычных финансовых показателей использовался единственный макрофактор-процентное изменение количества выданных государством разрешений на жилищное строительство. Автор оценил вероятность банкротства на горизонте прогнозирования 12, 18 и 24 месяца, критические значения для отнесения банка к банкротам или выжившим составили 88%, 81% и 75% соответственно. К примеру, если оцененная вероятность выживания на горизонте 24 месяцев составляет менее 75%, модель предсказывает, что банк обанкротится в течение следующих 2 лет; если вероятность более 75%, банк считается выжившим в данном временном промежутке. Подсчитывались ошибки I (банкрот был оценен моделью как функционирующий банк) и II рода (выживший банк был оценен как банкрот). Ошибки I и II рода оказались в районе 10-15% для тестируемой выборки, а общая точность- более 85%. Кроме того, большая часть банков, составляющих ошибку II рода на горизонте прогнозирования 12 и 18 месяцев,- это банки, которые в конце концов обанкротились до того, как прошло 24 месяца. То есть модель достаточно эффективна в отношении определения проблемных банков до момента их банкротства. Далее были оценены ошибки I и II рода для контрольной выборки: банков, ставших банкротами в 1988 г., 1989 г., 1990 г.; банков, выживших на протяжении данного периода; общей контрольной выборки, состоящей из банкротов и не банкротов. Модель снова подтвердила свою эффективность: ошибка I рода оставалась низкой (ниже 16%), а большинство банков, входящих в ошибку II рода на горизонте прогнозирования 12 месяцев, обанкротились, прежде чем прошло 24 месяца (модель действительно способна рано предупреждать банкротство). Тот факт, что точность модели остается высокой при тестировании на разных временных промежутках, хотя параметры модели остаются прежними и их не нужно оценивать заново каждый раз, говорит о том, что существует тесная связь между вероятностью выживания банка и его финансовыми характеристиками.
Следующей работой, которая продолжила усовершенствование модели Кокса для прогнозирования банкротства банка, является работа Henebry (1996), в которой были дополнительно использованы метрики денежных потоков в модели Кокса. Оказалось, что информация о денежных потоках служит только очень ранним предиктором банкротства: показатели денежных потоков становятся значимыми на горизонте прогнозирования 3 года и больше.
В 90-ых гг. по мере автоматизации процессов и развития искусственного интеллекта дальнейшую популярность набирают непараметрические методы, в особенности метод нейронных сетей для прогнозирования банкротства банков.Впервые это было сделано в работе Tam (1991), который сравнил работоспособность нейронных сетей с уже использованными методами: дискриминантный анализ, логистическая регрессия, метод ближайших соседей (kNN) и модель CART (classificationtree). В выборку вошли 118 техасских банков, половина которых обанкротилась в 1985-1987 гг. К каждому банку банкроту подбиралась пара из банков не банкротов со схожим размером активов, количеством филиалов, возрастом и юридической формой. Было использовано 19 финансовых показателей, взятых как и в работе Lane (1986) по методологии CAMEL. Исследование показало, что метод нейронных сетей обладает наилучшей предсказательной силой среди всех рассмотренных моделей. Еще одним достоинством нейронных сетей является возможность внесения маленьких изменений в модель по мере того, как условия, в которых оперирует банк, меняются (чтобы изменить статистическую модель, придётся строить ее заново).
В работе Alam etal. (2000) авторы продолжили модернизацию непараметрических моделей для расчета вероятности банкротства банка. Были представлены следующие модели: алгоритм нечеткой кластеризации и самоорганизующиеся нейронные сети. В выборку вошли 248 банков, 8 из которых обанкротились в 1991 г. В качестве объясняющих переменных выступили 5 финансовых показателей: отношение прибыли к активам, отношение потерь по кредитам к активам, отношение потерь по кредитам к кредитам, отношение безнадежных кредитов к активам, отношение суммы потерь и резервов по кредитам к прибыли. После тестирования обеих моделей, авторы пришли к выводу, что они являются неплохими классификаторами в отношении определения банков банкротов.
В работе Kolarietal. (2002) было проведено сравнение непараметрического метода- компьютерной системы раннего предупреждения (алгоритм распознавания-traitrecognition) с параметрическим методом (логистическая регрессия) для предсказания банкротства американских банков в 1989-1992 гг. Алгоритм распознавания собирает все финансовые характеристики функционирующих банков и банков-банкротов и запоминает, какими характеристиками обладают проблемные и здоровые банки. Тем самым, алгоритм различает между «хорошими характеристиками», присущими нормальными банкам, и «плохими характеристиками», присущими проблемным банкам. Актуальность работы обуславливалась тем, что в конце 1980ых- начале 1990ых гг. в США наблюдался экономический спад: цены на энергоносители и жилье падали, что вызвало массовое банкротство крупных банков. Тем самым, исследователи смогли составить достаточно крупную статистическую выборку, порог отсечения для определения больших банков составил $250млн. В обучающую выборку вошли 18 банков, обанкротившихся в 1989 г., и все функционирующие банки; в контрольную выборку вошли банки, ставшие банкротами в 1990-1992 гг. В качественезависимых переменных выступили метрики размера (размер активов), прибыльности (отношение чистых процентных доходов к общим активам, отношение чистой прибыли к общим активам), достаточности капитала, кредитного риска (отношение резервов по безнадежным долгам к общим активам), ликвидности (отношение объема ценных бумаг к общим активам), размера обязательств (отношение не депозитных обязательств к общим обязательствам), диверсификации (отношение суммы квадратов ключевых активов к общим активам- как индекс HHI). Кроме того, в модель были включены изменения вышеупомянутых показателей (например, максимальное изменение прибыльности, деленное на среднюю прибыльность и т.д.), так как перед банкротством некоторые финансовые показатели банков могут резко меняться, и это следует учесть. Хотя обе модели показали высокую эффективность (точность составила 95%) на начальной выборке, моделирование на контрольной выборке показало, что более точным (по показателям ошибок I и II рода) оказался алгоритм распознавания. Логит модель работала лучше, чем случайный классификатор, только для выборки банков, обанкротившихся в 1990 г., а с течением времени ее качество ухудшалось. Однако точность алгоритма распознавания стабильно оставалась на достаточно высоком уровне на протяжении всего рассматриваемого периода. То есть регулятору выгоднее использовать данный непараметрический метод и из-за более высокой точности, и из-за отсутствия необходимости постоянно подгонять параметры модели в связи с изменениями во времени и финансовых показателях. Кроме того, исследователи показали, что важную информацию о проблемных банках можно извлечь из факторов, отображающих сложные взаимосвязи между финансовыми характеристиками (как например, максимальное изменение показателя, деленное на его среднее значение).
В исследованииLanineandVanderVennet (2006) так же, как и в работе Kolarietal. (2002) был проведен сравнительный анализ логистической регрессии и алгоритма распознавания, только в качеств объекта исследования выступили российские банки, период исследования составил 1997-2004 гг. Актуальность работы была связана с прошедшим экономическом кризисом в России в 1998 г., когда государство объявило дефолт по внутреннему долгу (ГКО), а рубль сильно обесценился; а также с кризисом в банковской сфере в 2004 г. (отзыв лицензии у Содбизнесбанка, обвиненного в отмывании доходов, что привело к оттоку депозитов у некоторых других банков и повышению недоверия к банковской системе среди населения; присоединение Гутабанка, испытывавшего проблемы с ликвидностью, к Внешторгбанку). Авторы в своей работе определили банкротство как отзыв лицензии в связи с невозможностью выполнить свои обязательства перед кредиторами и/или произвести обязательные платежи (отзыв лицензии в связи с мошенничеством, присоединением к другому банку, добровольной ликвидацией, неизвестными причинами не рассматривались). В качестве объясняющих переменных использовались метрики прибыльности (ROA), ликвидности (отношение текущих активов к общим активам, доля государственных ценных бумаг от общих активов), кредитного риска (отношение плохих долгов и просроченных векселей к общим кредитам, доля общих кредитов от общих активов) и достаточности капитала. Обе модели показали, что банки с низкой ликвидностью, низкой долей государственных ценных бумаг и низкой достаточностью капитала имеют более высокий риск банкротства, что соответствует ожиданиям. Модели сравнивались между собой по величине среднеквадратической ошибки MSE (сумма квадратов отклонений прогноза от истинного значения) и площади под ROCкривой. Обе модели отличились высокой точностью на начальной и контрольной выборках, однако на контрольной выборке точность снизилась. Тем не менее, чем ближе момент банкротства (3 и 6 месяцев до банкротства), тем точнее становится алгоритм распознавания, при чем показатели точности у данной модели систематически лучше, чем у логистической регрессии (MSEи площадь под ROCкривой выше) на обоих выборках. Как и в работе Kolarietal. (2002) было выявлено превосходство алгоритма распознавания над логистической регрессией.
В исследовании Boyaciogluetal. (2009) использовались 4 вида нейронных сетей (многослойный перцептронMLP, избирательная конкурентная выборка данныхCL, самоорганизующаяся картаSOMи квантование обучающего вектораLVQ), отдельный метод машинного обучения- метод опорных векторовSVM(идея заключается в том, что исходные векторы, принадлежащие 2 разным классам, разделяются гиперплоскостью так, чтобы сумма расстояний от нее до ближайших 2 векторов, лежащих по разные стороны от нее, максимально) и классические методы многомерного статистического анализа (множественный дискриминантный анализMDA, метод k-среднихCAи логистическая регрессияLRA) для оценки точности прогноза банкротства турецких банков за период 1997-2003 гг. В качестве независимых переменных выступили 20 финансовых метрик согласно методологии CAMELS. Эмпирические результаты показали, что метод MLPотличается наибольшей эффективностью- 100% банков были правильно классифицированы как банкроты/ не банкроты на обучающей выборке; 95,5% банков- соответственно на контрольной выборке. LVQметод также эффективен- все банки были правильно классифицированы на контрольной выборке, между тем как точность на обучающей выборке составила 83,72%. Неплохую точность продемонстрировал метод опорных векторов (95,34% на обучающей выборке и 90,9% на контрольной выборке) и статистические модели (точность в основном составила более 81%).
Статья Estrellaetal. (2000) была примечательна тем, что в ней сравнивались различные метрики достаточности капитала (простые-взятые, из отчетности банков, и сложные- специально рассчитываемые регуляторами для оценки риска банков с помощью теории вероятности и математической статистики) в отношении эффективности предсказания банкротства банков. Были проанализированы 3 показателя: отношение капитала к активам (leverageratio); отношение капитала к общим доходам (процентным и непроцентным)- grossrevenueratio; отношение капитала к активам, взвешенным по риску (risk-weightedcapitalratio). В качестве знаменателя во всех 3 показателях использовался капитал 1 уровня, включающий в себя оплаченную часть акционерного капитала и нераспределенную прибыль. Отношение капитала к активам подразумевает, что банк должен поддерживать такое количество капитала, которое соразмерно его общим активам. Плюсами этого показателя являются простота подсчета (на основе балансовой отчетности), интерпретации и распространённость использования на практике. Однако, если банк имеет значительные забалансовые активы с большим риском, отношение капитала к активам даст неточные результаты. Этот минус можно устранить, если использовать метрику отношения капитала к общим доходам, так как общие доходы могут включать в себя доходы от забалансовых активов. Кроме того, доходы лучше отображают уровень риска, нежели активы, так как предполагается, что рисковые проекты осуществляются только в том случае, если они приносят большую выручку. Этот показатель также просто высчитать из отчетности, однако есть некоторые минусы: выручка более чувствительна к бизнес циклам, нежели активы, а также она берет во внимание не только риск, но и другие факторы (к примеру, если банк обычно большую часть выручки генерирует за счет комиссий с небольшим риском, то отношение капитала к доходам будет неверно указывать на высокий риск). Самым эффективным показателем риска среди всех трех является отношение капитала к активам, взвешенным по риску. Концепция активов, взвешенных по риску, была представлена в 1988 г. Базельским комитетом. Каждому компоненту активов присваивается рисковый коэффициент (чем больше риск актива, тем больше коэффициент) в зависимости от его типа и вида контрагента. На основе данных о показателях банков за 1989-1993 гг. была построена логит регрессия, которая показала, что все 3 показателя одинаково эффективно предсказывают банкротство банка. Если в регрессию в качестве объясняемой переменной включается только одна метрика достаточности капитала, то каждая из трех становится статистически значимой на уровне 1%. Если все три показателя включены в модель, то наибольший вклад в увеличение точности прогноза вносит отношение капитала к общим доходам. Это может объясняться тем, что этот показатель менее коррелирован с двумя другими, а также берет информацию и из балансовой отчетности, и из отчета о прибылях и убытках. Если горизонт прогнозирования увеличивается до 1-2 лет, самым значительным предиктором становится отношение капитала к активам, взвешенным по риску. Это объясняется тем, что взвешивание по риску отображает отклонения в доходностях разных активов, которые незначительны в краткосрочном периоде, но увеличиваются в долгосрочной перспективе. Таким образом, простые и сложные метрики достаточности капитала одинаково эффективны в предсказании банкротства, что позволяет использовать простые показатели при подсчете вероятности банкротства в условиях невозможности использования более продвинутых показателей.