Дипломная работа: Текстовый анализ новостей в применении к прогнозированию банкротства компаний

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

a. Группа подходов, основанных на модели ценообразования опционов Блэка-Шоулза, первый из которых был представлен в работе(Merton, 1974), гдебыла предложена оценка вероятности банкротства компании, вычисленная как мера риска по европейскому опциону callна всю сумму долга компании.

b. Модели, основанные на решении задачи о разорении игрока (gambler'sruintheory), которая была описана еще в работе (Feller, 1970).

c. Модели, основанные на теории об оптимальной структуре капитала, которая применяется, например, в статье(Scott, 1976).

(2) Эмпирические (апостериорные) методы- те, что подразумевают использование статистических моделей для регрессионной оценки вероятности банкротства или методов машинного обучения для осуществления бинарной классификации. При этом, как правило, используется набор объясняющих переменных, подобранный вручную или с помощью специальных алгоритмов так, чтобы постфактум максимизировать предсказательную силу модели.

В конце концов, теоретические модели не завоевали большой популярности - возможно, из-за своих нереалистичных предпосылок. Как подчеркивается в(Scott, 1981). теоретическое исследование проблематики банкротства неизбежно оказывается зависимым от результатов эмпирических изысканий, и в большинстве статей, содержащих какую-то теоретическую интерпретацию проблемы банкротства, само исследование на нее не полагается. Более того, эти результаты зачастую используются для объяснения аномалий, наблюдаемых в смежных областях, таких как предсказание доходности акций в рамках CAPM(Campbell, Hilscher, & Szilagyu, 2008).

В свою очередь, теоретическое осмысление текстового анализа, как правило, связано с исследованием иррационального поведения агентов, что объясняется, например, в статье(F. Li, 2011). Так, материалы раскрытия корпоративной информации могут нести в себе указания на всевозможные поведенческие паттерны менеджмента, свойственные более или менее финансово благоприятным ситуациям. Игроки на финансовом рынке могут как воспринимать эти сигналы верно, так и формировать, сознательно или бессознательно, ту или иную необоснованную предвзятость по отношению к компании, что может стать причиной возникновения аномалий в динамике цен акций, необъяснимых в рамках фундаментального анализа. Анализ тональности, однако, оказывается способным извлечь данную предвзятость из тональности текстов(Kearney & Liu, 2014)и объяснить, откуда у инвесторов берутся представления, не основанные на численных данных. Новости, возможно, при этом играют еще большую роль, нежели корпоративная отчетность (L. Chen, Wang, Deng, Xie, & Li, 2014), являясь одним из основных источников формирования настроения у инвесторов касательно тех или иных компаний и ценных бумаг.

В следующих разделах данной работы будут описываться и применяться только эмпирические модели предсказания банкротства. Их проблематика заключается, в основном, в двух задачах: нахождение оптимального набора факторов - объясняющих переменных, содержащих как можно больше информации о вероятности дефолта, и выбор алгоритма, позволяющего извлечь как можно больше информации из этих переменных и тем самым достичь максимальной точности предсказания.

2.1. Детерминанты вероятности банкротства

Так как эмпирические модели не обладают строго заданной спецификацией, их применение неразрывно связано с поиском оптимального набора объясняющих переменных, который позволил бы максимизировать их предсказательную силу. Этот поиск также мотивирован стремлением понять экономические механизмы, ведущие к ослаблению финансовой стабильности фирмы и выраженные в изменении тех или иных внутренних или внешних показателей. Агрегируя накопленную к данному моменту литературу, можно выделить следующие категории факторов, обыкновенно значимых при предсказании корпоративного дефолта:

(1) Финансовые - извлекаются из финансовой отчетности компании и обычнопредставляют собой различные соотношения между элементами баланса или ОФР, описывая функционирование компании изнутри.

Примеры: D/E, DSCR, EBITDA/Revenue, ROE, log(Total assets)

(2) Рыночные - имеют дело с данными, полученными с фондового рынка, такими как цена и доходность акции за определенный период времени, а также соотношениями этих показателей с бухгалтерскими.

Примеры: полная и дивидендная доходность, P/B, P/E, доля в капитализации индекса

(3) Макроэкономические - описывают экономическую конъюнктуру, в которой существует компания и которая по-разному в разное время может влиять на ее финансовую стабильность, что особенно важно при анализе временных рядов и панельных данных.

Примеры: инфляция, рост ВВП, безрисковая ставка

(4) Корпоративногоуправления- предоставляют некоторую информацию о внутренней среде компании, эффективности работы ее сотрудников и менеджмента.

Примеры: число сотрудников, производительность труда, доля менеджеров среди сотрудников, доля женщин в совете директоров

(5) Качественные - прочие факторы, выражающиеся, как правило, с помощью категориальных и фиктивных переменных.

Примеры: год, страна, сектор, размер, структура собственности

Отдельно следует упомянуть факторы, предоставляемые текстовым анализом, которые по своей природе являются, как правило, качественными, однако имеют простое численное выражение. Ими могут являться (1) читаемость текста, которая, как оказывается, может быть использована для объяснения финансовых показатель фирмы(You & Zhang, 2009), (2) наличие в тексте ключевых фраз (F. Li, 2008), и (3) настроение инвесторов, в качестве прокси-переменной для которого служит настроение или тональность новостных сообщений, статей или материалов раскрытия корпоративной информации (Loughran & McDonald, 2016).

Помимо того, наиболее интересны представители обширной первой категории, простота вычисления которых сопряжена с обыкновенно высокой корреляцией с объясняемой переменной. Обоснование использования конкретных финансовых переменных при предсказании банкротств неоднократно приводилось еще в эпоху одномерного дискриминантного анализа(Beaver, 1968);вместе с появлением МДА, однако, возникли различные подходы ких классификации и экономической интерпретации.

Таблица 1. Классификации финансовых факторов

Источник

Категории

Пример

(Courtis,

1978)

Прибыльность (profitability)

ROE

Продуктивность (managerial performance)

Retained earnings/Net income

Платежеспособность (solvency)

DSCR

(Salchenberger, 1992)

Структура капитала (capital adequacy)

Net worth/Total assets

Качество активов (asset quality)

Real estate owned/Total assets

Продуктивность (management efficiency)

Net margin

Рентабельность (earnings quality)

ROA

Ликвидность (liquidity)

Liquid assets/Total assets

(Altman,

2007)

Финансовый рычаг (leverage)

Short-term debt/Equity

Ликвидность (liquidity)

Cash/Total assets

Прибыльность (profitability)

EBITDA/Total assets

Покрытие (coverage)

Retained earnings/Total assets

Активность (activity)

EBITDA/Interest expenses

Основываясь на существующих исследованиях и экономической интуиции, можно привести следующую интерпретацию влияния различных финансовых коэффициентов на вероятность банкротства компании:

(1) Финансовый рычаг- это степень закредитованности фирмы, порождающая долговое бремя большей или меньшей тяжести по отношению к бизнесу в целом, неадекватность которого является первопричиной дефолта. Предполагаемая корреляция с вероятностью банкротства: положительная.

Примеры: отношение долга к активам и к собственному капиталу

(2) Платежеспособность- это возможность фирмы финансировать выплату процентов по долгу и тела долга за счет своих собственных средств, что является основополагающим фактором недопущения банкротства в каждом отчетном периоде. Выражается в отношении свободного денежного потока к стоимости обслуживания долга за рассматриваемый период. Предполагаемая корреляция с вероятностью банкротства: отрицательная.

Примеры: коэффициенты покрытия процентов и обслуживания долга

(3) Ликвидность- это мера относительного объема активов, которые могут быть быстро обращены в денежные средства в случае, если текущего денежного потока, получаемого от операционной активности становится недостаточно для выплаты долга. Достаточная ликвидность поддерживает платежеспособность. Предполагаемая корреляция с вероятностью банкротства: отрицательная.

Примеры: коэффициенты текущей, быстрой и наличной ликвидности

(4) Прибыльность-это способность фирмы использовать свой капитал и активы для генерации выручки, а также способность извлекать чистую прибыль из выручки.Достаточная прибыльность поддерживает постоянное наличие запаса денежных средств и других ликвидных активов. Предполагаемая корреляция с вероятностью банкротства: отрицательная.

Примеры: рентабельность капитала и активов, операционная и чистая рентабельность

(5) Продуктивность- это мера эффективности бизнес-процессов фирмы и скорости протекания ее производственных циклов. Обеспечивает достаточную прибыльность. Предполагаемая корреляция с вероятностью банкротства: отрицательная.

Примеры: оборачиваемость запасов и оборотного капитала, доля оборотного капитала в активах

(6) Размер - величина бизнеса компании, которая непосредственно влияет как на норму прибыли, так и на финансовую устойчивость: согласно общеизвестным эмпирическим наблюдениям, маленькие и молодые компании склонны иметь более высокую маржинальность, но и меньшую устойчивость. Предполагаемая корреляция с вероятностью банкротства: отрицательная.

Примеры: активы, выручка (обычно под логарифмом)

Полный список финансовых и нефинансовых факторов, рассмотренных для ознакомления, приведен в Приложении 5.Частота использования конкретных финансовых факторов в литературе была изучена в таких исследованиях, как (Bellovary, Giacomino, & Akers, 2007) и(Dimitras, Zanakis, & Zopounidis, 1996). Проблематика включения нефинансовых факторов была рассмотрена, например, в статьях(Altman, Sabato, & Wilson, 2010) по отношению к макроэкономическим переменным;(Campbell et al., 2008)и(N Wilson & Altanlar, 2014)по отношению к рыночным;(Rees & Maddala, 1985) по отношению к качественным. Переменные, описывающие генерируемые фирмой денежные потоки, были детально исследованы в работе(Aziz & Lawson, 1989).

2.2. Гипотезы исследования

Ожидается, что результаты исследования подтвердят ряд предположений, каждое из которых основана на существующей литературе. В тех или иных условиях схожие предположения уже были исследованы, однако они остаются актуальными относительно текстового анализа в применении к предсказанию банкротства компаний.Два основных предположения непосредственно относятся к цели работы:

H1. Введение текстовых факторов в форме переменных тональности увеличиваетпрогнозную силу существующих моделей оценки вероятности банкротства, основанных на финансовых, макроэкономических и рыночных факторах (Mai et al., 2018).

H2. Знаки коэффициентов при переменных тональности, оцененные с помощью бинарной регрессии, соответствуют экономическому смыслу этих переменных: положительные тональности (оптимизм, доверие, радость) уменьшают вероятность банкротства, а отрицательные (пессимизм, сомнение, спорность) - увеличивают (Loughran & McDonald, 2016).

Кроме того, также имеет смысл выдвинуть следующие предположения:

H3. Финансовый словарьтональностей, представленный и обоснованныйвработе(Loughran & McDonald, 2011),позволяет получить наивысшую предсказательную силу при оценке вероятности банкротства по сравнению с другими, неспециализированными словарями. Это не столь очевидно, так как семантика новостных сообщений может отличаться от таковой в финансовых отчетах; так, например, в исследовании новостей (L. Chen et al., 2014)не было обнаружено существенной разницы в предсказательной силе гарвардского словаря и словаря Loughran&McDonald, несмотря на убедительную критику последнего, в том числе, в (Loughran & McDonald, 2016). В то же время в работе(Федорова, Демин, & Рогов, 2019) наиболее эффективным оказывается словарь NRC.

H4. Предсказательная сила всех моделей сокращается с увеличением горизонта предсказания. Это предположение часто подтверждается в исследованиях, имеющих дело с разными горизонтами; этот феномен описывается, например, в работах(Duan et al., 2012) и(M. Y. Chen, 2011). Тем не менее, в некоторых случаях результаты неоднозначны(Martin, 1977), а иногда вообще противоположны(Mselmi, Lahiani, &Hamza, 2017). Теоретически это предположение может исходить из того, что находящиеся в неопределенном финансовом состоянии компании склонны скорее улучшать его, чем ухудшать, что не так очевидно, особенно во время рецессии.