Дипломная работа: Текстовый анализ новостей в применении к прогнозированию банкротства компаний

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Таблица 28. Результаты отбора факторов

Категория

Фактор

r

Взаим. инф.

F-стат.

p-value

Ранг RFE

Рычаг

CL/E

-0.031

0.094

8.851

0.003

1

D/A

0.140

0.077

51.313

0.000

1

D/E

-0.014

0.139

4.348

0.037

1

Покрытие

CFFO/D

-0.006

0.118

0.086

0.769

1

FCF/D

-0.093

0.113

22.985

0.000

1

EBITDA/IE

-0.007

0.159

17.688

0.000

1

EBT/CL

-0.082

0.175

8.006

0.005

2

Ликвидность

C/A

-0.031

0.000

5.921

0.015

3

CA/A

-0.060

0.077

12.930

0.000

1

CA/D

0.028

0.059

27.198

0.000

5

CL/A

0.165

0.040

81.456

0.000

1

IA/A

-0.006

0.035

0.062

0.803

7

QA/CL

-0.051

0.048

9.278

0.002

6

QA/A

-0.068

0.039

17.496

0.000

1

WC/A

0.051

0.021

10.094

0.002

2

Прибыльность

CA/REV

0.007

0.021

4.505

0.034

5

EBIT/E

-0.034

0.104

4.636

0.032

2

EBITDA/A

-0.194

0.103

101.820

0.000

1

NI/A

-0.144

0.185

34.366

0.000

1

NI/E

0.002

0.133

0.390

0.532

3

NI/R

-0.086

0.189

31.961

0.000

6

RE/A

-0.142

0.155

37.880

0.000

4

Активность

AP/R

0.023

0.034

4.401

0.036

1

AR/L

-0.063

0.013

8.500

0.004

1

INV/R

0.061

0.017

10.689

0.001

1

R/A

-0.045

0.017

8.166

0.004

2

Таблица 29. Значимость переменных тональности

L&M

Тональность

Взаим. инф.

F-стат.

p-value

Отрицательная

0.009

32.634

0.000

Положительная

0.000

0.007

0.933

Неопределенная

0.022

23.635

0.000

Спорная

0.017

0.019

0.889

Ограничивающая

0.003

0.695

0.405

Избыточная

0.000

2.959

0.086

NRC

Тональность

Взаим. инф.

F-стат.

p-value

Злость

0.023

18.155

0.000

Симпатия

0.006

8.324

0.004

Отвращение

0.008

16.700

0.000

Страх

0.004

13.230

0.000

Радость

0.018

1.119

0.290

Пессимизм

0.005

17.264

0.000

Оптимизм

0.000

0.541

0.462

Грусть

0.000

16.089

0.000

Неожиданность

0.021

1.988

0.159

Доверие

0.007

1.023

0.312

GI

Тональность

Взаим. инф.

F-стат.

p-value

Положительная

0.000

0.037

0.847

Отрицательная

0.000

19.639

0.000

Сильная

0.005

1.668

0.197

Слабая

0.023

24.802

0.000

Активная

0.000

4.531

0.034

Пассивная

0.007

6.607

0.010

Рисунок 15. PR-AUC логит-моделив зависимости от числа финансовых факторов

Таблица 30. Коэффициенты переменных полной логит-модели

LR (1) 20

LR (3) 20

LR (1) 50

LR (3) 50

Альфа

-1.371

-1.008

0.599

0.060

CL/E

0.045

-0.319

-0.048

-0.036

D/A

-0.117

0.218

-0.195

0.230

D/E

-0.236

0.150

0.101

-0.023

CFFO/D

-2.297

0.066

0.030

-0.047

FCF/D

-3.448

-1.112

-0.832

-0.135

EBITDA/IE

-0.621

-0.377

-0.786

-0.125

CA/A

-0.271

-0.575

-0.555

-0.197

CL/A

0.915

0.645

1.453

0.227

QA/A

-0.727

-0.272

-1.554

-0.219

EBIT/E

-0.049

-0.242

0.041

-0.069

EBITDA/A

-1.373

-1.058

-0.990

-0.206

NI/A

0.486

0.188

0.215

-0.096

AP/R

0.257

0.018

1.739

0.117

AR/L

-0.497

-0.047

-0.232

-0.158

INV/R

0.370

0.243

0.299

0.063

CE/A

-0.077

-0.775

-0.844

-0.364

A/GNP

0.465

0.471

-0.881

-0.094

E/M

-4.251

-2.583

-1.449

-0.278

P/B

-0.361

-0.082

-0.549

-0.016

P/E

0.164

0.208

0.491

-0.006

ER

-0.007

-0.065

-0.078

0.033

Случайный лес

-0.387

-0.356

-0.252

-0.024

CPI

-0.155

0.164

-0.261

0.014

Потреб. товары

0.110

0.081

0.184

0.000

Финансы

-0.290

-0.420

-0.800

-0.032

Здравоохранение

0.383

0.016

0.161

-0.046

Пром. товары

0.015

0.027

0.195

0.015

Услуги

0.377

0.217

0.444

0.071

Технологии

0.158

0.160

-0.047

0.022

Инфраструктура

0.155

0.220

0.838

0.034

Отрицательная

0.448

0.554

0.405

0.196

Положительная

0.107

0.041

0.321

0.096

Неопределенная

0.376

0.053

0.977

0.102

Спорная

-0.706

-0.042

-0.396

0.063

Ограничивающая

-0.080

-0.130

-0.005

-0.028

Избыточная

-0.305

-0.158

-0.022

0.034

Таблица 31. Значимость переменных полной модели случайного леса

RF (1) 20

RF (3) 20

RF (1) 50

RF (3) 50

CL/E

0.0595

0.0248

0.0222

0.0722

D/A

0.0096

0.0372

0.0022

0.0316

D/E

0.0320

0.0388

0.0427

0.0405

CFFO/D

0.0185

0.0703

0.0622

0.0544

FCF/D

0.0429

0.0969

0.0421

0.0285

EBITDA/IE

0.1009

0.0825

0.1538

0.0544

CA/A

0.0316

0.0304

0.0730

0.0233

CL/A

0.0328

0.0200

0.0214

0.0190

QA/A

0.0184

0.0235

0.0565

0.0266

EBIT/E

0.0186

0.0387

0.0455

0.0380

EBITDA/A

0.1153

0.0458

0.0503

0.0268

NI/A

0.1376

0.1304

0.0831

0.1115

AP/R

0.0191

0.0163

0.0044

0.0157

AR/L

0.0159

0.0280

0.0163

0.0253

INV/R

0.0209

0.0186

0.0140

0.0221

CE/A

0.0653

0.0945

0.0968

0.0626

A/GNP

0.0281

0.0285

0.0201

0.0197

E/M

0.0740

0.0389

0.0430

0.0561

P/B

0.0840

0.0669

0.1061

0.1795

P/E

0.0396

0.0347

0.0197

0.0589

ER

0.0126

0.0078

0.0053

0.0097

Случайный лес

0.0130

0.0099

0.0025

0.0061

CPI

0.0048

0.0084

0.0078

0.0074

Потреб. товары

0.0101

0.0184

0.0175

0.0298

Финансы

0.0114

0.0599

0.0244

0.0156

Здравоохранение

0.0359

0.0632

0.0854

0.1075

Пром. товары

0.0411

0.0408

0.0155

0.0134

Услуги

0.0444

0.0327

0.0524

0.0160

Технологии

0.1152

0.1187

0.1222

0.0695

Инфраструктура

0.0214

0.0289

0.0388

0.0465

Отрицательная

0.0004

0.0034

0.0040

0.0050

Положительная

0.0014

0.0021

0.0000

0.0022

Неопределенная

0.0004

0.0009

0.0000

0.0000

Спорная

0.0024

0.0018

0.0051

0.0027

Ограничивающая

0.0004

0.0000

0.0000

0.0000

Избыточная

0.0000

0.0000

0.0000

0.0000

Приложение Г. Результаты обучения моделей

Таблица 32. Метрики качества длинных моделей на (1) 20 на обучающей и тестовой выборках

Логит

Персептрон

Опорные вектора

Случайный лес

Обуч.

Тест.

Обуч.

Тест.

Обуч.

Тест.

Обуч.

Тест.

Accuracy

0.859

0.856

1.000

0.962

0.921

0.894

0.989

0.935

Recall

0.863

0.855

1.000

0.977

0.965

0.947

0.990

0.939

Specifity

0.855

0.856

1.000

0.947

0.878

0.841

0.987

0.932

Precision

0.857

0.855

1.000

0.948

0.888

0.855

0.987

0.932

PR-AUC

0.924

0.924

0.957

0.957

0.936

0.936

0.972

0.972

Таблица 33. Метрики качества длинных моделей на однолетних выборках

Логит

Персептрон

(1) 20

(1) 25

(1) 33

(1) 50

(1) 20

(1) 25

(1) 33

(1) 50

Accuracy

0.856

0.863

0.824

0.849

0.962

0.926

0.926

0.995

Recall

0.855

0.873

0.838

0.864

0.977

0.951

0.971

0.990

Specifity

0.856

0.853

0.809

0.833

0.947

0.902

0.882

1.000

Precision

0.855

0.856

0.814

0.840

0.948

0.907

0.892

1.000

PR-AUC

0.924

0.910

0.885

0.912

0.957

0.927

0.958

0.899

Опорные вектора

Случайный лес

(1) 20

(1) 25

(1) 33

(1) 50

(1) 20

(1) 25

(1) 33

(1) 50

Accuracy

0.894

0.877

0.882

0.849

0.935

0.922

0.897

0.884

Recall

0.947

0.912

0.926

0.864

0.939

0.951

0.956

0.912

Specifity

0.841

0.843

0.838

0.833

0.932

0.892

0.838

0.857

Precision

0.855

0.853

0.851

0.840

0.932

0.898

0.855

0.861

PR-AUC

0.936

0.949

0.912

0.921

0.972

0.990

0.966

0.978