Статья: Отграничение криминалистики от иных наук методами информационного анализа текста

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Изучалось также количество дескрипторов на одну работу по каждому году (информационная плотность) - результаты см. таблицу 6.

Таблица 6. Статистические показатели рядов динамики количества дескрипторов, приходящихся на одну работу.

Дисциплина

Дисперсия выборки

Среднеквад-ратичное отклонение

Медиана

Мода

Среднее значение

Эксцесс

Асимметрия относительно среднего

Корреляция исследуемых данных

по КТ с…

КТ

0,030145

0,173624

0,710548

нет данных

0,668017

-1,18297

-0,44635

УПр

0,101596

0,318741

0,768595

0,25

0,589436

-1,89694

-0,16895

0,665509

УПиК

0,032715

0,180873

0,789286

нет данных

0,749059

5,97187

-2,2755

0,305156

Тхн

0,028982

0,170241

0,649485

нет данных

0,628979

5,537565

-2,17317

-0,16989

Мдц

0,095691

0,309339

1,278495

нет данных

1,284258

6,371695

-1,15762

0,286647

Иск

0,009479

0,097358

0,786592

нет данных

0,79344

1,719302

0,66268

-0,28935

Анализ этих данных показывает близость криминалистики и уголовного процесса по параметрам «эксцесс» и «асимметрия относительно среднего» - следовательно, данные индикаторы могут служить для выделения весьма близких дисциплин (обе эти науки относятся к одной научной специальности 12.00.09). Иных отчетливо выраженных индикаторов не наблюдается.

Исследовалась корреляции количества слов в названии АРД по криминалистике с другими науками Количество слов в названии АРД определялось с помощью программы статистического анализа текста «Shtampomer» V. 1.0. - см. таблицу 7 и график 1.

Таблица 7. Корреляции количества слов в названии АРД по криминалистике с другими науками.

Дисциплина

УПр

УПиК

Тхн

Мдц

Иск

Корреляция исследуемых данных по КТ с…

0,981

0,969

0,925

0,975

0,815

График 1. График корреляции количества слов в названии АРД по криминалистике с другими науками.

Анализ данных таблицы 7 и графика 1 приводит нас к следующему: а) различия в предметных областях наблюдаются во 2-м знаке после запятой; б) четкого выделения юридических наук по данному параметру не наблюдается ввиду близости криминалистики не только с ними, но и с техникой (видимо здесь, в том числе, отражается близость криминалистики с техническими дисциплинами).

Таким образом, результаты нашего исследования позволяют прийти к следующим выводам:

Выделение тематически близких наук (в нашем случае - дисциплин «криминального блока», близких к криминалистике) из ряда иных осуществимо методами информационного анализа названий авторефератов диссертаций;

При этом возможно применять следующие индикаторы:

- семантическая близость названий авторефератов диссертаций;

- эксцесс и корреляция динамики количества работ, а также дисперсия выборки и асимметрия относительно среднего - при анализе динамики количества тем авторефератов диссертаций и их дескрипторов;

Индикаторы «эксцесс» и «асимметрия относительно среднего» могут служить для выделения весьма близких дисциплин (в нашем случае криминалистики и уголовного процесса) из ряда иных наук - при изучении динамики количества дескрипторов на одну работу (информационной плотности текста названий АРД);

Индикатор корреляции количества слов в названии авторефератов диссертаций показывает близкие к криминалистике дисциплины с более широким их охватом (в частности не только юридические науки криминального блока, но и технические).

Кроме того, проведенный информационный анализ текста названий авторефератов диссертаций подтверждает тезис о том, что криминалистика по исследуемым параметрам относится к юридическим дисциплинам, но имеет и некоторую техническую компоненту.

Полагаем, что только применение выявленных индикаторов в их совокупности позволит выделять различные науки из ряда иных дисциплин. Поиск индикаторов для отграничения криминалистики от существенно близких к ней наук (в рамках научной специальности 12.00.09) методами анализа текстов требует, очевидно, более глубоких исследований. Считаем, также, что информационный анализ текстов - весьма интересное и перспективное направление исследований, позволяющее оценивать положение дел в изучаемой дисциплине достаточно точными методами математической статистики.