Научная работа: Терминология научного дискурса авторов статей по специальности: 05.20.01 – Технологии и средства механизации сельского хозяйства через призму когнитивного анализа

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Путем многопараметрической типизации в системе создается системно-когнитивная модель, с применением которой, если модель окажется достаточно достоверной, могут решаться задачи системной идентификации, прогнозирования, классификации, поддержки принятия решений и исследования моделируемого объекта путем исследования его системно-когнитивной модели [31-48].

3. Результаты и обсуждение (Results and discussion)

3.1 Когнитивно-целевая структуризация предметной области

Когнитивно-целевая структуризация предметной области включает разработку классификационных и описательных шкал (таблицы 5 и 6). Это единственный неавтоматизированный этап АСК-анализа.

Таблица 5 - Классификационные шкалы

KOD_CLSC

NAME_CLSC

1

AUTSFIO

Таблица 6 - Описательные шкалы

KOD_OPSC

NAME_OPSC

1

TIT

2

REF

3.2 Подготовка исходных данных, формализация предметной области

Исходные данные, используемые в численном примере данной работы, представляют собой выборку из баз данных Научного журнала КубГАУ: http://ej.kubagro.ru/ (таблица 7).

Таблица 7 - Исходные данные (фрагмент) Полный файл исходных данных можно скачать по ссылке: ftp://b5_20444140@ftp.byethost5.com/htdocs/Source_data_applications/Applications-000208/Inp_data.xlsx

ida

nr

nrasd

autsFio

tit

ref

1421808001

05_00_00_Технические_науки

05_20_00_Процессы_и_машины_

агроинженерных_систем

Стрижков_ИГ Чеснюк_ЕН Чеснюк_СЕ Кузнецов_МС

Влияние начальных условий на переходные токи трансформатора

В статье рассматриваются особенности протекания переходного процесса в обмотках трансформатора при ненулевых начальных условиях, характерных для режимов сушки трансформатора токами низкой частоты. Показано влияние ненулевых начальных условий на токи в обмотках

1411807004

05_00_00_Технические_науки

05_20_00_Процессы_и_машины_агроинженерных_систем

Бахчевников_ОН Брагинец_СВ

Адаптация типовой технологической схемы для малого внутрихозяйственного комбикормового завода

Объектом исследования являлись методы адаптации типовых технологических схем для малых внутрихозяйственных комбикормовых заводов. Типовая технологическая схема адаптируется для конкретного завода методом исключения ненужных в данной конфигурации дополнительных технологических модулей, либо в их замене на другие модули, позволяющие добиться требуемого уровня качества обработки сырья или комбикорма путем замены имеющихся технологических операций на более совершенные, а также в добавлении в схему новых модулей. Разработан алгоритм адаптации типовой технологической схемы производства комбикормов для внутрихозяйственного завода, позволяющий максимально учесть при проектировании специфические условия и потребности конкретного сельхозпредприятия. Применение адаптированных модульных технологических схем на проектируемых малых комбикормовых заводах позволит значительно повысить питательную ценность и биологическую безопасность производимых комбикормов

3.3 Формализация предметной области

Для ввода этих исходных данных в систему «Эйдос» и формализации предметной области был использован автоматизированный программный интерфейс (API) 2.3.2.2 с параметрами, приведенными на рисунке 2:

Рисунок 3. Главная экранная форма API-2.3.2.2

При вводе осуществлялась лемматизация, которая заняла около 37 секунд (рисунок 3):

Рисунок 4. Экранная форма по результатам лемматизации

Так как среди классификационных и описательных шкал нет числовых, то система не запрашивает количество числовых диапазонов для них (рисунок 4):

Рисунок 5. Экранные формы API-2.3.2.2

Из рисунка 4 видно, что ввод исходных данных из внешнего Excel-файла в систему «Эйдос» занял менее 0.5 секунды.

В данной модели использование лемматизации сокращает число слов примерно на 13%.

В результате в данном режиме автоматически разработаны градации классификационных и описательных шкал (таблицы 8 и 9), а затем с их использованием исходные данные закодированы и сформирована обучающая выборка (таблица 10):

Таблица 8 - Классификационные шкалы и градации

KOD_CLS

NAME_CLS

KOD_CLS

NAME_CLS

1

AUTSFIO-алёшин_вн

33

AUTSFIO-малашихин_нв

2

AUTSFIO-ачмиз_ад

34

AUTSFIO-маслов_гг

3

AUTSFIO-бахчевников_он

35

AUTSFIO-мовчан_ес

4

AUTSFIO-белоусов_св

36

AUTSFIO-мохаммед_аю

5

AUTSFIO-богус_аэ

37

AUTSFIO-науменко_аг

6

AUTSFIO-брагинец_св

38

AUTSFIO-павлюкова_ед

7

AUTSFIO-бурьянов_аи

39

AUTSFIO-панасенко_ею

8

AUTSFIO-бутовченко_ав

40

AUTSFIO-першакова_тв

9

AUTSFIO-великанова_ев

41

AUTSFIO-пестова_лп

10

AUTSFIO-викторова_еп

42

AUTSFIO-погосян_вм

11

AUTSFIO-виневский_еи

43

AUTSFIO-припоров_ие

12

AUTSFIO-городецкий_во

44

AUTSFIO-разгонов_гв

13

AUTSFIO-грачев_еа

45

AUTSFIO-рыков_вб

14

AUTSFIO-даишева_нм

46

AUTSFIO-семенихин_со

15

AUTSFIO-дегтярева_ка

47

AUTSFIO-сторожук_та

16

AUTSFIO-дёмина_еб

48

AUTSFIO-стрижков_иг

17

AUTSFIO-дробот_ва

49

AUTSFIO-сысоев_дп

18

AUTSFIO-евглевский_ро

50

AUTSFIO-тарасенко_бф

19

AUTSFIO-журтов_ах

51

AUTSFIO-тарасьянц_са

20

AUTSFIO-зайцев_сг

52

AUTSFIO-трубилин_еи

21

AUTSFIO-исмаилов_ва

53

AUTSFIO-труфляк_ев

22

AUTSFIO-калпакчи_нд

54

AUTSFIO-труфляк_ис

23

AUTSFIO-камбулов_си

55

AUTSFIO-туманова_ми

24

AUTSFIO-колесник_вв

56

AUTSFIO-усманов_мм

25

AUTSFIO-коновалов_ви

57

AUTSFIO-фролов_вю

26

AUTSFIO-коновалов_си

58

AUTSFIO-цубера_иг

27

AUTSFIO-котляревская_ни

59

AUTSFIO-цыбулевский_вв

28

AUTSFIO-кузнецов_мс

60

AUTSFIO-чеботарёв_ми

29

AUTSFIO-купин_га

61

AUTSFIO-червяков_ив

30

AUTSFIO-курасов_вс

62

AUTSFIO-чеснюк_ен

31

AUTSFIO-луценко_ев

63

AUTSFIO-чеснюк_се

32

AUTSFIO-люсый_ин

64

AUTSFIO-шапиро_еа

Таблица 9 - Описательные шкалы и градации (фрагмент)

KOD_ATR

NAME_ATR

KOD_ATR

NAME_ATR

1

TIT-автомобильный

41

TIT-корм

2

TIT-агробиотехнологий

42

TIT-корнеплод

3

TIT-агроинженерный

43

TIT-крайний

4

TIT-адаптация

44

TIT-кукуруза

5

TIT-активный

45

TIT-кукурузный

6

TIT-анализ

46

TIT-культура

7

TIT-аппарат

47

TIT-малый

8

TIT-биологический

48

TIT-масса

9

TIT-валец

49

TIT-машина

10

TIT-вальцовый

50

TIT-метода

11

TIT-вертикальный

51

TIT-механизация

12

TIT-вещество

52

TIT-механизированный

13

TIT-влагообеспеченность

53

TIT-моделирования

14

TIT-влияние

54

TIT-молотилка

15

TIT-внутрихозяйственный

55

TIT-молотильный

16

TIT-вопрос

56

TIT-надежность

17

TIT-ворох

57

TIT-напряжение

18

TIT-второй

58

TIT-начальный

19

TIT-высококачественный

59

TIT-низкий

20

TIT-генератор

60

TIT-обеспечение

21

TIT-геометрический

61

TIT-оборот

22

TIT-гидравлический

62

TIT-обоснование

23

TIT-грубый

63

TIT-обрабатываемый

24

TIT-двухплоскостными

64

TIT-обработка

25

TIT-доска

65

TIT-объёма

26

TIT-жидкость

66

TIT-огурец

27

TIT-жмых

67

TIT-оптимизация

28

TIT-завод

68

TIT-орган

29

TIT-зарядный

69

TIT-основа

30

TIT-зерно

70

TIT-основный

31

TIT-зерновые

71

TIT-отечественный

32

TIT-зерноуборочный

72

TIT-отходы

33

TIT-измельчение

73

TIT-оценка

34

TIT-импульс

74

TIT-очес

35

TIT-исследование

75

TIT-очистка

36

TIT-кинематических

76

TIT-параметр

37

TIT-когнитивного

77

TIT-первый

38

TIT-комбайновый

78

TIT-переменный

39

TIT-комбикормовый

79

TIT-переработка

40

TIT-конструктивный

80

TIT-переходный

Таблица 10 - Обучающая выборка (фрагмент)

Обучающая выборка по сути представляет собой базу исходных данных, нормализованную с помощью классификационных и описательных шкал и градаций.

В результате автоматической формализации предметной области подготовлены все необходимые условия для выполнения следующего этапа АСК-анализа: синтеза и верификации моделей.

3.4 Синтез и верификация моделей

Далее запускаем режим синтеза и верификации моделей с параметрами, заданными на рисунке 5.

Обратим внимание на то, что создаваемая модель по размерности составляет около 0.004% от теоретически максимальной модели, которую можно создать и обработать в системе «Эйдос».

Из рисунка 6 мы видим, что процесс синтеза и верификации моделей занял 27 минут. Отметим, что в текущей версии системы «Эйдос» графический процессор (GPU) используется только для синтеза моделей и распознавания (если задано использование GPU), а расчет 11 выходных форм по результатам распознавания всегда осуществляется на центральном процессоре (CPU). Это и занимает основное время расчетов в данном режиме.

Для оценки достоверности моделей в системе «Эйдос» используется F-мера Ван Ризбергена и две ее улучшенные модификации, предложенные проф.Е.В.Луценко [35] (рисунок 7).

Рисунок 6. Первая экранная форма режима синтеза и верификации моделей

Рисунок 7. Последняя экранная форма режима синтеза и верификации моделей

Рисунок 8. Экранные формы режима оценки достоверности моделей

Из рисунка 7 видно, что по критерию L1 наилучшей по достоверности системно-когнитивной моделью является модель INF5 с интегральным критерием «Семантический резонанс знаний»: L1=0,993, при уровнях сходства выше 33% число истинных решений значительно превосходит число ложных решений. Это очень хороший результат. Поэтому данная модель и выбрана в качестве текущей для решения поставленных в работе задач на последующих этапах АСК-анализа.

Сами созданные модели здесь не приводятся из-за большой размерности (это матрицы размерностью 255 колонок и 11432 строк). Но их всегда можно посмотреть в режиме 5.5. системы «Эйдос» и скачав и установи приложение № 208 из Эйдос-облака.

3.5 Придание статуса текущей наиболее достоверной модели INF5

Придадим наиболее достоверной модели INF4 статус текущей (рисунок 8):

Рисунок 9. Придание наиболее достоверной модели INF4 статуса текущей

3.6 Решение задачи системной идентификации (атрибуции текстов)

При решении задачи идентификации для каждого фрагмента текста распознаваемой выборки в наиболее достоверной модели INF5 рассчитываются значения интегрального критериев для каждого класса. При этом определяется степень сходства каждого текста с обобщенными образами всех классов, а потом для каждого текста все классы ранжируются в порядке убывания сходства с текстом и, таким образом, идентифицируются автор произведения, его название, жанр, период и год написания (рисунки 9 и 10).

Рисунок 10. Решение задачи атрибуции текстов

Из рисунка 9 видно, что процесс атрибуции 21 текста занял на графическом процессоре около 2 секунд. 99,99% этого времени занял расчет 11 выходных форм по результатам атрибуции, из которых здесь из-за ограничений на объем статьи приводятся только три.

На рисунке 10 приведена форма, в которой слева мы выбираем текст, а справа видим классы, ранжированные в порядке убывания сходства выбранного текста с этими классами.

Рисунок 11. Некоторые результаты решение задачи атрибуции текстов

В верхнем окне справа используется интегральный критерий «Резонанс знаний», в справа внизу - «Сумма знаний». «Птичка» стоит против тех результатов идентификации, которые соответствуют действительности. На рисунке 11 приведена аналогичная форма, но слева в ней мы выбираем класс, а справа видим тексты, ранжированные в порядке убывания их сходства с этими классами.

Рисунок 12. Некоторые результаты решение задачи атрибуции текстов

На рисунке 12 форма, в которой классы ранжированы в порядке убывания достоверности идентификации текстов с ними по F-критерию Ван Ризбергена. Есть аналогичные формы и по L1 и L2 критериям.

Рисунок 13. Некоторые результаты решение задачи атрибуции текстов

Таким образом решение задачи идентификации литературного источника в данном интеллектуальном облачном Эйдос-приложении - это и есть решение задачи атрибуции текста и частично - задачи его наратологического анализа.

3.7 Решение задачи принятия решений (вывод информации о результатах многопараметрической типизации)

На этапе синтеза моделей путем обобщения примеров обучающей выборки были созданы обобщенные образы классов. Представляет интерес, а что же это за образы классов. Можно вывести информацию об этом в форме SWOT-диаграмм [34]

На рисунках 13 и 14 приведены SWOT-диаграммы классов по авторам из которых видно, какие слова наиболее характерны (слева) и наиболее нехарактерны (справа) для данного автора:

Рисунок 14. Примеры информации из класса по автору

Рисунок 15. Примеры информации из классов по произведению

По сути это семантические ядра и антиядра данных авторов, наиболее характерные и наиболее нехарактерные термины для их научного стиля (дискурса). Они же могут быть использованы в качестве ключевых слов к их статьям [38-43].

3.8 Решение задачи исследования моделируемой предметной области путем исследования ее модели

Если модель верно отражает моделируемую предметную область (а в нашем случае, как мы видели выше это так), то исследование модели обоснованно можно считать исследованием самой моделируемой предметной области.