Научная работа: Терминология научного дискурса авторов статей по специальности: 05.20.01 – Технологии и средства механизации сельского хозяйства через призму когнитивного анализа

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Кубанский государственный университет

Терминология научного дискурса авторов статей по специальности: 05.20.01 - «Технологии и средства механизации сельского хозяйства» через призму когнитивного анализа

Грушевская Татьяна Михайловна

доктор филологических наук, профессор

Грушевская Елена Сергеевна

доктор филологических наук, доцент

Луценко Диана Сергеевна студент

С развитием информационных и когнитивных технологий появилось принципиальная возможность их применения для автоматического определения авторства, датировки, жанра и смысловой направленности научных литературных произведений (статей, монографий, учебных пособий и т.д.). Однако большинство научных исследований в этой области посвящены разработке концептуальных подходов и математических моделей, а не исследованию конкретных научных текстов. Авторов же данной работы интересуют особенности специальной научной терминология, используемой авторами статей по специальности 05.20.01 - «технологии и средства механизации сельского хозяйства» Научного журнала КубГАУ. Для решения этой исследовательской задачи применяется автоматизированный системно-когнитивный анализ (АСК-анализ) и реализующий его программный инструментарий - интеллектуальную систему «Эйдос». Приводится численный пример с большим количеством выходных форм, основанный на реальных текстах

Ключевые слова: КОГНИТИВНЫЙ АНАЛИЗ, ТЕРМИНОЛОГИЯ НАУЧНОГО ДИСКУРСА

TERMINOLOGY OF SCIENTIFIC DISCOURSE OF AUTHORS OF ARTICLES ON SPECIALTY: 05.20.01 - " TECHNOLOGIES AND MEANS OF AGRICULTURAL MECHANIZATION» THROUGH THE PRISM OF COGNITIVE ANALYSIS

Grushevskaya Tatyana Mikhailovna

Doctor of Philology, Professor

Grushevskaya Elena Sergeevna

Doctor of Philology, associate Professor

Lutsenko Diana Sergeevna

student

Kuban state University, Krasnodar, Russia

With the development of information and cognitive technologies, it has become possible to use them for automatic determination of the authorship, dating, genre and semantic orientation of scientific literary works (articles, monographs, textbooks, etc.). However, most scientific research in this area is devoted to the development of conceptual approaches and mathematical models, and not to the study of specific scientific texts. The authors of this work are interested in the features of the special scientific terminology used by the authors of articles on specialty 05.20.01 - "technologies and means of agricultural mechanization" of the scientific journal of Kuban State Agrarian University. To solve this research problem, we use automated system-cognitive analysis (ASC-analysis) and its software tools, which is the intelligent system called "Eidos". This article gives a numerical example with a large number of output forms based on real texts

Keywords: COGNITIVE ANALYSIS, TERMINOLOGY OF SCIENTIFIC DISCOURSE

Содержание

1. Введение (Introduction)

2. Материалы и методы (Materials and methods)

2.1 Идея и концепция решения проблемы

2.2 Обоснование выбора метода и инструментария решения проблемы

2.3 Суть метода и математической модели АСК-анализа

2.4 Синтез системно-когнитивных моделей и частные критерии знаний, многопараметрическая типизация

2.5 Интегральные критерии и решение задач системной идентификации и принятия решений

3. Результаты и обсуждение (Results and discussion)

3.1 Когнитивно-целевая структуризация предметной области

3.2 Подготовка исходных данных, формализация предметной области

3.3 Формализация предметной области

3.4 Синтез и верификация моделей

3.5 Придание статуса текущей наиболее достоверной модели INF5

3.6 Решение задачи системной идентификации (атрибуции текстов)

3.7 Решение задачи принятия решений (вывод информации о результатах многопараметрической типизации)

3.8 Решение задачи исследования моделируемой предметной области путем исследования ее модели

3.8.1 Инвертированные SWOT-диаграммы значений факторов (семантические потенциалы слов)

3.8.2 Кластерно-конструктивный анализ классов

3.8.3 Нелокальные нейроны и нелокальная нейронная сеть

3.8.4 Значимость факторов и их значений

3.8.5 Степень детерминированности классов и классификационных шкал

3.9 Повышение статуса результатов исследования

5. Выводы (Conclusions)

5.1 Эффективность предложенного решения проблемы

5.2 Основные результаты исследования

5.3 Ограничения и недостатки предложенного решения проблемы и перспективы его развития путем их преодоления этих ограничений и недостатков

5.4 Заключение

Список литературы (References)

1. Введение (Introduction)

С развитием информационных и когнитивных технологий появилось принципиальная возможность их применения для автоматического определения авторства, датировки, жанра и смысловой направленности научных литературных произведений (статей, монографий, учебных пособий и т.д.).

Однако большинство научных исследований в этой области посвящены разработке концептуальных подходов и математических моделей, а не исследованию конкретных научных текстов [1-30].

Авторов же данной работы интересуют особенности специальной научной терминология, используемой авторами статей по специальности 05.20.01 - «технологии и средства механизации сельского хозяйства» Научного журнала КубГАУ.

Для решения этой исследовательской задачи применяется автоматизированный системно-когнитивный анализ (АСК-анализ) и реализующий его программный инструментарий - интеллектуальную систему «Эйдос».

АСК-анализ позволяет проводить не только атрибуцию текстов, но и осуществлять элементы наратологического анализа:

- формировать обобщенные лингвистические образы классов (семантические ядра) на основе фрагментов или примеров относящихся к ним текстов на любом языке;

- количественно сравнивать лингвистический образ конкретного человека, или описание объекта, процесса с обобщенными лингвистическими образами групп (классов);

- сравнивать обобщенные лингвистические образы классов друг с другом и создавать их кластеры и конструкты;

- исследовать моделируемую предметную область путем исследования ее лингвистической системно-когнитивной модели;

- проводить интеллектуальную атрибуцию текстов, т.е. определять вероятное авторство анонимных и псевдонимных текстов, датировку, жанр и смысловую направленность содержания текстов;

- все это можно делать для любого естественного или искусственного языка или системы кодирования.

2. Материалы и методы (Materials and methods)

2.1 Идея и концепция решения проблемы

Идея решения проблемы состоит в том, чтобы применить для обработки текстов интеллектуальные технологии, рассматривать конкретные тексты как примеры различных обобщенных категорий текстов (по авторству, датировке, жанру и смысловой направленности содержания текстов и т.п.), а слова и их сочетания рассматривать как признаки текстов.

Концепция решения проблемы состоит в постановке конкретных задач, решение которых обеспечивает реализацию сформулированной выше идеи и достижение поставленной цели. Для достижения поставленной цели необходимо решить следующие задачи, которые получаются путем декомпозиции цели и являются этапами ее достижения:

Этапы АСК-анализа [31-48]:

1. Когнитивно-целевая структуризация предметной области:

- разработка классификационных шкал;

- разработка описательных шкал.

2. Формализация предметной области:

- разработка градаций классификационных шкал;

- разработка градаций описательных шкал.

- кодирование исходных данных с помощью классификационных и описательных шкал и градаций и формирование обучающей выборки.

3. Синтез, повышение качества и верификация статистических и системно-когнитивиных моделей научных текстов.

4. Решение в наиболее достоверной модели задач:

- идентификация конкретных текстов;

- формирование терминологических семантических ядер и антиядер конкретных авторов;

- кластеризация семантических ядер и антиядер конкретных авторов.

2.2 Обоснование выбора метода и инструментария решения проблемы

В качестве метода исследования выбран Автоматизированный системно-когнитивный анализ (АСК-анализ), который представляет собой новый инновационный метод искусственного интеллекта, имеющий свой программный инструментарий, в качестве которого в настоящее время выступает интеллектуальная система «Эйдос» (открытое программное обеспечение) [31-47].

Существует много систем искусственного интеллекта. Универсальная когнитивная аналитическая система «Эйдос-Х++» отличается от них следующими параметрами:

- разработана в универсальной постановке, не зависящей от предметной области. Поэтому она является универсальной и может быть применена во многих предметных областях (http://lc.kubagro.ru/aidos/index.htm);

- находится в полном открытом бесплатном доступе (http://lc.kubagro.ru/aidos/_Aidos-X.htm), причем с актуальными исходными текстами (http://lc.kubagro.ru/__AIDOS-X.txt);

- является одной из первых отечественных систем искусственного интеллекта персонального уровня, т.е. она не требует от пользователя специальной подготовки в области технологий искусственного интеллекта (есть акт внедрения системы «Эйдос» 1987 года) (http://lc.kubagro.ru/aidos/aidos02/PR-4.htm);

- обеспечивает устойчивое выявление в сопоставимой форме силы и направления причинно-следственных зависимостей в неполных зашумленных взаимозависимых (нелинейных) данных очень большой размерности числовой и не числовой природы, измеряемых в различных типах шкал (номинальных, порядковых и числовых) и в различных единицах измерения (т.е. не предъявляет жестких требований к данным, которые невозможно выполнить, а обрабатывает те данные, которые есть);

- содержит большое количество локальных (поставляемых с инсталляцией) и облачных учебных и научных Эйдос-приложений (в настоящее время их 31 и 207, соответственно) (http://lc.kubagro.ru/aidos/Presentation_Aidos-online.pdf);

- обеспечивает мультиязычную поддержку интерфейса на 51 языке. Языковые базы входят в инсталляцию и могут пополняться в автоматическом режиме;

- поддерживает on-line среду накопления знаний и широко используется во всем мире (http://aidos.byethost5.com/map5.php);

- наиболее трудоемкие в вычислительном отношении операции синтеза моделей и распознавания реализует с помощью графического процессора (GPU), что на некоторых задачах обеспечивает ускорение решение этих задач в несколько тысяч раз, что реально обеспечивает интеллектуальную обработку больших данных, большой информации и больших знаний;

- обеспечивает преобразование исходных эмпирических данных в информацию, а ее в знания и решение с использованием этих знаний задач классификации, поддержки принятия решений и исследования предметной области путем исследования ее системно-когнитивной модели, генерируя при этом очень большое количество табличных и графических выходных форм (развития когнитивная графика), у многих из которых нет никаких аналогов в других системах (примеры форм можно посмотреть в работе: http://lc.kubagro.ru/aidos/aidos18_LLS/aidos18_LLS.pdf);

- хорошо имитирует человеческий стиль мышления: дает результаты анализа, понятные экспертам на основе их опыта, интуиции и профессиональной компетенции;

- вместо того, чтобы предъявлять к исходным данным практически неосуществимые требования (вроде нормальности распределения, абсолютной точности и полных повторностей всех сочетаний значений факторов и их полной независимости и аддитивности) автоматизированный системно-когнитивный анализ (АСК-анализ) предлагает без какой-либо предварительной обработки осмыслить эти данные и тем самым преобразовать их в информацию, а затем преобразовать эту информацию в знания путем ее применения для достижения целей (т.е. для управления) и решения задач классификации, поддержки принятия решений и содержательного эмпирического исследования моделируемой предметной области.

В чем сила подхода, реализованного в системе Эйдос? В том, что она реализует подход, эффективность которого не зависит от того, что мы думаем о предметной области и думаем ли вообще. Она формирует модели непосредственно на основе эмпирических данных, а не на основе наших представлений о механизмах реализации закономерностей в этих данных. Именно поэтому Эйдос-модели эффективны даже если наши представления о предметной области ошибочны или вообще отсутствуют.

В этом и слабость этого подхода, реализованного в системе Эйдос. Модели системы Эйдос - это феноменологические модели, т.е. они не отражают механизмов детерминации, а только сам факт и характер детерминации.

2.3 Суть метода и математической модели АСК-анализа

Суть метода АСК-анализа состоит в последовательном повышении степени формализации модели и преобразовании данных в информацию, а ее в знания и решении на основе этих знаний задач идентификации (распознавания, классификации и прогнозирования), поддержки принятия решений и исследования моделируемой предметной области путем исследования ее модели (рисунки 1 и 2) [32].

Рисунок 1

Рисунок 2

В АСК-анализе все эти факторы рассматриваются с одной единственной точки зрения: сколько информации содержится в их значениях о переходе объекта моделирования и управления, на который они действуют, в определенное будущее состояние, описываемое классом (градация классификационной шкалы), и при этом сила и направление влияния всех значений факторов на объект измеряется в одних общих для всех факторов единицах измерения: единицах количества информации [32].

При решении задач интеллектуальной атрибуции и наратологического анализа литературных текстов слова или их леммы рассматриваются как признаки текстов конкретной смысловой направленности и относящихся к определенным авторам, жанрам, и временным периодам.