НИЖЕГОРОДСКИЙ ФИЛИАЛ
ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО АВТОНОМНОГО
ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ
ВЫСШЕГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Программа подготовки бакалавров по направлению
45.03.03 «Фундаментальная и прикладная лингвистика»
Выпускная квалификационная работа
Автоматическое выявление вербальной агрессии в Интернет-коммуникации
Фролова Юлия Захаровна
Нижний Новгород, 2019
Содержание
Введение
Глава 1. Теоретические основы исследования
1.1 Содержание понятия вербальная агрессия
1.2 Определение термина «вербальная агрессия»
1.3 Виды толерантности
1.4 Определение понятия «интолерантность» через понятие «толерантность»
1.5 Особенности Интернет-коммуникации
1.6 Лингвистические аспекты вербальной агрессии и нетерпимого отношения в коммуникации
1.7 Основные положения корпусной лингвистики
Глава 2. Автоматическое выявление вербальной агрессии на материале записей с блог-платформы «Живой Журнал»
2.1 Автоматический сбор записей Интернет-пользователей блог-платформы «Живой Журнал»
2.2 Обработка текстов корпуса
2.3 Распределение текстов корпуса по тональности
2.4 Проверка качества тонального словаря
Заключение
Библиографический список
Приложение
Введение
Характер исследуемой проблемы
На протяжении долгого времени представители различных научных направлений изучают такой феномен, как агрессия. Им заинтересованы психологи, социологи, политологи, лингвисты и представители многих других наук, исследующие мышление и деятельность человека. Агрессия существует как в физической, так и в вербальной форме. Именно вербальная агрессия будет рассмотрена в рамках данного исследования.
Некоторые ученые определяют понятие «вербальная агрессия» через смежные ей «толерантность» и «интолерантность». В данной работе «вербальная агрессия» будет также определена через данные понятия, которые являются ключевыми в проблематике современного мира. «Толерантность» и «интолерантность» стали актуальными относительно недавно, поэтому они часто встречаются в тезаурусе разных сфер жизни.
Стоит отметить, что проблема толерантности и интолерантности актуализировалась в отдельных странах мира по-разному. С ней связаны времена расцвета, прогресса, объединения народов, а также период социальной деградации, геноцида, гражданских и мировых войн. В связи с тем, что развитие стран мира не было взаимообусловленным и относительно самостоятельным процессом, понятие «толерантность» приобретает различные оттенки в том или ином языке.
В основном, граждане узнают о международных событиях через средства массовой информации, в которых затрагивается множество проблем (в том числе и проблемы толерантности и интолерантности) путем оценок определенных событий и явлений. Данные события активно обсуждаются Интернет пользователями на различных порталах (например, в блогах), что часто сопровождается конфликтами, которые имеют отображение в комментариях. В связи с этим существует такое явление, как интолерантность, имеющая разные виды и речевые особенности ее выражения.
Актуальность проблемы
Вопрос о вербальной агрессии приобретает особый интерес у современных ученых, общественных и политических деятелей. Причины роста такого интереса вполне очевидны: усиление террористических и экстремистских тенденций, необходимость преодоления международных и локальных конфликтов и многие другие проблемы. Из-за обострения конфликтных ситуаций на международной арене данная проблема стала как никогда актуальной, именно поэтому необходимо исследовать данное явление и его характерные черты.
Системное описание языковых средств и речевых особенностей выражения вербальной агрессии в различных дискурсах современного мира (политический, религиозный и т.п.) является актуальным и важным в связи с культурно-обусловленным характером объекта исследования и с существующим интересом к специфике языковых и речевых моделей.
Теоретической базой исследования служат научные труды отечественных и зарубежных исследователей, рассматривающих:
· содержание понятий «толерантность» и «интолерантность» и их основные характеристики (T.M.Scanlon, Niclas Berggren, Н.Э.Солынин, О.М.Кирилюк, А.Г.Смолов, Г.У.Солдатова, Л.А.Шайгерова и др.);
· толерантность в различных дискурсах (James L. Gibson, John N. Paden, Elaine B.Sharp, С.С.Нартдинова, В.В.Форсова, В.Т.Ананьина, А.Г.Кудрявцев, С.В.Хамутовская и др.);
· способы измерения толерантности и интолерантности (Е.Ю.Кольцова, Е.Е.Таратута, Т.В.Корнилова, М.А.Чумакова и др.);
· языковые средства и речевые особенности выражения толерантности и интолерантности (М.Б.Хомяков, О.С.Иссерс, М.Х.Рахимбергенова);
· способы выражения вербальной агрессии в текстах СМИ (Е.В.Куликова, А.В.Евстафьева, Е.В.Каблуков, Л.Сагитова, С.Шайхитдинова, Е.Ходжаева, Е.Н.Басовская и др.);
· проблематику теории коммуникации (Ф.И.Шарков, Л.Г.Юсупова, В.А.Маслова, О.Л.Гнатюк и др.);
· особенности Интернет-коммуникации (О.Н.Морозова, О.Б.Максимова, А.В.Куликова);
· особенности корпусной лингвистики (В.П.Захаров, О.Г.Горина, В.В.Рыков, Д.Бабйер, С.Конрад, Р.Реппен, Э.Вилсон, Т.МакЭнри, С.Ю.Богданова, Н.Б.Гвишиани и др.);
· проблематику определения тональности текста (Н.В.Лукашевич, И.И.Четверкин, А.В.Левчик, A.M.Popescu, O.Etzioni, C.Scaffidi, N.Elhadad, W.Jin, H.Hung и др.).
Цель исследования заключается в разработке метода автоматического определения вербальной агрессии в блогах Интернет-пользователей «Живого Журнала».
Цель исследования определяет следующие задачи:
1. Собрать и проанализировать корпус записей Интернет-пользователей в русскоязычных блогах на предмет содержания агрессии;
2. На примерах записей Интернет-пользователей в различных блогах на русском языке проанализировать контексты проявления вербальной агрессии;
3. Изучить экстралингвистические и лингвистические условия проявлений вербальной агрессии;
4. Составить тональный словарь из языковых единиц, при употреблении которых проявляется вербальная агрессия в корпусе;
5. Проверить полученный тональный словарь при помощи программы, реализующей наивный байесовский классификатор, на новых, ранее не анализированных записях и подсчитать метрики качества.
Объектом исследования являются языковые единицы, через которые проявляется вербальная агрессия в тексте.
Предметом исследования являются способы автоматического выявления вербальной агрессии на основе формальных признаков.
Методологической основой исследования является совокупность основных положений и теорий машинного обучения, корпусной и компьютерной лингвистики.
Для решения поставленных задач использовался комплекс методов исследования:
- интенциональный анализ для установления фактов вербальной агрессии в составленном корпусе;
- сентимент-анализ, позволяющий определить тональность анализируемого блога, а также маркировать языковые единицы как положительные или отрицательные;
- квантитативный анализ корпусов для интерпретации статистических закономерностей лингвистических явлений;
- методы обработки естественного языка для автоматизации определенных практических задач (например, лемматизация собранных записей);
- обучение с учителем для автоматического определения вербальной агрессии в текстах.
Цель и задачи научного исследования определяют структуру курсовой работы, состоящей из введения, двух глав, заключения, библиографического списка, списка источников и приложения. Введение содержит общую характеристику поставленной проблемы, обоснование ее актуальности, цели и задач исследования, а также определение методологической основы и методов выполнения работы и краткий обзор использованных литературных источников. Первая глава «Теоретические основы исследования» посвящена определению необходимой для исследования теоретической платформы. На данном этапе дается определение понятий «вербальная агрессия», «толерантность» в зависимости от ее вида, проводится анализ разработанности проблемы, обзор имеющихся взглядов на проблему в целом, а также ее отдельные аспекты: интолерантные высказывания, толерантность и интолерантность речевого поведения. Рассматривается взаимосвязь понятий «вербальная агрессия» и «интолерантность».
Далее подробно рассматриваются особенности Интернет-коммуникации в блогосфере, а также особенности высказываний, содержащих вербальную агрессию, после чего даются определения основных понятий корпусной лингвистики, особое внимание уделяется методам создания корпуса и обработке его текстов. Кроме того, приводится несколько существующих взглядов на проблему определения тональности текста.
Вторая глава «Автоматическое определение вербальной агрессии на материале записей с блог-платформы «Живой Журнал»» посвящена описанию работы программ по автоматическому скачиванию записей с данной блог-платформы, их обработке и классификации записей из тестового корпуса при помощи наивного байесовского классификатора.
Далее формируется тональный словарь на основе проанализированных языковых единиц, вошедших в тренировочный корпус, на предмет проявления вербальной агрессии и проверяется его качество путем подсчета метрик accuracy (аккуратность), precision (точность), recall (полнота), f-score (f-мера). В заключении обобщаются теоретические и практические результаты исследования, делаются предположения о дальнейшей разработке данной проблемы. В списке источников указаны данные о записях, проанализированных в данной работе.
Теоретическая значимость исследования заключается в том, что в работе выявляются особенности коммуникации, характерные для блогосферы, а также изучаются экстралингвистические и лингвистические контексты проявлений вербальной агрессии в данной сфере.
Практическая значимость работы состоит в том, что предлагается составленный в ходе данного исследования тональный словарь, который в дальнейшем можно будет использовать для определения вербальной агрессии не только в блогосфере, но и в других средах коммуникации.
Глава 1. Теоретические основы исследования
1.1 Содержание понятия вербальная агрессия
Исследуемая в данной работе проблема включает в себя три основных аспекта: проблема вербальной агрессии, ее взаимосвязь с проблемой толерантности и интолерантности, а также языковые средства и речевые особенности выражения вербальной агрессии. Как уже отмечалось во введении, многие исследователи ранее уже изучали разные аспекты данных проблем (T.M.Scanlon, Niclas Berggren, Н.Э.Солынин, О.М.Кирилюк, А.Г.Иркаев, Т.И.Дрынкина, И.Е.Тихомирова, И.А.Стернин, Г.А.Сагалакова, М.А.Семашко, О.А.Михайлова - проблему интолерантности; James L. Gibson, John N. Paden, Elaine B.Sharp, С.С.Нартдинова, В.В.Форсова, В.Т.Ананьина, А.Г.Кудрявцев, С.В.Хамутовская, Е.Н.Басовская - языковые средства и речевые особенности выражения интолерантности и вербальной агрессии в различных дискурсах). Также были проанализированы работы, в которых были приведены способы измерения толерантности и интолерантности (Е.Ю.Кольцова, Е.Е.Таратута, Т.В.Корнилова, М.А.Чумакова).
1.2 Определение термина «вербальная агрессия»
Существует множество определений агрессии как феномена. Примерно до середины XX века под агрессией понимали «действия одного государства в ущемлении прав другого государства с использованием силы». В современных же словарях агрессию определяют как «любое действие или поведение, нарушающее чьи-либо права, агрессия в отношении чьих-либо прав». Таким образом, феномен агрессии характеризует не только политические действия, но вообще все сферы деятельности современного социума.
Ю.Б. Можгинский понимает под данным феноменом «действия и высказывания, направленные на причинение вреда, душевной и физической боли другому существу» [29]. Поэтому, как уже было сказано во введении, агрессию можно рассматривать как в ее физическом проявлении, так и в вербальном. Это можно объяснить включением речевой деятельности человека и ее взаимосвязью с другими видами деятельности. А это значит, что отдельные формы поведения человека могут иметь аналоги в речевой деятельности.
Ю.В.Щербинина определяет вербальную агрессию как «словесное выражение негативных эмоций, чувств или намерений в оскорбительной, грубой, неприемлемой в данной ситуации форме» [48]. Таким образом, вербальная агрессия всегда нарушает некую коммуникативную норму.
В статье Н.С.Якимовой «Вербальная агрессия как актуальный феномен современного общества» были выделены следующие типы агрессивного вербального поведения: критика личных качеств, способностей, фактов биографии или внешности, проклятия, поддразнивания, насмешки, угрозы, ругательства, а также невербальные знаки. Кроме того, Н.С.Якимова отметила, что причинение вреда другому лицу при отстаивании своей коммуникативной позиции является мотивом агрессивного вербального поведения, а поиск механизмов пресечения такого речевого поведения является одной из задач на пути формирования речевой толерантности [50]. Иначе говоря, проявление вербальной агрессии является нарушением толерантности и проявлением нетерпимости или интолерантности. Таким образом, понятия «вербальная агрессия», «толерантность» и «интолерантность» тесно связаны.
Определение термина «толерантность»
Для того, чтобы глубже вникнуть в проблему толерантности и интолерантности, необходимо проанализировать термин, которым обозначили данную проблему. Стоит отметить, что понятие «интолерантность» имеет противоположное значение относительно понятия «толерантность», поэтому для начала разумнее будет проанализировать именно его.