Статья: Сентимент-анализ читательского интернет-комментария к политическому тексту

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

На первом этапе мы отобрали 38 газетных статей, посвященных мировым катаклизмам (например, землетрясение в Калифорнии, 2019 г.; ураган Мэтью, 2019 г.; землетрясение и цунами в Индонезии, 2018 г.), катастрофам (например, авиакатастрофа в России, 2016 г.; авиакатастрофа на Украине, 2014 г.) и иным событиям мирового масштаба. Выбор данной тематики продиктован поставленной в исследовании целью -- проведение сентимент-анализа текста читательских комментариев. Полагаем, что обращение к эмоционально значимым вопросам, темам, вызывающим широкий общественный резонанс и эмоциональный отклик у

большого числа читателей новостных лент и интернет-версий газет, позволяет отобрать максимально полный материал для сентимент-анализа. Использовались электронные версии газет The Independent (https://www. independent.co.uk), the Guardian (https://www. theguardian.com/), «Комсомольская правда» (https://m.kp.ru), а также новостные ресурсы «РИА „Новости"» (https://ria.ru) и Meduza (https://meduza.io). Далее была составлена картотека читательских комментариев к газетным статьям (N = 2050), включая англоязычные (N = 1191) и русскоязычные (N = 859). Количественное преобладание англоязычных комментариев над русскоязычными логически объясняется тем, что читатель новостных статей в зарубежной прессе проявляет большую активность и желание выразить свое мнение в виде комментария по сравнению с русскоязычным читателем (количество обнаруженных нами комментариев к одной только англоязычной статье могло достигать 600, тогда как к русскоязычной составляло не более 200). Общий объем подготовленного к анализу текста комментариев составил 629 827 печатных знаков.

Целью второго этапа исследования было проведение количественного анализа читательских комментариев. На данном этапе текст отобранных англоязычных и русскоязычных комментариев был обработан автоматизированным способом при помощи прикладного программного интерфейса ParallelDots API (application programming interface), созданного специально для обеспечения максимально точного анализа общей эмоции текстового контента в таких источниках, как блоги, статьи, форумы, отзывы потребителей, опросы, «Твиттер» и т.д. (https://www. paralleldots.com/sentiment-analysis). Ресурс применяет метод построения алгоритмов долгой краткосрочной памяти (англ. long short-term memory, LSTM) для определения тональности текста как позитивной, негативной или нейтральной. В результате автоматизированного сентимент-анализа текста читательских комментариев были выделены англоязычные и русскоязычные комментарии с доминирующим типом тональности: позитивной, негативной и нейтральной. Полученные данные подверглись статистической обработке, для наглядного представления эмпирических данных использовались диаграммы.

Целью третьего этапа исследования было проведение качественного анализа читательских комментариев неавтоматизированным способом (экспертный анализ). Мы предприняли попытку определить основные типы комментариев позитивной, негативной и нейтральной тональности и произвели дальнейшую тематически обусловленную группировку комментариев. Это позволило определить, какие именно темы, затрагиваемые авторами комментариев, приводят к появлению той или иной тональности, главным образом позитивной или негативной, а также выявить закономерности использования определенных стилистических приемов и других средств выражения эмоции.

Результаты исследования

Русскоязычные читательские комментарии продемонстрировали превалирующее количество негативных комментариев -- 59,3 %, в то время как англоязычные комментарии негативной тональности к зарубежным газетным статьям составили 45,5 %. Процент русскоязычных комментариев позитивной тональности -- 17,7 %, англоязычных -- 8,4 %. Тем не менее англоязычные читательские комментарии к газетным статьям выделяются доминирующим числом комментариев нейтральной тональности -- 46,1 %. Комментарии к российским электронным статьям, содержащие нейтральную эмоциональную оценку, составляют 23 %. Обобщенные данные представлены на рисунке 1.

Помимо приведенной выше классификации читательских комментариев, была предпринята попытка выделения обособленных разделов внутри каждой группы, что позволило спроецировать наиболее полное представление об их эмоциональной направленности.

Комментарии позитивной тональности были разделены на три группы, причем в русскоязычных читательских комментариях было обнаружено доминирующее количество «отвлеченных» комментариев (условное название таких откликов, в содержании которых поднимались темы, не имеющие непосредственного отношения к вопросу, например, комментарии, содержащие информацию о личном жизненном опыте комментатора и т.п.). Аналогичные результаты были выявлены при делении нейтральных читательских комментариев: в русскоязычных комментариях негативной тональности было зафиксировано преобладание текстов «отвлеченной» тематики, а в англоязычных -- политической. Более точные статистические данные анализа представлены в следующем разделе статьи.

Обсуждение полученных результатов

Читательские комментарии позитивной тональности были разделены на три подгруппы:

1) комментарии, выражающие сочувствие (соболезнования пострадавшим или их родственникам, обращение к ним, высказывание пожелания, слов поддержки и т. д.). В данной подгруппе русскоязычные комментарии составляют 31,4 %, англоязычные -- 28 %;

2) комментарии-призывы, комментарии побуждающего характера, в которых авторы обращаются к другим участникам полилога с целью призыва к изменению ситуации, мнения, поведения, жизненных установок. Здесь доминирующую позицию занимают читательские комментарии, оставленные к зарубежным газетным статьям -- 7,5 %, в то время как аналогичные русскоязычные комментарии были употреблены в 5,9 % случаев;

Рис. 1. Общее процентное соотношение тональности читательских комментариев

Рис. 2. Результаты анализа комментариев позитивной тональности

3) отвлеченные комментарии, содержащие общие понятия, обращенные к стране, народу, включающие в себя упоминание личного жизненного опыта, индивидуального отношения к трагедии, выражение соболезнования пострадавшим с одновременным высказыванием упреков в адрес власти и т.п. Число англоязычных читательских комментариев положительной тональности в данной подгруппе составило 64,5 %, русскоязычных -- 62,7 %. Данные представлены на рисунке 2.

Негативная тональность текстов читательских комментариев была представлена в виде большего количества подгрупп:

1) комментарии, затрагивающие политические темы (в негативном ключе). Превалирующее количество составили англоязычные читательские комментарии -- 49,3 %, в то время как русскоязычные встречались почти в два раза реже и составили 26,4 %;

2) комментарии, содержащие иронию, на смешку, сарказм, как в отношении упомянутого в статье события, так и в адрес той или иной страны или других участников полилога. В данной подгруппе 16,9 % составили читательские комментарии, оставленные русскоязычными пользователями, и 13,5 % -- англоязычными;

3) комментарии, содержащие оскорбления, имплицитную или эксплицитную оценку ситуации, обращенную к пострадавшим, власти или народу. Количество подобных русскоязычных комментариев, оставленных к интернет-версиям газетных статей, превышает число англоязычных -- доля в двух языках составляет соответственно 9,9 % и 5,8 %;

Рис. 3. Результаты анализа комментариев негативной тональности

Рис. 4. Результаты анализа комментариев нейтральной тональности

4) отвлеченные комментарии, обращенные к остальным участникам полилога, к стране (как к своей, так и к стране, потерпевшей катастрофу), отсылки к тем или иным историческим событиям, не имеющим непосредственного отношения к обсуждению. Читатели русскоязычных газетных статей оставили большее количество отвлеченных комментариев -- 46,8 %, англоязычные комментарии составили 31,4 % (рисунок 3).

Комментарии, представляющие собой тексты нейтральной тональности, были подразделены на три группы:

1) комментарии на политические темы. Данная подгруппа включает в себя 6,3 % русскоязычных комментариев и 16,4 % читательских комментариев, оставленных к англоязычным газетным статьям;

2) комментарии -- отклики на новостную статью, относящиеся к статье и ее публикации. Отмечается наличие уточнений, выражения собственного мнения. Анализ данных показал, что русскоязычные читатели новостных статей оставили большее количество комментариев, относящихся к статье, по сравнению с зарубежными читателями -- 5,2 % и 2,7 % соответственно;

3) отвлеченные комментарии, включающие в себя вопросы к происшествию, обсуждение версий, исторические справки, вопросы или обращения к другим комментаторам. В данной подгруппе было выявлено 88,5 % русскоязычных читательских комментариев, в то время как комментарии к зарубежным статьям составили 80,9 % (рисунок 4). Полученные статистические данные еще раз подтвердили необходимость изучения тем, находящихся на периферии интерактивной газетной статьи, т. е. вопросов, которые «выходят за пределы тематики, предложенной журналистом, но, по мнению участников онлайн-полилога, также значимы и достойны обсуждения» [Гималетдинова 2012].

Таким образом, исследование показало, что автору русскоязычного комментария свойственно наиболее частое употребление негативной оценочной лексики, что приводит к отрицательной тональности текстов читательских комментариев. Процент использования позитивной тональности российскими пользователями также превышает процент ее использования зарубежными читателями. Однако в читательских комментариях к зарубежным газетным интернет-статьям прослеживается наибольшее употребление нейтральной тональности.

Среди текстов негативной и нейтральной тональностей были выделены подгруппы читательских комментариев, содержание которых несло в себе политическую окраску и тематику. В ходе анализа было отмечено наиболее активное обращение к данной теме англоязычных комментаторов как в текстах негативной тональности, так и в отзывах нейтральной тональности, в то время как среди русскоязычных читателей активность написания комментариев, обращенных к политике, не выявлена.

Преобладание негативной тональности в русскоязычных текстах читательских комментариев объясняется склонностью авторов использовать приемы иронии и сарказма, высказывать оскорбления, обращенные другим участникам полилога, пострадавшему народу, политикам.

Кроме того, анализ нейтральной тональности читательских комментариев продемонстрировал более частое обращение российских пользователей, по сравнению с англоязычными авторами, к структуре статьи с целью коррекции, выявления и поправки каких-либо неточностей.

Исследование текстов позитивной тональности выявило превалирование в речи русскоязычных комментаторов слов сожаления о случившемся, выражения соболезнования и сочувствия по отношению к пострадавшим. Читательские комментарии к зарубежным интернет-версиям газетных статей отличались преобладанием комментариев призывного характера. Следует отметить, что процентное расхождение между русскоязычными и англоязычными читательскими комментариями составило не более 4 %.

Заключение

интернет коммуникация электронный журнал

Автоматический способ анализа тональности текста читательских комментариев с использованием специализированной программы Parallel Dots показал хорошие результаты и позволил обработать относительно большой объем текстового материала за короткий срок. Однако в ходе работы были зафиксированы отдельные случаи несоответствия между результатами, получаемыми автоматизированным способом, и данными экспертной (неавтоматизированной) оценки. Предполагается, что подобные трудности были вызваны в первую очередь большим количеством иронии и сарказма в текстах, а также возникали вследствие неспособности программ выявить подтекст читательских комментариев и иную интерпретацию лексического состава. Таким образом, на данный момент можно сделать вывод о целесообразности сочетания автоматизированных и неавтоматизированных способов анализа текстового материала для получения объективных данных.

В целом использованный метод сентимент-анализа достаточно объективно выявил эмоциональную направленность как русскоязычных, так и англоязычных читательских комментариев, позволил определить некоторые особенности выражения эмоций представителями двух языковых культур. Показательным является доминирование негативной тональности в русскоязычных комментариях, что может быть вызвано недовольством комментирующих внешней и внутренней политикой страны, ее экономическим состоянием, а также субъективизмом по отношению к другой стране и ее представителям. В случае с англоязычными комментариями было выявлено превалирование текстов нейтральной тональности и обращение к вопросам политической тематики.

Литература