Статья: Эмоционально нейтральные интернет-тексты: в поисках специфики

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

И. В. Арнольд связывает оба вида прагматической информации с понятием потенциальных или импликациональных сем [20], которые могут быть актуализированы в контексте, но могут и оставаться в латентном состоянии. Во втором случае лексема может, по- видимому, приниматься за нейтрально-оценочную.

Таким образом, к нейтрально-оценочным языковым единицам принято относить лексемы, либо не имеющие в данном национально-лингво-культурном коллективе специфических культурных коннотаций, либо употребленные в таком контексте, который не актуализирует эти семы, а также в случае, если в контексте данные лексемы не имеют специфической модальной рамки, позволяющей увидеть через нее индивидуальное восприятие говорящим / слушающим описываемой ситуации.

Соответственно, нейтрально-оценочные тексты - это тексты, которые не создают контекстных условий для актуализации какой бы то ни было оценки (ни социальной, ни индивидуальной) описываемой в них ситуации, минимизируя тем самым прагматическую направленность речевого произведения.

1.3 Эмоциональная нейтральность

Наконец, третий аспект - собственно эмоциональная нейтральность. Эмоции долгое время не включались в число объектов лингвистического анализа, поскольку с «легкой руки» Э. Сепира считалось, что, хотя языковые символы и соотносились, возможно, когда-то с эмоциями, сейчас эта связь «уже непосредственно не просматривается» [21. С. 263]. Однако, когда появилась отдельная отрасль лингвистики - эмотиология, сконцентрировавшаяся на изучении проявления эмоциональности в языке, обнаружилась противоположная тенденция - стали высказываться мнения о том, что «весь язык эмотивен», что «не существует эмотивно нейтральной лексики» [22. С. 25].

Тем не менее о возможности существования эмоционально нейтральных текстов писал уже Ш. Балли в начале ХХ в. Он отмечал, что во всяком акте речепроизводства говорящий «придает своим мыслям либо объективную, рассудочную форму, максимально соответствующую действительности, либо чаще всего вкладывает в выражение в самых различных дозах эмоциональные элементы» - индивидуальные чувства, часто претерпевающие влияние чувств социальных [23. С. 29].

В языковых сообществах сложились определенные жанровые формы, которые тяготеют к «объективации интеллектуальной сферы духовной жизни человека» [23. С. 29]. Это в первую очередь жанры информативного дискурса [24]: научный текст (монография, статья, доклад), информационно-справочные тексты (словари, энциклопедии, справочники).

С распространением интернет-дискурса корпусы текстов с так называемым нейтральным сентиментом (тональностью) также формируются и на основе постов в социальных сетях, отзывов о товаре или услуге на интернет-платформах. Это происходит в рамках достаточно новых парадигм анализа, использующих технологический потенциал компьютерной и математической лингвистики.

Первое направление известно как извлечение мнений (opinion mining) [25, 26]. Оно также включает анализ тональности (sentiment analysis), где под тональностью понимается эмоционально-оценочное отношение к объекту оценки (товару или услуги), выраженное в тексте [27, 28]. Оно может быть позитивным, негативным или нейтральным. Текст считается нейтрально окрашенным, если он не содержит эмоциональной составляющей [29. С. 152]. Тональность в рамках такого подхода определяется либо по словарям тональностей, либо на основе вероятностных статистических моделей, выстраиваемых при помощи технологии машинного обучения. Если используется технология машинного обучения по прецедентам, то для тренировки алгоритма привлекается обучающая выборка, в которой каждый текстовый фрагмент имеет «эмоциональную этикетку», приписанную ему ин- формантами-асессорами.

Второе направление - эмоциональный анализ текстов. Его объектом является уже конкретная эмоция, вербализованная в тексте: страх, радость, гнев и др. Но в качестве нейтральных, как и в первом случае, рассматриваются тексты, не содержащие эмоциональной составляющей.

Источником знаний, позволяющих квалифицировать некоторые тексты как эмоционально нейтральные, как в первом, так и во втором случае выступают статистические модели, выстраиваемые компьютерной системой самостоятельно (машинное обучение без учителя), на основе многочисленных итераций, либо с опорой на разметку, предварительно проведенную информантами (машинное обучение с учителем). Кроме того, существенно повысить точность классификации может подача «на вход» алгоритма неких дискриминантных черт (в англоязычной терминологии - features) класса нейтральных текстов, выделяющих его среди других и способных выступить в качестве основы функций-предикторов, определяющих работу программы-классификатора.

Проведенный анализ теоретической литературы позволил сформулировать рабочую гипотезу, предопределяющую алгоритм последующей работы по поиску дискриминантных черт класса нейтральных текстов: вербальная специфика НТ может быть маркирована 1) соответствием стилистической норме (отсутствие обсценизмов); 2) невыраженностью модальной рамки высказывания, что скажется на функционировании маркеров чужого слова, функционировании слов-дейктиков, а также частотных предикатах; 3) отсутствием или статистической нерелевантностью «вокабуляра эмоций».

2. Корпусный анализ нейтральных выборок на фоне эмоциональной выборки

2.1 Сниженная и оценочная лексика

Проведенный анализ частотности четырех наиболее употребительных обсценизмов в трех подкорпусах показал отсутствие подобных лексем (что в вики-текстах ожидаемо), поскольку у ресурса есть команда модераторов с правом блокировки пользователей и удаления записей, к тому же это публичный ресурс.

Однако результаты анализа подкорпуса текстов из социальной сети ВКонтакте, оцененных информантами как нейтральные, продемонстрировали, что, когда речь идет об интернет-текстах, несоответствие стилистической норме не означает автоматическую не-нейтральность текста - в данном подкорпусе обсценизмы есть, хотя значения их частотности в большинстве случаев ниже, чем в эмоциональных текстах. В табл. 1 указана частотность четырех наиболее распространенных обсценизмов.

Таблица 1 Относительная частотность обсценизмов в трех подкорпусах

Подкорпус / частотность наречия в ipm (items per million)

Обсценизм № 1

Обсценизм № 2

Обсценизм № 3

Обсценизм № 4

НТ a priori

0

0

0

0

НТ a posteriori

260

0

43

130

ЭТ

708

68

72

79

Что касается оценочных прилагательных, то в каждом подкорпусе их доля в списке 50 наиболее частотных прилагательных также отличается: НТ a posteriori - 18 из 50 (красивый, счастливый, нужный, хороший, огромный, страшный, крутой, любимый и т.д.), НТ a priori - 3 из 50 (хороший, настоящий, основной) и ЭТ - 24 из 50 (хороший, счастливый, отвратительный, прекрасный, жуткий, и т.д.).

2.2 Способы передачи «чужого слова»

Первая категория вербальных маркеров, верифицированная на материале НТ, - это категория ксенопока- зателей. Термин был введен Н.Д. Арутюновой [30] для обозначения частиц де, мол, дескать как знаков чужого голоса, отчуждаемой речи, чужого мира. Воспроизведение говорящим речи «другого», несущее груз двойной субъективности, выполняет функцию нивелирования социальной ответственности говорящего за передаваемое сообщение в его диктумном или модусном аспекте, что позволяет отнести анализируемые частицы к категории показателей «субъективной цитации» [31].

Как показал анализ, де и дескать не используются ни в ЭТ, ни НТ, по-видимому, тому виной оттенок книжности, который для них характерен. Что касается ксенопоказателя мол, то если в восьми эмоциональных подкорпусах он входит в число частотных служебных слов в диапазоне рангов от 13 до 64, то в обоих нейтральных подкорпусах (НТ a posteriori и a priori) нет ни одного употребления данной единицы.

Уже имеющиеся у коллектива результаты свидетельствуют [32] о том, что ЭТ чувствительны к ксе- нопоказателям. По-видимому, эмоциональность часто объективируется путем апелляции к чужому слову, а нейтральность - ее отсутствием.

2.3 Глагольность и бытийность

Сравнение частотности глагольных форм в девяти подкорпусах показало, что в корпусах НТ значительно меньше глаголов, чем в ЭТ (табл. 2).

Таблица 2 Значения относительной частотности глаголов в подкорпусах ЭТ и НТ

Подкорпус

ЭТ

НТ a posteriori

НТ a priori

Частоты в ipm

от 137 613 до 160 123

101 907

84 061

Среди глаголов обоих подкорпусов самым частотным является глагол быть.

Предварительный интерпретативный анализ корпусов НТ a posteriori позволил сформулировать предположение о том, что внимание нарратора в данных текстах сосредоточено, по-видимому, не на своем эмоциональном состоянии, а на некоторой наблюдаемой ситуации, в которой третьи лица, возможно, испытывают некоторые эмоции, но нарратор о них может только догадываться и эмпатично им сопереживать, однако это не его личные чувства. В [33] подобное явление названо эмотивной тональностью объектного типа. Глагол быть в нейтральных текстах в «Подслушано» используется в имперфективном и перфективном стативном употреблениях [34]. Сравните примеры текстов (орфография и пунктуация пользователей ВКонтакте сохранены).

1. Когда мне было лет 6 мы жили в р-не рядом с рощей. У нас во дворе часто гуляла пожилая женщина со взрослым сыном. Это сейчас я понимаю, что он был умственно-отсталым, а тогда всем детям во дворе он казался просто интересным и странным взрослым и конечно мы не считали его опасным. Как-то его заметили гулящим уже без матери, а потом перестали встречать на улице его вовсе. И вот однажды наша ровесница пропала. Ее не могли найти целый день. А вечером кто-то увидел этого парня, бредущего за руку с пропавшей малышкой в сторону рощи. Оказалось, что целый день они были в его квартире где он «.знакомил» ее со своей мамой, которая лежала мертвая на кровати уже 3 недели. Умерла она своей смертью. Наверное он искал замену, чтобы было с кем гулять (корпус НТ a posteriori).

Нарратор никак не эксплицирует свое эмоциональное состояние, хотя тот факт, что процитированный пост был изначально помещен редакторами паблика под хештегом #Одиночество, имплицирует эмоцию грусти, эмпатически, возможно, переживаемую автором поста, но не замеченную менее эмпатичным асессором, оценившим его как НТ.

В нейтральных же вики-текстах (НТ a priori) глагол быть используется преимущественно в конструкциях с глаголами в пассивном залоге для констатации фактитивной информации, например:

2. В 1922 г. уезды преобразовали в округа. 11 октября 1923 г., согласно постановлению ВЦИК, в административное деление Крымской АССР были внесены изменения, в результате которых округа были ликвидированы, основной административной единицей стал Джанкойский район и село включили в его состав (НТ a priori).

2.4 Дейктики

В подкорпусах ЭТ и НТ проведен анализ значений меры семантической близости MI (коэффициент взаимной информации) глагола быть и четырех дейктиков: я, он, она, они. Мера MI относится к точечным оценкам силы ассоциации. Она сравнивает зависимые контекстно-связанные частоты с независимыми (при случайном появлении слов в контексте) по формуле

где n - ключевое слово; c - коллокат; f (n, c) - частота встречаемости ключевого слова n в паре с коллокатом с; f (n), f (c) - абсолютные (независимые) частоты ключевого слова n и коллоката c в корпусе (тексте) [35].

Оказалось, что значение MI для быть и указанных дейктиков в НТ a priori нулевое, это означает, что их совместная встречаемость статистически не значима, она случайна. Кроме того, частотность каждого из указанных местоимений в сочетании с быть не превышает 200 ipm, что является чрезвычайно низким показателем по сравнению с другими подкорпусами.

В подкорпусе НТ a posteriori ситуация кардинально иная.

На рис. 1 показаны в сравнении значения MI по восьми подкорпусам ЭТ и НТ a posteriori: значения данного коэффициента выше всего в подкорпусе НТ a posteriori, но если для я +быть этот рост незначителен, то для он+быть и они+быть скачок значений более выражен. Иначе говоря, «неслучайность» сочетания быть с местоимениями 3-го лица в корпусе НТ выше, чем в подкорпусах ЭТ.

Таким образом, наблюдается значимое расхождение в функционировании местоимений-дейктиков в связке с глаголом быть в корпусах НТ a posteriori и a priori: в одном они тесно и статистически неслучайно связаны, в другом - практически не употребляются вместе, хотя сам глагол одинаково частотен в обоих подкорпусах. Наблюдаемый контраст можно объяснить тем, что в случае с НТ a posteriori нарратор является одновременно наблюдателем ситуации, происходящей с третьими лицами, - наблюдение требует достаточно длительной фиксации внимания на объекте. Это и влечет за собой, во-первых, употребление быть в его имперфективном или перфективном стативном значениях, во-вторых, использование местоименной репризы во избежание повторов (см. текст 1): он был умственно-отсталым; целый день они были в его квартире) и притяжательных конструкций (в его квартире).