Статья: Сравнительный анализ структурно-содержательных элементов машинных и журналистских новостных сообщений

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Всего новость состоит из 256 слов. Объем использования числовых данных, расчетных величин и терминов мал: три, одно и три слова, которые в процентном расчете составляют следующую величину: 1,2%, 0,4% и 1,2%. Длина предложений - от шести до 39 слов.

Пример 6.

К 2036 году ВВП РФ вырастет в 1,7 раза, реальные доходы населения - в 1,5 раза - прогноз Минэкономразвития

28 ноября. Finmarket.ru - Рост российского ВВП в базовом варианте прогноза в долгосрочной перспективе будет колебаться около 3% в год, что означает рост экономики в 1,7 раза к 2036 году относительно 2018 года, говорится в долгосрочном прогнозе Минэкономразвития, утвержденном на прошлой неделе правительством.

Согласно базовому варианту долгосрочного прогноза, инвестиции к 2036 году вырастут в 2,2 раза к 2018 году, промпроизводство - в 1,7 раза, реальные доходы населения - в 1,5 раза, реальная заработная плата - в 1,6 раза, розничная торговля - также в 1,6 раза.

Минэкономразвития России заложило в базовый сценарий предпосылку о постепенном снижении цен на нефть марки Urals до уровня $52-53 за баррель в 2025-2030 гг. с последующим ростом в номинальном выражении темпа долларовой инфляции - до $58 в 2036 году.

«В части внутренних условий социальноэкономического развития в базовый сценарий заложены следующие предпосылки. На прогнозном горизонте продолжится реализация денежно-кредитной политики в рамках режима инфляционного таргетирования. Особое внимание Банк России продолжит уделять мониторингу рисков финансовой стабильности и ее поддержанию. Бюджетная политика продолжит проводиться в рамках бюджетных правил, направленных прежде всего на изоляцию ключевых внутренних экономических параметров от волатильной внешнеэкономической конъюнктуры и создание условий для устойчивого экономического роста. Тарифная политика будет проводиться в соответствии с долгосрочными принципами тарифного регулирования, приоритетом которых сохранится ограничение темпов роста цен на услуги естественных монополий уровнем инфляции», - описывают в министерстве базовый сценарий долгосрочного прогноза.

Средний темп роста экономики ожидается министерством в 2018-2024 годах на уровне 2,7% в год, в 2025-2030 годах - 3,2% в год, в 2031-2036 года х - 3,0% в год.

Минэкономразвития также подготовило и консервативный вариант долгосрочного прогноза, где цены на нефть к 2020 году опускаются до $43 за баррель и плавно повышаются до $52 к 2030 году. В этом сценарии темпы роста ВВП ниже на несколько десятых процентных пунктов в год, чем в базовом варианте (28.11.18).

Таблица 1. Структурные элементы новостных заметок, созданных алгоритмом и человеком

Номер

новости

(пример)

Заголовок

Лид

Корпус

(тело)

Бэкграунд

Полнота содержания (ссылки на источники, цитаты ньюсмейкеров)

1

+

-

+

-

-

2

+

+

+

+

-

3

+

-

+

-

-

4

+

+

+

-

+

5

+

+

+

-

+

6

+

+

+

-

+

Таблица 2. Объем заметок, насыщенность числовыми данными, расчетными величинами и специальной терминологией

Номер

новости

(пример)

Объем новости (в словах)

Насыщенность числовыми данными, %

Насыщенность расчетными величинами, %

Насыщенность специальной терминологией, %

Длина

предложений (в словах)

1

50

12

--

--

18, 29

2

158

10,7

0,6

1,9

11, 16, 21, 29,

35, 39

3

30

6,6

--

--

6,7, 12

4

322

0,9

0,6

2,2

6, 9, 13, 13, 16,

18, 19, 20, 23, 23, 27, 28, 30, 36, 37

5

256

1,2

0,4

1,2

6, 8,10, 12, 12,

12, 13, 14, 18, 20, 21, 33, 33, 39

6

303

6,9

4,2

3,3

12, 12, 13, 17, 18 27, 28,28, 31, 37, 38, 39

Новость посвящена макроэкономической теме, а именно прогнозу роста ВВП в России. Структура сообщения стандартна для такого вида новостей и включает такие элементы, как заголовок, прямой лид и корпус, в каждом из которых содержится отсылка к ведомству Минэкономразвития. Информация излагается журналистом по принципу от главного к второстепенному, отвечая на основные вопросы за исключением объяснения причин -- «почему?».

Автор публикации детализирует свой текст подробной прямой цитатой из базового отчета-прогноза министерства. Новость также изобилует цифрами: точными датами, процентами и другими величинами, раскрывающими основные макроэкономические показатели, что, в свою очередь, делает сообщение информационно насыщенным.

Объем новостного сообщения - 303 слов. Насыщенность числовыми данными - 6,9% (21 слово от суммарного количества), а насыщенность расчетными величинами 4,3% (13 слов от суммарного количества). В тексте также было найдено 10 терминов, насыщенность которых измеряется в показателе 3,3%. Предложения в отличие от автоматических новостей также длинные. В составе более половины предложений от 25 до 39 слов в каждом.

В ходе проведенного авторами исследования изучалось в том числе использование структурного принципа «перевернутой пирамиды», т.е. изложения сообщения по степени важности от главного к второстепенному, а также полноты содержания, которое раскрывается ответами на вопросы кто? что? где? когда? почему? как? (см. табл. 1). Новостные сообщения также сравнивались в соответствии с такими критериями, как насыщеннось числовыми данными, расчетными величинами, специальной терминологией, длина предложений (см. табл. 2).

Заключение

Для пилотажного анализа созданных с помощью алгоритма и написанных журналистами новостных сообщений информационного агентства «Интерфакс» на экономическую тему была использована методика качественного разбора журналистских текстов. В результате сравнения исследователи пришли к следующим выводам. Существенных отличий между машинным и журналистским текстом в рассмотренных материалах выявлено не было, большинство структурно-содержательных компонентов, а именно заголовок/хедлайн; лид; корпус присутствуют в изученных как в алгоритмических, так и журналистских новостных сообщениях. И в тех, и в других новостях (кроме примера 2) отсутствовал бэкграунд в силу того, что в фокусе внимания были краткие новости, иногда в формате молний. Исследование показало, что по своим семантическим и стилистическим особенностям текст журналиста мало чем отличается от машинного текста в силу специфики письма, используемого для написания экономических информационных сводок по конкретным отраслям рынка. Тексты, выбранные для сравнения, не содержали ни языковых неточностей (включая орфографические, пунктуационные, стилистические), ни логических ошибок.

Однако при всей схожести новости, созданные журналистом, по сравнению с роботизированными текстами отличают следующие черты: во-первых, для них характерно наличие более разнообразного и исчерпывающего фактологического материала, во-вторых, привлекается информация, которую невозможно собрать с помощью алгоритма, - цитаты ньюсмейкеров, ссылки на «человеческие» источники, в-третьих, полнота содержания раскрывается с помощью вопросов как? и почему?, устанавливающих причинно-следственные связи события, которые алгоритмы пока не научились восстанавливать.

Автоматические новости по своему объему уступают новостям, подготовленным человеком. В машинных текстах также короче длина самих предложений. Такую разницу можно объяснить тем, что алгоритмы, не обладающие в отличие от профессионального журналиста способностью мыслить, анализировать и грамотно выстраивать в тексте причинно-следственные связи, пока не способны производить большие полноценные тексты. Освоение технологий автоматизации пока осуществляется в простых формах журналистского текста, поэтому работу алгоритма можно изучать исключительно в рамках коротких новостных сообщений, похожих по своей форме на оперативные оповещения.

Показатель насыщенности числовыми данными автоматических новостей выше, чем показатель текстов не алгоритмической природы. Это связано с тем, что алгоритмы работают в первую очередь с изменениями в насыщенных числовой информацией данными. Приоритетная задача автоматизированного подхода заключается в работе с готовыми текстовыми шаблонами, каждый раз требующими ввода новых данных, касающихся, например, точных значений изменившегося курса валют, стоимости ценных бумаг, драгоценных металлов или информации о загруженности дорог. Наличия точных числовых данных также постоянно требует унифицированность формата анонса макроэкономических показателей, в которых обязательным является указание даты и времени выхода нового анонса.

При этом автоматические сообщения редко содержат расчетные величины, указывающие на процентные показатели, а также сравнения, выраженные в количестве раз. Такая особенность объясняется тем, что авторы новостной ленты «Интерфакса» в отличие от алгоритма не только фиксируют информацию, но и перерабатывают ее, преобразуют в более простой вид, тем самым облегчая читателю процесс чтения и понимания и экономя его время. Анализ показал, что тексты журналистов могут отображать тенденции, динамики, зависимости, возможные прогнозы, которые сложно представить в публикации робота без привлечения расчетных величин.

Насыщенность специальной терминологией у автоматизированных и неавтоматизированных новостей относительно одинаковая. В силу специфики экономической тематики наличие в текстах специальной экономической лексики - естественное и необходимое условие, позволяющее осуществлять коммуникацию с целевой аудиторией, в которую входят преимущественно участники деловых отношений. Однако в отличие от новостей, подготовленных журналистами, употребление терминологии в автоматических новостях реализуется в рамках шаблонных речевых конструкций. Другая особенность заключается в отсутствии раскрытия значения терминов. Это можно объяснить целью адресной доставки информации.

Заместитель генерального директора «Интерфакса» Юрий Погорелый, рассказывая об особенностях автоматических новостей, отмечает: «Машинные тексты всегда одинаковые. По стилю это такое же информационное сообщение. Но если говорить о сути вещей, то такой текст всегда будет абсолютно стандартизованным»11. Заместитель главного редактора ТАСС Михаил Лукин также уверен в том, что пока преимущество сохраняется за журналистом, несмотря на огромную пользу алгоритмов в генерации новостей, благодаря которым удается анализировать большие массивы структурированных данных и в определенных ситуациях работать быстрее и эффективней человека. Он отмечает, что есть операции, которые человек делает лучше, чем машина, и, видимо, будет делать лучше всегда.

Примечания

Associated Press: Automated Insights. Режим доступа: https://automatedinsights. com/customer-stories/associated-press (дата обращения: 21.11.2018).

Выступление на круглом столе «Роботожурналистика: современное состояние и перспективы развития» (НИУ ВШЭ, 22 декабря 2017 г.).

Голицына А. «Яндекс» создает информагентство, где новости станут писать роботы // Ведомости. 2015. Окт., 25. Режим доступа: https://www.vedomosti.ru/ technology/articles/2015/10/25/614215-yandeks-informagentstvo-roboti (дата обращения: 21.11.2018).

Блог Яндекса: Яндекс для медиа. 2015. Ноябрь, 10. Режим доступа: https://yandex. ru/blog/company/99487 (дата обращения: 21.11.2018).

Там же.

Интервью авторов с заместителем генерального директора «Интерфакса» Ю. Погорелым. 2017. Дек., 13.

Там же.

Интервью авторов с заместителем главного редактора ТАСС М. Лукиным. 2017. Дек., 14.

Технология новостей от Интерфакса / под ред. Ю.А. Погорелого. М.: Аспект Пресс, 2011.

Там же. С. 10-11.

Интервью авторов с Ю. Погорелым.

Библиография

Замков А.В., Крашенинникова М.А.,Лукина М.М., Цынарёва Н.А. Роботизированная журналистика: от научного дискурса к журналистскому образованию // Медиаскоп. 2017. Вып. 2. Режим доступа: http://www.mediascope.ru/2295

Зорин К.А. Медиафутурология: «журналистика смысла» в условиях роботизации медиапроизводства и общества // Медиаскоп. 2016. Вып. 1. Режим доступа: http:// www.mediascope.ru/node/2078

Иванов А.Д. Роботизированная журналистика и первые алгоритмы на службе редакций международных СМИ // Знак: Проблемное поле медиаобразования. 2015. № 2 (16). С. 32-38.

Иванов А.Д. Транспарентность роботизированной журналистики: как новые технологии угрожают принципам профессии // Вестн. Челябинск. гос. ун-та. 2017. № 8 (404). С. 28-32.

Anderson W. (2012) Towards a Sociology of Computational and Algorithmic Journalism. New Media and Society 15 (7): 1005-1021.

Carlson M. (2015). The Robotic Reporter: Automated Journalism and the Redefinition of Labor, Compositional Forms, and Journalistic Authority. Digital Journalism 3: 416-431.