Статья: Сравнительный анализ структурно-содержательных элементов машинных и журналистских новостных сообщений

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Сравнительный анализ структурно-содержательных элементов машинных и журналистских новостных сообщений

Мария Лукина, Екатерина Палашина

В статье впервые в отечественных медиаисследованиях продемонстрированы результаты сравнения текстов, созданных алгоритмом и написанных человеком.

Для пилотажного сравнительного анализа новостных сообщений на экономическую тему информационного агентства «Интерфакс» была использована основанная на структурно-функциональном анализе методика качественного разбора журналистских текстов.

Авторы полагают, что эта методика применима для осуществления дальнейших исследований, в частности количественного анализа, основанного на выборках больших массивов новостных текстов.

Ключевые слова: роботизированные новости, структурно-содержательный анализ, перевернутая пирамида, заголовок, лид и корпус новости.

журналистика роботизированный алгоритм интерфакс

Введение

Автоматизированное цифровое производство, управляемое интеллектуальными системами, проникло в разные структуры и процессы медиаиндустрии, в том числе в этап создания текстов. Одними из первых использовать алгоритмы для генерации контента стали крупные информационные агентства, работающие с большим потоком входящей финансовой информации. Алгоритмы, позволяющие создавать новости без участия человека, обеспечили молниеносную скорость создания сообщений, позволили максимально оперативно снабжать информацией свою аудиторию.

Первые опыты алгоритмизации новостей стали проводить такие информационные гиганты, как Associated Press, Bloomberg, затем к ним присоединились игроки журнального и газетного рынка. Эксперименты начали проводиться с 2013 г. Лидером по внедрению этих решений среди медийных компаний стало информационное агентство Associated Press. По словам его бизнес-редактора Филаны Паттерсон, к 2015 г. автоматизация освободила примерно 20% времени, необходимого журналистам на обработку данных и подготовку финансового блока новостей, что, в свою очередь, позволило им сконцентрироваться на творческой работе. Другим важным преимуществом применения алгоритмов Паттерсон назвала уменьшение вероятности ошибок в текстах1.

В отличие от зарубежных медиа, где практика использования готовых автоматизированных решений в производстве контента в последние годы стала неотъемлемой частью рабочего процесса, в России алгоритмы для создания новостных сообщений применяют лишь немногие редакции. К ним относятся информационные агентства «Интерфакс» и ТАСС, онлайн-издание Sports.Ru, женский глянцевый журнал ELLE и, конечно, поисковая система «Яндекс». По словам директора АНО «Информационная культура» Ивана Бегтина, применение алгоритмических решений в журналистике есть следствие «экономической целесообразности, о которой задумываются медиакомпании, чтобы не содержать человека, который писал бы про курсы ЦБ». Эксперт отметил, что «таких направлений в журналистике, где робот может заменить человека, найдется не более десятка, например, спорт, погода и др.»2.

Теоретический обзор

Теоретическим осмыслением алгоритмических решений в журналистике и медийной практике зарубежные исследователи начали заниматься с конца 2010 гг. Изучались разные аспекты, связанные с их применением, в том числе возникающие проблемы подотчетности (Hamilton, Turner, 2009), социологии феномена (Anderson, 2012), практики в разных ньюсрумах (Karlsen, Stavelin, 2014), изменения в характере журналистского труда (Carlson, 2015), авторства (Monta, Reich, 2017), этических перспектив алгоритмических решений (HoUbuncher, Dorr, 2017), описывался также их статус- кво на определенный период (Graefe, 2016) и др.

Российский исследовательский дискурс не столь разнообразен, статьи посвящены изучению опыта роботизации в зарубежных СМИ (Иванов, 2015), проблемам транспарентности роботизированной журналистики (Иванов, 2017), роботизации медиапроизводства в контексте «журналистики смысла» (Зорин, 2016), теоретизации в фокусе журналистского образования (Замков, Крашенинникова, Лукина, Цынарёва, 2017). Отечественных разработок в области исследования созданного алгоритмами контента не проводилось.

Отечественный опыт роботизированной журналистики

Безусловным лидером в создании автоматических новостных лент является поисковая система «Яндекс», которая осенью 2015 г. запустила специальный сервис для СМИ «Яндекс для медиа»3. В своем блоге компания объяснила, что «информация поступает от ряда сервисов "Яндекса" - Пробок, Погоды и Поиска, обрабатывается с помощью алгоритмов и отображается в специальном интерфейсе для СМИ или рассылается подписчикам <...> в нашем "агентстве" нет ни одного корреспондента - только статистика и алгоритмы»4.

Своим подписчикам «Яндекс для медиа» предлагает новости, сортированные в соответствии с шестью тематическими блоками: интересы пользователей, пробки, погода, кино, музыка и электронная коммерция. Роботы оперативно сообщают о заторах на дорогах, передают последние метеосводки. Особенность решений «Яндекса» в его персонализированном интерфейсе, а формат подачи контента зависит от типа СМИ. Телеканалам, например, предлагают тексты для бегущей строки или адаптированные под телевизионное вещание готовые виджеты, радиостанциям - специальный интерфейс с обновлением информации в режиме реального времени, а печатным и онлайн- изданиям - электронную рассылку или ленту уведомлений в виде RSS. Главный успех предлагаемой «Яндексом» автоматизированной новостной ленты создатели видят в высвобождении временных ресурсов сотрудников редакций: «Готовые сводки новостей, которые можно сразу же зачитать в эфире или использовать для подготовки сюжета, позволят новостникам сэкономить самый важный для них ресурс - время»5.

Из производителей новостей в отечественных СМИ первопроходцем по применению алгоритмических решений принято считать информагентство «Интерфакс». Ленты с автоматизированными сообщениями появились там еще в середине 1990 гг., и до сих пор с помощью обработки структурированных данных роботы освещают некоторые сегменты экономического сектора: котировки акций, курсы валют, изменение цен на товары и др., также частично автоматизирована статистика по банкам и отчетности ВВП. По словам заместителя генерального директора «Интерфакса» Юрия Погорелого, реализацией и постоянным апгрейдом роботизированных разработок занимается собственное подразделение службы новостей агентства, в которую входит группа (Т-специалистов6.

Производство автоматических новостей в «Интерфаксе» осуществляется, как правило, в цикле полной автоматизации. В этом случае работа алгоритма автономна и новость выпускается роботом на ленту автоматически, без участия журналиста. Однако существует режим и неполной автоматизации, когда подготовленный машиной текст перед отправкой на ленту утверждает редактор. Юрий Погорелый говорит, что схема автоматизации зависит от уровня сложности информации. Однако и в том, и в другом случае в конце каждой роботизированной новости ставится обязательная оповещающая читателя маркировка: «Это автоматическое сообщение».

Использование алгоритмов в «Интерфаксе» не ограничивается генерацией текстов, их применяют в ньюсрумах и в качестве помощников при работе журналистов с входящим потоком информации. «У нас каждый журналист мониторит в режиме реального времени как минимум 250 сайтов ежедневно, - говорит Юрий Погорелый, - это им помогают делать специальные программы, которые выявляют инфоповоды, а пишут текст сами журналисты на базе того, что узнали от роботов»7. В перспективе «Интерфакс» планирует развивать новые направления автоматизации, в частности в области обработки большого количества данных. Например, просмотреть в одиночку все решения арбитражных судов журналист не в состоянии, а вот роботу справиться с такой задачей под силу. По словам Погорелого, «роботы не создают какое-то новое знание, а лишь обрабатывают то, что уже есть». Ежедневно при участии роботов агентство публикует сотни единиц информации, включая статистику, отчетность, результаты торговли на организованных рынках и др. И такая частичная замена ручного труда обеспечивает при выполнении рутинных задач серьезную экономию времени журналистов.

ТАСС в отличие от «Интерфакса» роботизацией занимается последние несколько лет и по некоторым направлениям лишь в экспериментальном режиме. В частности, ТАСС реализует два ключевых проекта, связанных с роботожурналистикой. К первому относится написание заметок алгоритмами на основе входных данных. Находящаяся в разработке программа умеет анализировать дискретные данные и может создавать новостные сообщения о курсах валют, расходах бюджета и др. На момент тестирования нового инструмента процесс строго контролировался редакторами, что было связано в первую очередь с необходимостью предотвращения ошибок. Программисты информационного агентства также обучили программу мониторингу динамических данных с целью автоматизации биржевого и финансового потока информации в будущем. Налаживая этот механизм, ТАСС экспериментировал с оперативным отслеживанием новостей с сайта Московской биржи.

Однако особое внимание редакция уделяет второму проекту: системе автоматической категоризации текстов. Анализируя содержание каждого сообщения, робот классифицирует его в соответствии с рубриками, геолокациями и объектами. Кстати, аналогичная система применяется в американском новостном агентстве Associated Press, где каждый материал пропускается через специальные автоматизированные «фильтры».

Эту технологию первыми начали применять региональные ленты ТАСС, затем агентство категоризовало экономический раздел. «Эту разработку я считаю важным достижением, благодаря которой возможно "выпечь" любую новостную ленту, что позволяет информагентству охватить мелких клиентов и заработать на этом», - объясняет заместитель главного редактора ТАСС Михаил Лукин8. Категоризация также минимизировала трудовые затраты редакции. По словам Лукина, алгоритм, по сути, заменяет труд почти четырех журналистов, чья работа была бы необходимой в случае ручного создания такой персонализированной ленты.

Осознавая перспективность этой технологии, разработчики ТАСС намерены создать универсальный алгоритм, который будет обрабатывать более сложные данные - например, отчеты компаний, пресс- релизы и метеосводки. Для наполнения материалов предполагается автоматизировать также архивы информагентства. «Не человек будет смотреть, в какой период курс доллара поставил рекорд, а робот. У него это получается гораздо быстрее и с меньшими затратами», - говорит о планах ТАСС Михаил Лукин.

Методика

Для сравнительного анализа новостных сообщений была выбрана основанная на структурно-функциональном анализе методика качественного разбора журналистских текстов. В качестве эмпирической базы использовались новостные сообщения на экономическую тему информационного агентства «Интерфакс».

В рамках исследования был поставлен ключевой вопрос: в чем отличие текстов, созданных алгоритмом, от написанных профессиональными журналистами? Сравнивались машинные и журналистские тексты на предмет соответствия определенным критериям структуры и содержания новостного сообщения.

Алгоритм автоматической генерации «Интерфакса» участвует в написании новостей на темы, связанные с рынком ценных бумаг, курсами валют, деятельностью Банка России (ЦБ), включая остатки денежных средств на корреспондентских счетах, отзывы лицензий у коммерческих банков, установление цен на драгоценные металлы, анонсом макроэкономических показателей, праздниками ведущих стран мира.

В качестве единиц контент-анализа были выбраны новостные тексты, опубликованные на ленте финансово-экономической информации «Интерфакса» в октябре-ноябре 2018 г. Всего для исследования было отбрано 50 публикаций разного объема, в статье для разбора использовано шесть типовых новостей (три произведены роботом, (три написаны журналистами).

Ограниченность выборки объясняется тем, что для новостных сообщений информационного агентства, специализирующегося на финансово-экономической информации, характерно следование шаблонам и строгая композиция, соответствующая сформированным и устоявшимся редакционным стандартам. Новости, созданные как алгоритмом, так и человеком, должны отвечать этим статндартам, прописанным в разработанном агентством «Интерфакс» стайлгайде9, в связи с этим рандомно выбранные эмпирические объекты представляются релевантными для исследования.

В качестве индикаторов сравнительного контент-анализа новостных сообщений, произведенных роботами и журналистами, были выбраны следующие структурно-содержательные характеристики и элементы:

заголовок/хедлайн (вид, его соответствие теме);

лид (расставленные акценты);

корпус/тело новости (использование цитат, ссылок и их виды, фактологическая наполненность);

бэкграунд (наличие, функции);

полнота содержания (ответы на вопросы кто? что? где? когда? почему? как?);

насыщенность числовыми данными;

насыщенность расчетными величинами;

насыщенность специальной терминологией;

длина предложений.

Чтобы зафиксировать результаты сравнительного контент-анализа были разработаны рабочие таблицы (см. табл. 1 и 2), которые демонстрируют ключевые особенности новостных публикаций алгоритмической природы и публикаций, созданных человеком.

Результаты