Что пишущие новости боты значат для будущего журналистики

В феврале 2017 года Wired опубликовал статью, посвященную автоматическому написанию новостей. Статья начинается с описания инструмента Heliograf, использующегося в The Washington Post и способного, например, по-человечески написать сообщение о результатах предвыборной гонки.

До сих пор речь шла об автоматизации однородных новостей (спортивных, финансовых и т.п.) — флагманами этого направления стали компании вроде Narrative Science и Automated Insights. В The Washington Post роботов пытаются приспособить для объяснительной журналистики.

Heliograf — полуавтоматическая система, работающая в содружестве с редакцией, которая заготавливает шаблоы для нарратива, включая основные фразы для потенциального исхода. Затем Heliograf получает структурированные данные (например, о выборах или Олимпийских играх) и становится способен генерировать поток сообщений.

Об аномалиях Heliograf предупреждает журналистов через корпоративный Slack.

Преимущество Heliograf в том, что он способен дотянуться до большого числа узких аудиторий, следящих, например, только за своей командой или сенатором. На долю журналистов остается обобщение и более глубокие статьи о важных для всех результатах. В 2012 году четверо человек потратили 25 часов на сбор и постинг результатов выборов. В 2016 Heliograf с небольшим участием людей сгенерировал более 500 статей, собравших более полумиллиона кликов (почти незаметно на фоне 1,1 миллиарда просмотров в ноябре 2016).

Стоит отметить, что The Washington Post — далеко не первые используют новостных ботов. Например, USA Today генерировала короткие видео с помощью Wibbitz, объединяющего новости и заголовки воедино. Reuters применяет робота News Tracer для скорингового определения достоверности твитов. BuzzFeed собирал с помощью бота BuzzBot данные с республиканского и демократического национальных конвентов.

К 2020 году 80% новостей AP будет генерироваться автоматически

Пример работы прототипа AP
Пример работы прототипа AP

Nieman Lab пишет, что AP собирается к 2020 году автоматизировать до 80% процентов производства контента.

  • Сейчас средний редактор AP, пишущий материал о спорте, производит 8 различных версий одной истории. Кроме основного текста вручную пишутся несколько саммари, отдельные лиды для обеих команд, подводка для вещательного формата и так далее.

  • Все вместе журналисты AP только на конвертацию в вещательный формат еженедельно тратят 800 человекочасов (вещательный формат подразумевает короткие предложения, округление чисел, ссылку на источник в начале предложения и т.п.).

  • Чтобы попытаться автоматизировать процесс, используется машинное обучение. Команда из пятерых сотрудников AP создала прототип, который указывает, какие элементы в основном тексте надо улучшить, чтобы получился близкий к вещательному продукт.

  • В 2015 году в AP разработали пятилетний стратегический план по достижению определенных целей в 2020. В конце октября 2016 руководство собиралось, чтобы определить, какие инициативы получат финансирование в приоритетном порядке. Обсуждались 7 инициатив, включая автоматизацию, привлечение пользователей и пользовательский контент.

  • AP уже автоматизирует написание некоторых новостей по корпоративным отчетам с помощью технологий компании Automated Insights. Это позволило в 2015 увеличить число выпускаемых материалов в этом разделе в 10 раз до 4000 штук в квартал.

  • AP инвестировала в Automated Insights и начала автоматически отписывать некоторые бейсбольные новости в автоматическом режиме (речь о мелких командах, о которых агентство раньше никогда не писало).

  • Предполагается, что автоматизация не только облегчит работу журналистов, но и позволит поставлять клиентам истории, адаптированные под их читателя (например, под конкретный город или аудиторию).

Associated Press начинает использовать роботов для написания некоторых текстов

Агентство Associated Press будет автоматически генерировать тексты с данными из отчетов о прибылях и убытках компаний с помощью технологий, разработанных Automated Insights.

Журналисты при этом смогут сосредоточиться на том, что автоматизировать невозможно, — на аналитике цифр из отчетов, выявлении тенденций и сборе эксклюзивной информации. Представитель агентства приводит пример: сейчас ежеквартально создается вручную 300 таких материалов о компаниях США, после внедрения роботов это число увеличится до 4400.

AP will use robots to write some business stories | Poynter.