Monday Note -

Фейки попробуют выявить анализом структуры статьи

Фредерик Филлу (Frederic Filloux) в Monday Note рассказывает о проекте News Quality Scoring, призванном выявлять фейки по техническим характеристикам, а не с помощью трудоемкой проверки данных. Его статья основана на анализе 640 тысяч статей из 500 крупнейших американских сайтов и 850 их RSS-потоков.

Идея проекта заключается в том, что сайты, производящие фейки, обычно даже технически устроены хуже, чем настоящие. Эту разницу можно заметить с помощью автоматического анализа материалов.

Например, автоматическим способом в фейках сложно найти источник. Анализ данных домена помогает снизить рейтинг доверия в случае, если эти данные закрыты, а само имя зарегистрировано недавно.

Заголовок вполне возможно проверять на наличие кликбейтовых элементов. Это тоже влечет за собой штраф в общем рейтинге материала.

Филлу также предлагает ввести белый список проверенных авторов. Он считает, что такой список все равно уже существует или в ближайшее время будет создан крупнейшими платформами.

Фотографии без подписи или стоковые фото (что легко проверить автоматически) также снижают уровень доверия. То же касается видео. Вообще для фейковых текстов характерна плохая работа над визуальной частью.

Предполагается, что семантический анализ самого текста также может выявить низкое качество — в первую очередь, непропорциональное количество цитат, имен и т.п.

Также интересно изучить связанные истории. Настоящие издания обычно пишут много материалов на ту или иную тему. Статья без сопроводительных материалов подозрительна.

Наконец, Филлу в отдельный пункт выделяет автоматический анализ подвала — у настоящих изданий есть контактная информация или ссылка на соответствующую страницу.

Подписная модель для СМИ: разрушение и надежды

Ведущий Monday Note Фредерик Филлу (Frederic Filloux) опубликовал в начале марта два поста о подписных моделях изданий.

Первый пост рассматривает возможность разрушения старой подписной модели для новостных изданий компаниями вроде Google и Facebook и создания на ее месте новой.

Речь идет о динамическом ценообразовании, которое практически не затронуло новостную индустрию. В отличие от полета на самолете, где пассажиры на соседних креслах могут заплатить совершенно разные суммы, в журналистике это пока не работает, а издатели не применяют техники по управлению выручкой. Интересно, что динамическое ценообразование уже вовсю применяется в телевидении.

К сожалению, онлайновые издатели передали нарождающиеся рекламные аукционы и их схемы ценообразования технарям. Кроме того, они никогда не пробовали формировать цену подписки отдельно для каждого пользователя.

Фредерик Филлу предполагает, что такого рода продажи можно организовать через инфраструктуру Google Play, используя данные, собранные поисковиком. Facebook’у придется сложнее — такому подходу препятствует заявленная им бесплатность, принцип фильтрации новостного потока (что противоречит самой сути новостей) и осторожность в использовании личных данных — минимум 22 сигнала из 98, используемых Facebook, потенциально могут пригодиться в продаже подписок. Facebook и Google могли бы предоставить эти бесценные для многих издателей данные.

Во второй статье Филлу отвечает на критику подобного подхода. Критики, в частности, опасаются, что подобный подход сделает издателей еще более зависимыми от платформ.

Он утверждает, что:

Издатели недостаточно инвестируют в работу с клиентами. Они разделятся: одни пойдут по пути технологического развития, другие сохранят текущий курс;
Вряд ли издатели смогут собраться вместе (как это однажды сделали в схожей ситуации авиакомпании) и создать огромную маркетинговую платформу, основанную на больших данных;
минимум двое калифорнийских игроков на этом рынке работает над продажей подписок по более низкой цене (они уже продали подписки по высокой всем, кому могли).

Журналистские и экономические ценности пока не связаны друг с другом

Фредерик Филлу (Frederic Filloux), ведущий Monday Note, написал программный пост о несоответсвии журналистских и экономических ценностей — по крайней мере, пока.

Основные тезисы:

Пока цифровые издатели усредняют ценность контента, надежды на улучшение новостной экономики мало;
Цифровые платформы неспособны оценить разные материалы в разные суммы в зависимости от их типа и качества;
Рекламное место продается по одной и той же цене вне зависимости от того, рядом с чем стоит баннер — новостью стажера или профессиональным расследованием на 10 тысяч слов;
Пока на CPM влияет только расположение рекламных модулей;
Экономика СМИ до сих пор не имеет ничего общего с размером, глубиной, уникальностью материала, с его авторством, наконец;
Видео на Bloomberg, заимствующее большую свою часть из промоматериалов SpaceX, продает рекламу по тем же расценкам, что и видео, созданное командой в студии;
Возможность привязать ценность контента к его стоимости для рекламодателей и потребителей могла бы существенно помочь издателям;
Для этого надо разработать систему, которая учитывала бы не только статические характеристики материала (например, жанр и объем), но и динамические (например, как только новость про пропавший самолет оказывается частью цикла о катастрофе, ее экономическая стоимость стремится к нулю, а многие издатели даже специально отключают рекламу);
Новый подход мог бы заставить рынок уважать (или хотя бы поощрять эксклюзивность и традиционную работу в поле).

Заключительные тезисы:

Хотя журналистская ценность новостей сильно варьирует, экономическая ценность пока не меняется;
Сеть наполнена специализированным и уникальным контентом большой журналистской ценности, однако отыскать его непросто;
Чтобы пересмотреть журналистские и экономические/коммерческие ценности, способ продажи рекламы надо придумать заново. С нуля.

Автор предполагает, что систему оценки качества надо внедрять на уровне CMS и внедрять повсеместно. Он посвятит этому проекту год в JS Knight Journalism Fellowship в Стэнфорде.

Противостояние между печатными и цифровыми СМИ заключается в разнице их культур

Журналист Фредерик Филлу (Frederic Filloux) из MondayNote утверждает, что разница между печатными и цифровыми медиа заключается в культуре потребления, создания и распространения контента.
Читать далее «Противостояние между печатными и цифровыми СМИ заключается в разнице их культур»