Silk: мы присоединяемся к Palantir

Стартап Silk, занимавшийся интерактивной визуализацией данных, объявил, что присоединяется к Palantir.

Почему это важно:

  • Silk предлагал рассказывать интерактивные истории и ориентировался в том числе на медиа, позиционируя себя как платформу.

  • Palantir принадлежит миллиардеру Питеру Тилю (Peter Thiel), которого журналистское сообщество воспринимает как врага после того, как он помог рестлеру Халку Хогану разорить издание Gawker. У самого Тиля был зуб на Gawker — блог рассказал, что он гей, поставив под угрозу договоры со странами, где с геями не дружат.

  • Palantir тоже занимается визуализацией данных, но совершенно особого рода. Это визуализатор скрытых связей людей, событий, организаций и явлений для разведок. Он позволяет, например, связать звонок из одной страны в другую с подготовкой теракта и конкретными подозреваемыми (или выявить подозреваемых).

  • Основные клиенты Palantir — разведки и государственные службы, властные структуры. Основные клиенты Silk (как сам Silk говорит в пресс-релизе) — журналисты-аналитики (data journalists), активисты, негосударственные организации, бизнес.

  • Существующая платформа продолжит работу, но поддержки текущего продукта больше не будет.

Revolutions: как в FiveThirtyEight применяют язык программирования и статистического анализа R

Блог Revolutions рассказывает о том, как в издании FiveThirtyEight применяют язык программирования и статистического анализа R. FiveThirtyEight специализируется на материалах, основанных на различного рода данных (социологических и политических опросах, спортивной статистике посещаемости сайтов, демографии и т.п.)

  • В материал включена 22-минутная видеопрезентация аналитика FiveThirtyEight, описывающего рабочий процесс;

  • Особое внимание стоит уделить тому, что графики из R сразу экспортируются в готовый для публикации вид. Для этого FiveThirtyEight модифицировала стандартную тему.

Ниже примеры использования:

Дэнни Пейдж: не используйте Google Trends для генерации инфоповодов

Спортивный аналитик Дэнни Пейдж (Danny Page) просит журналистов не использовать Google Trends для генерации информационных поводов.

  • Пейдж приводит в пример запрос «What is the EU?» Сразу несколько СМИ написали, что после брексита только что проголосовавшие британцы стали спрашивать Google, откуда они только что вышли.

  • На деле, конечно, по сравнению с по-настоящему популярными запросами небольшой пик «что такое ЕС» совершенно незаметен. Речь идет примерно о тысяче запросов.

  • Это не единичный случай.  После выборов 2012 года в США небольшое (около 100) число людей спросило Google «who is mitt romney». Это ни в коем случае не означает, что это значимый пик. Более того, такая формулировка не указывает на незнание — вполне возможно, что часть спрашивающих используют такой формат для любых справочных запросов;

  • Неправильные исходные данные также могут привести к оплошностям. Блог FiveThirtyEight ступил на шаткую почву спортивной аналитики, узнав, что NHL планирует расширение, предположил, что перспективным рынком будет не Сиэтл с 3,6 миллионами потенциальных болельщиков, а территория, включающая город Sudbury (100 тысяч человек) и Thunder Bay, также находящийся в штате Онтарио. Это единственное, что объединяет два города — от Sudbury до Thunder Bay тысяча километров.

Nieman Lab: как в The Telegraph автоматически рисуют спортивные схемы и графики

Nieman Lab пишет об инструменте The Telegraph под названием Roboblogger. Он в реальном времени иллюстрирует происходящее на поле графиками и схемами и вставляет это в живую трансляцию.

  • В конце 2015 года The Telegraph опробовал Roboblogger на регбийном матче Новой Зеландии  и Австралии;

  • В матчах Евро-2016 Roboblogger следит за перепасовками и голами;

  • The Telegraph серьезно экономит средства и сокращает персонал. Roboblogger сделан на деньги Google (тот предоставил грант на 300 тысяч евро);

*  Roboblogger не просто строит графики. Его потенциал больше — в The Telegraph скармливают системе данные старых матчей, чтобы правильно отбирать графики, а также ранжировать игроков по их способностям. Алгоритм ранжирования неясен, но авторы сравнивают его с PageRank, так что, скорее всего, он основан на построении и расчетах графов передвижения и действий игроков.

  • Roboblogger строит графики автоматически, ведущий лишь решает, какой включать (перед публикацией он видит сразу все варианты, некоторые из них система помечает как наиболее интересные);

  • Roboblogger — часть новой системы управления контентом, которую The Telegraph представил в 2016 году и которая «из коробки» поддерживает живые трансляции.

  • Иногда благодаря правильному и полуавтоматическому ведению текстово-графической трансляции получается обгонять телевизор, так как в нем трансляция идет с задержкой в несколько секунд.

The Wall Street Journal создал просмотрщик консервативного и либерального Facebook

The Wall Street Journal по следам скандала с якобы пессимизацией Facebook консервативных новостных поводов соорудил интерактивный сервис, позволяющий  просматривать «консервативную» (красную) и «либеральную» (синюю) ленты Facebook по самым разным тематикам — от Хиллари Клинтон до абортов.

Это не игрушка:

  • сервис основан на опубликованной в Science статье исследователей Facebook про идеологически разные источники мнений и новостей.

  • Наблюдались 10,1 миллиона пользователей;

  • Одним из результатов стал список из 500 источников с градацией по политическим взглядам (попадание в список не означает, что сам источник консервативен или либерален; он означает, что консерваторы или либералы активно делятся записями оттуда);

  • «Красный фид» WSJ составила из  помеченных как очень консервативные источников топа, «синий» — из самых либеральных. Чтогбы попасть в фид, надо, чтобы пост набрал как минимум 100 репостов и исходил из источника с поменьшей мере 100 тысячами последователей.

Nautilus: об опасности «больших данных»

Nautilus опубликовал колонку об опасностях, которые таят в себе «большие данные». Зачастую тот факт, что выводы основаны на анализе большого корпуса данных, заставляют материал выглядеть значительнее. При этом не всегда такой анализ отражает реальность.

Приводится самый доступный пример — Google Ngrams, сервис, позволяющий отслеживать словоупотребление в английском (и не только) языке. Однако мало кто знает, что база данных Ngrams не выверена, не сбалансирована для того, чтобы делать далеко идущие выводы. Один из самых понятных недостатков — отсутствие влияния тиражей книг, хранимых в Ngrams, на вес слов. Условно, если dwarf встречается только в «Властелине колец», то оно засчитается один раз.

Другие сервисы тоже не безгрешны. Например, Google Flu Trends, предсказатель вспышек гриппа, полностью упустил свиной грипп (swine flu), однако ассоциирует с гриппом слово «снег» (snow).

Таким образом, следующий вызов журналистам — способность не только анализировать и интерпретировать данные, но и оценить их валидность и целостность.

Как 7 СМИ используют Slack, чтобы работать лучше и по-новому

Главная страница Slack.com

Лора Хэзард Оуэн опубликовала на Nieman Lab пространную статью о способах применения Slack редакциями самых разных изданий. Мы приводим эту статью в переводе Ольги Добровидовой.

NB: эпидемия Slack распространяется и в рунете —  Meduza и Look at Me в свое время тоже признались в любви к мессенджеру.

Читать далее «Как 7 СМИ используют Slack, чтобы работать лучше и по-новому»

Семь способов подачи данных

Марта Канг (Martha Kang) из компании Tableau Software, специализирующейся на визуализации данных, некоторое время назад опубликовала колонку на MediaShift. В тексте говорится о том, как сделать материалы с большими объемами данных более привлекательными для читателей.

Читать далее «Семь способов подачи данных»

О результатах четвертого «хакатона» Vox Media

Vox Media уже четыре года проводит «хакерские марафоны» (hackathons), цель которых — создание новых инструментов, полезных для компании. В 2015-м такое мероприятие стартовало 10 июня. В нем приняли участие 78 сотрудников Vox Media — все они, включая тех, кто работает на удаленке, собрались в Филадельфии. В ходе марафона были представлены 24 проекта. Nieman Journalism Lab рассказывает о самых интересных их них.

Читать далее «О результатах четвертого «хакатона» Vox Media»

Atlas — платформа для работы с графиками от Quartz

Издание Quartz запустило новую платформу Atlas, предназначенную для работы с графиками. Как говорится в официальном заявлении, Atlas стал «большим шагом вперед» для Quartz. Платформа «углубит» материалы издания, облегчит доступ читателей к цифровым данным и добавит элемент визуализации в публикуемые статьи.

Читать далее «Atlas — платформа для работы с графиками от Quartz»