ОБ АВТОРЕ

Навучалася на філфаку БДУ, аднак з 2010 года спыніла навучанне.

Некалькі год працавала ў якасці тэлекарэспандэнта інфармацыйнай рэдакцыі тэлеканала Белсат, у тым ліку як уласны карэспандэнт у Расіі.

Журналіст-фрылансер. Зараз працуе ў сферы ІТ.

Цікавіцца сферай дата-журналістыкі.

Вы здесь

Вадим Макаренко: Дата-журналистика перестанет носить кастовый характер

Интервью

В конце января в Минске  в рамках "Пресс-клуб Беларусь" состоялся мастер-класс, посвященный работе с данными в СМИ. Тренер - Вадим Макаренко работает экономическим обозревателем газеты Gazeta Wyborcza. После учебы в Оксфорде он посвятил себя дата-журналистике и основал первый в Польше ресурс, основанный исключительно на работе с данными - biqdata.pl

Мediakritika.by поговорила с коллегой о том, можно ли сегодня заработать на контенте, как заставить данные говорить и почяему журналистам надо перестать бояться Excel.

Данные как эксклюзив

Во время работы над исследованием в Оксфорде я встретился с Саймоном Роджерсом (Simon Rogers) из The Guardian, автором дата-блог в то время. Я был их давним читателем, и мне казалось, что там сидит целый штаб людей, оказалось, все делается на Open Source, а конкретно в одной программе Datawrapper, которую они доработали под себя. Я подумал, что тоже мог бы этим заняться.

По возвращении в Варшаву я представил руководству проект. По началу энтузиазма это не вызвало - новый проект, затраты, управление человеческими ресурсами, начальство видело меня в другой роли. Но в феврале 2014 года мы ввели paywall (в Польше действует система Piano, предусматривающая метрический paywall  - прим. А.Р.) и тут мой проект пригодился.

Наша редакция – 4 человека. Я, как журналист и издатель, график-аналитик, журналист-аналитик и программист. Сейчас мы набираем внештатных сотрудников, которые занимаются анализом – людей, которые умеют считать, не важно, пишут ли они, это мы сделаем сами.

 

Данные интересны узкой аудитории

До первого миллиона уникальных пользователей дата-блог на The Guardian шел три года. Глобальный англоязычный ресурс. Бесплатный! Это показывает насколько мала аудитория.

Если вы следите за такими ресурсами как Quartz, Vox, Business Insider, могли заметить, что там дата-материалы не сконцентрированы с каком-то специальном отделе. Ресурсы digital native не скучивают данные в одном месте. У Huffingtonpost есть отдельный ресурс, посвященный данным. Там путь таков: они делают тематический проект, скажем, чемпионат мира по футболу, держат его на главной пока он дает трафик, затем перемещают в спорт, после этого - в отдельный резервуар с дата-проектами. Это резонно – сбор подобной библиотеки. Huffingtonpost – сайт для широкой аудитории и он бесплатен, туда идут не за данными, но если кто-то интересуется, его перенаправят в этот резервуар. Так же, например, делает и TUT.BY - у них есть тег Инфографика. Это подходит для порталов, которые рассчитаны на большой траффик.

Когда мы ввели paywall, нужно было подчеркнуть для читателя, который купил подписку, что мы делаем для него эксклюзивный материал. Поэтому мы сделали Biqdata отдельным проектом и частью пакета платной подписки wyborcza.pl. Но если бы я управлял редакцией на открытом ресурсе, живущем с траффика, скорее всего я не делал бы отдельный бренд, максимум выделил рубрику.

 

Открытые данные и монетизация

Большинство наших материалов основано на публично доступных данных, мы не имеем возможности покупать данные. И тут отдельная задача — как сделать так, чтобы читатель за paywall получил нечто, чего он не найдет в других местах. Выходом становятся разного рода партнерства. По согласованию мы берем часть данных музыкального сервиса Spotify, мы разговариваем с такими кампаниями как McDonalds, Twitter. Endomondo https://www.endomondo.com/ открыла АРІ — туда, например, мы ходим, если хотим найти данные о физической активности поляков. У Facebook не так просто взять что-то, не все так открыто, как кажется.

В основном мы стараемся брать от кампаний, которые занимаются data mining (глубинный анализ данных - прим. А.Р.). В Польше есть кампания Data Transparency, которая занимается судебным реестром, — сканируют, упрорядочивают, сопоставляют его с другими данными, например, данными о датациях Евросоюза. Таким образом можно увидеть сколько и какие предприятия получили датаций. Но это их платный продукт, я задаю им другие вопросы. Мы делали совместный проект о том, сколько политики провели изменений на предприятиях, подконтрольных государству. Я с ними подписал соглашение об эксклюзивности. Данные мы не купили, но сделали материал, в котором сослались на них, дали хорошее место на главной странице бумажной версии газеты Wyborcza. И мы всегда даем на них ссылку в материалах, в которых используем их данные.

Платный контент должен быть уникальным, но пока у нас нет денег на то, чтобы покупать данные. С другой стороны пока мы очень в удобной ситуации. Мы часть цифрового пула wyborcza.pl и  наш доход растворяется в доходах всего пула, у нас общие CPI (cost per impression – стоимость за 1 показ – А.Р.) и для меня это хорошо. Как самостоятельный проект мы не были бы сейчас в плюсе.

Монетизация контента – очень сложная тема в Польше. Мы уже несколько месяцев занимаемся коммерческим моделированием нашего сайта и продажа контента будет отнюдь не самый большой его доход. Начальство, конечно, не слишком радумется, но я их понимаю, когда я занимался изучением рынка сам понимал, что для того, чтобы производить контент скоро придется идти уголь добывать.

 

Выбор темы часто определяют данные

Начиная работать над материалом, я оцениваю ситуацию. Во-первых, нужно представить себе, в каком контексте мы работаем – новостном или аналитическом. Новостная журналистика данных есть, но пока это сложно, потому как либо материала недостаточно, либо его нужно очень долго собирать. Когда мы знаем, что реально сделать материал, нужно сделать проверить, где данные лежат, доступны ли, можно ли на их основании делать какие-то выводы. Очень легко закопаться, особенно, если мы работаем на больших данных, пока мы будем разбираться, время уйдет и никому уже будет неважно.

Очень часто данные сложно получить – таково состояние публичной администрации в Польше. Например, данные о том, сколько получили организации коллективного управления авторскими правами от производителей электронных проигрывателей – артисты регулярно жалуются на то, что не получают авторских выплат. Мы запросили их в министерстве культуры, нам отказали, мы написали жалобу. По закону у них две недели, ответ пришел месяц спустя. Или данные в принципе отсутствуют, например, спортивная статистика. На Западе спорт – один из основных источников цифр, считают все. В Польше нет, а статистика по американскому бейсболу мало кого интересует. В итоге на сайте экономики больше, чем остального.

 

Не закопаться

Вот у нас есть набор данных. Какие вопросы к этим данным может быть у читателя? Будет ли это интересно читателю? Локальный это интерес или общенациональный? Нужно быть внимательным к доходчивости визуализации. Читателя нельзя слишком нагружать, потому что он просто уходит. Отдельный вопрос касается уникальности контента. Если сайт специализированный, то он становится особенно актуальным — сможем ли мы из этих данных вытрясти что-то, чего никто раньше не делал?

Есть масса ситуаций, когда журналист просто не справляется с данными. Например, Белстат дает статистику задолженности предприятий по зарплатам. Это наверно единственный статофис в мире, который дает такие вещи. Я решил проверить, что с этим делают журналисты. В материалах, которые я нашел, давался красивый лид, несколько предложений текста и длинный список предприятий. Что мне как читателю скажет ЧУП Агропромпер? Если почитать об этих предприятиях, можно заметить два тренда: где-то не хватило денег на программы развития сельского хозяйства. Другая особенность, которая бросается в глаза, — больше всего среди должников предприятий, которые работают с Россией и Украиной. Сюда необходимо было бы подключить экономических журналистов, они могут знать какие-то истории об этих предприятиях.

Без традиционной журналистики журналистика данных — всего лишь цифры. Мой совет любому редактору — если уж вы решили создавать отдел дата, то он должен сидеть в ньюсруме и обязательно общаться с коллегами, ходить на планерки, знать, над чем работают коллеги. Иначе дата-журналистика становится видом псевдо-искусства, когда журналисты делают только то, что им самим интересно, а так быть не должно.

 

Сбор данных от читателей

Читателя нельзя чрезмерно нагрузить вопросами, он не будет заполнять отдельных анкет. К тому же нужно уметь работать с такими данными. Как правило, даже если мы подаем шаблон, читатель не вписывается в него. В итоге мы имеем набор данных, которые нужно очистить, а это тоже редкая компетенция. В Excel это непросто сделать, нужно использовать Openrefine, это очень тяжелая программа. Я прошу такие вещи делать коллегу-программиста. Как правило, краудсорсинговые проекты — длинные. Читатель дает данные тогда, когда ему удобно. Но я очень положительно отношусь к таким вещам, иногда читатели режут правду-матку. Мы работаем с такими вещами, собираем данные вне paywall, публикуем либо частично открыто, либо за пэйволом.

Есть разные методы работы — можно собирать данные у читателя, а можно попросить у читателя помочь обработать данные. Нужно постоянно считаться с тем, что люди могут иметь самые разные цели, давая вам информацию. Вопросы нужны закрытые, точные, в идеале не больше трехне слишком подробные. Нельзя просить, например, точный адрес, максимум — почтовый индекс. Единственное исключение — когда мы работаем по стихийному бедствию или другой подобной ситуации. Это тогда касается в большей степени населенных пунктов, а не личных данных. Пример: мы хотели сделать проект о самых редких именах у Польше, дали запрос в МВД. Они отказали: а что если это единственная Бромхильда на все воеводство?

 

Дата-журналистика снова растворится в других жанрах

Дата-журналистика - формат, когда человек заходит на сайт, бегло просматривает материал и ему все понятно, но при желании можно углубиться. Аналитическая составляющая должна быть на уровне, если читатель получает то, что он уже знает, ресурс был потрачен зря. Пока дата-журналистика является отдельной отраслью, но вскоре, мне кажется, она снова раствориться в других жанрах, станет частью экономической, частью культурной журналистики и т.д. Просто потому что журналистов, которые умеют работать с данными, становится все больше и больше, как и инструментов. 

 

Mediakritika.by благорадит за организацию интервью "Пресс-клуб Беларусь" и коллег из TUT.by

Фото "Пресс-клуб Беларусь"

Оценить материал:
Голосов еще нет
распечатать Обсудить в: