Журналісты ўжо прызналіся: паспець за блогерамі немагчыма. Але спосаб застацца канкурэнтаздольнымі ёсць: зарыентаваць аўдыторыю ў плыні інфармацыі. І называецца гэта журналістыка дадзеных (data driven journalism).
Як хутка без дапамогі Google вы назавеце, колькасць знакаў у лічбе 295 эксабайт? Між тым менавіта такой вялічынёй вызначаецца запас сумарных дадзеных чалавецтва [3] за перыяд 1986-2007 (ацэнка Універсітэта Паўднёвай Каліфоніі). Да 2020 абяцаюць 40 000 экcабайт. Каб зарыентавацца ў гэтым масіве, неабходнасць дапамогі “спецыяльна абучаных людзей” відавочная.
Натуральна, не ўся інфармацыя адкрытая, не ўся карысная канкрэтнай чытальніцкай аўдыторыі. Але практыка паказвае самае “страшнае” не тое, што інфармацыя з’яўляецца, а тое, што яна з’яўляецца раптоўна.
Дадзеныя як выклік
Калі ўзнікла Wikileaks, на журналістаў абрынуўся неверагодна вялікі ком з дадзеных. Рэдакцыя The Guardian, якая тады найбольш актыўна занялася іх разборам і перапрацоўкай, цяпер з’яўляецца адным з лідэраў дата-журналістыкі.
Інфаграфіка, якая паказвае гісторыі вязняў Гуантанама [4]
Украінскіх калег зараз “накрыла” хваляй інфармацыі з захопленых рэвалюцыянерамі архіваў Януковіча. 200 тэчак дакументаў ператвараюцца ў архіў Януковічлікс [5], які будзе дасяжны журналістам усяго свету, а пакуль робіцца рухавіком развіцця ўкраінскай дата-журналістыкі.
Рабіць прагнозы, ці варта беларускім журналістам чакаць падобнага выкліку ад гісторыі, задача не гэтага артыкула. Але і ў нас ёсць над чым працаваць.
Беларускія чыноўнікі час ад часу пачынаюць казаць пра неабходнасць стварэння электроннага ўраду, заканадаўства таксама так ці інакш рухаецца ў бок большай адкрытасці. У Расіі ўжо дзейнічае нацыянальны партал адкрытых дадзеных [7] і існуе заканадаўства, якое ўводзіць панятак адкрытых дадзеных у чыноўніцкі словазварот. Не без хібаў, але ж. Праз інстытуцыі любога з саюзаў, якія заключаныя паміж Мінскам і Масквой, гэтае пачынанне можа быць імпартаванае сюды. Тым больш, што такі партал ужо ствараецца на валантэрскіх пачатках, і яго распрацоўшчыкам (пра іх будзе ў наступным артыкуле) марыцца, што ў выніку ён займее дамен gov.by.
Знайсці чалавека ў лічбах
Журналісты заўсёды карысталіся статыстыкай, дадзенымі. Аднак па большай частцы графікі, табліцы і схемы былі ілюстрацыяй да гісторыі/тэзы. Журналістыка дадзеных самі лічбы робіць гісторыяй. Крыніцай інфармацыйных нагодаў, падмуркам расследвання, экспертам.
І тут мой апошні аргумент “за”. У нашых шыротах давер да медыяў нельга назваць высокім [8]. Хаця праблема насамрэч сусветная. Аўтары Дапаможніка па дата-журналістыцы (Data Journalism Handbook [9], ёсць у рускамоўнай версіі, падрыхтаванай РИА) адзначаюць, што дадзеныя даюць СМІ шанец вярнуць сабе аўтарытэт. Лічбам заўжды вераць больш, чым меркаванням і прагнозам. Якасная інфаграфіка можа падмацаваць тэзісы артыкула лепш за каментар эксперта. Асабліва, калі яна інтэрактыўная і чытач можа сам “пакруціць” паказчыкі.
Такім чынам мы плаўна пераходзім да таго, як фармулююцца новыя прынцыпы працы з дадзенымі. Брытанскі журналіст Пауль Брэдшоў [10] выклаў іх у знаёмай форме перагорнутай пераміды: сабраць, ачысціць, знайсці кантэкст, скамбінаваць, данесці да чытача.
Збор дадзеных. Апроч традыцыйных крыніц, тут адкрываецца бясконцая крыніца інтэрактыву з чытачамі і магчымасць замуціць свой Белстат с тайм-лайнам і схемамі. Палічыць, які насамрэч сярэдні заробак па краіне, які сярэдні чэк у крамах розных рэгіёнаў, хуткасць абслугоўвання ў паліклініках, колькасць лядовых палацаў, якія выкарыстоўваюцца пад кірмашы, дзе школьнікаў часцей за ўсё пасылаюць на бульбу і г.д.
Апроч таго цяпер з’явілася вялізная колькасць тэхнічных прымочак. Пачынаючы ад платформаў [11], якія дазваляюць адсочваць аднаўленні на сайтах і скончваючы апрацоўкай дакументаў шляхам праграмавання. Гэта тэма асобнага артулу, а пакуль, як раіць адзін з буйных расійскіх адмыслоўцаў па працы з дадзенымі Іван Бегцін, - вучыце Html [12].
Ачыстка. Запавет пра 3 крыніцы інфармацыі для пацверджання ніхто не адмяняў. Але і праўдзівыя дадзеныя могуць быць у непрыдатнымі для выкарыстання праграмамі. Таму, зноўку ж, вучыце Html. І працу з Excell.
Магія (камбінаванне). Зноўку спасылаючыся на Івана Бегціна, лепш мець некалькі невялікіх, але звязаных набораў дадзеных (датасэтаў), чым адзін вялікі. Бо тут пачынаецца магія.
Возьмем дадзеныя МНС (для мінскіх журналістаў ёсць адмысловы рэсурс у дапамогу [13]) па колькасці пажараў, адшукаем даты пабудовы дамоў (гэты датасэт рыхтуецца і ў хуткім часе стане дасяжным), накладаем на межы ЖЭСаў (гэты датасэт валанцёры фармавалі ручкамі, вам жа трэба толькі ўзяць гатовае), аздабляем гэта ў інтэрактыўную мапу і вуаля - чытач можа ўсталёваць залежнасці, выбіраць у якім раёне лепш набыць кватэру, прыйсці з вашай інфаграфікай на прыём да дэпутата ці адаслаць яе свайму кіраўніку ЖЭСа. Можна спалучыць даты пабудовы дамоў з колькасць школак у раёнах, колькасць адвольных узгаранняў з колькасцю дамоў са смеццеправодамі.
Данясенне да чытача. Дадзеныя, апрацаваныя і пададзеныя ў зручным для чытача выглядзе, раскрываюць кантэкст. Інструменты дата-журналістыкі дазваляюць наблізіць лічбы да канкрэтнага чалавека. Класічны прыклад - бюджэтны калькулятар, які раскладае перад чытачом, як размяркоўваюцца яго падаткі.
Бюджэтны калькулятар ад РИА-новости [14]
Ніводны беларускі рэсурс не мае асобнага аддзела, які б займаўся выключна дадзенымі. Tut.by мае Вадзіма Шмыгава, “Комсомольская правда" в Беларуси” Віктара Малішэўскага. Каманда New York Times, якая займаецца працай з дадзенымі, складае 35 чалавек. Былы адзел інфаграфікі Риа-Новости (цяпер перайшоў да «Афиша-Рамблер-SUP») налічваў 37 чалавек. Але па вялікім рахунку колькасць штату ўплывае ў першую чаргу на хуткасць. One man army таксама мае ўсе шанцы сарваць галоўную ўзнагароў дата-журналістаў [15]. Свабодна дасяжнага інструментара ў сусветным павуцінні хапае, але гэта тэма іншага артыкула. А пакуль вучыце Html. І да. 295 эксабайт - гэта 21 знакавая лічба.