Собрать данные – одно. Представить их в понятном читателю виде – совершенно другое. Структурированная информация гораздо лучше доходит, будучи выраженной графически. В мире, который руководствуется данными, навык графического представления информации почти также незаменим, как и навык хорошего письма1791.
Описание визуализации данных как дисциплины выходит далеко за тематические границы этой книги. Достаточно сказать, что анализ данных и их представление идут в журналистике рука об руку и образуют целый куст отдельных специализаций:
• Навык графического дизайна в совокупности с началами статистики и здравым смыслом дает нам создателя инфографики;
• Навык программирования вместе со способностью к вебдизайну и базовым умением строить запросы к базам данных – расследователя и аналитика, неизбежно использующего для вывода ответа в том числе графические построения;
• Понимание того, как инфографика или основанная на данных иллюстрация может изменить отношение читателя к герою, отличает высокооплачиваемого журналиста от линейного автора.
К сожалению, визуализация данных все еще сложна для одиночного освоения, а та ее часть, которая связана непосредственно с диаграммами, шкалами и графиками содержит множество мелочей, до которых не всякому человеку дано дойти своим умом.
Важно понимать, что любая информация о визуализации данных не пропадает втуне. Даже не выучив языки Python и R, не освоив Excel и Power BI, не прочтя всей нужной литературы (Бринтон[13], Вонг[79], Тафти[75–77]) вы при определенном усердии можете понять основные принципы визуализации.
Это пойдет вашим заметкам на пользу: в обрабатываемых данных станет видна структура. Вы поймете, какие и где данные принципиально можно найти. Сможете дать аналитикам и специалистам по инфографике такую задачу, которая усилит повествование.
Вот несколько очень коротких советов из разных областей, связанных с визуализацией данных. Они не заменят учебник, но позволят не совершать совсем грубых ошибок.
7.3.1 Графики и диаграммы
• Указывайте показатели на осях, иначе читатель не поймет вашу идею;
• Избегайте излишне крутых подъемов и спадов за счет начала оси не с нуля. Это вводит в заблуждение;
• Никогда не помещайте на график более трех показателей – он превратится в спагетти;
• Цветовое решение должно учитывать наличие у пользователя черно-белого принтера. Попробуйте сконвертировать ваше изображение в градации серого – если можно разобрать, что нарисовано, вы все делаете правильно;
• Обязательно проставляйте источник данных. Это не только вежливо по отношению к читателю, но и защищает вас в случае, если этот набор данных неверен;
• Если видите резкие перепады в показателях, объясните их себе и читателю. Возможно, вы ошиблись или изменилась методология подсчета;
• Отталкивайтесь от истории. Одинаковые цифры могут рассказать разные истории. Для банка, рассказывающего о росте объемов выданных потребительских кредитов, история может быть хорошей. История роста закредитованности существующих клиентов может оказаться совсем иной – и все на одном и том же наборе данных.
• Показывайте точку или показатель, с которыми надо сравнивать данные. Давайте контекст, отмечайте его на графике
• Правильно выбирайте вид диаграммы. Столбчатая диаграмма хороша, если надо сравнить несколько показателей. Круговая хорошо показывает долю от целого.
• Обращайте особое внимание на типографику. Плохо выбранные шрифты способны испортить все впечатление от визуализации. Не используйте одновременно полужирное и курсивное начертания. Избегайте переносов. НЕ ПИШИТЕ ПРОПИСНЫМИ. Не стоит разреживать шрифт сверх необходимого. Всегда помните: у текста в диаграмме поддерживающая, а не центральная роль.
• Не используйте разные цвета для одного и того же показателя. Можно выделить нужную точку, столбец, сегмент оттенком того же цвета. Вообще желательно работать в рамках одного базового цвета, используя другие цвета лишь для важных задач.
• Не надо красным помечать хорошие показатели, а зеленым плохие.
7.3.2 Веб-аналитика и просмотр баз данных
Раньше изучение архивов, баз данных, просмотр бесконечных рейтингов, аналитических записок и статистических таблиц было уделом расследователей и сотрудников деловых СМИ.
Сейчас почти везде в ньюсрумах вводятся цифровые показатели производительности, основанные на тех же принципах, но предназначенные для всех[31]. Поэтому базовое знакомство с аналитикой, основами статистики и приемами быстрого выхватывания важных цифр из таблиц становится необходимым – от него зависит ваша карьера.
• Прежде всего выучите накрепко определения и никогда не путайте уникальных пользователей, визиты/сессии/сеансы, а также просмотры страниц (эту разницу мы разбираем в главе о метриках).
• Если вы пишете о рекламном рынке или оцениваете возможный заработок компании, работающей по рекламной модели, не путайте просмотры страниц и число показов рекламных объявлений.
• Поймите разницу между измерением счетчиком, панелью и гибридным методом. В первом случае вы часто получаете не реальных людей, а нечто среднее между этим показателем и числом зашедших на сайт браузеров[69]. Во втором – счетчик носят с собою сами пользователи, а так как их мало, то измерителю приходится экстраполировать данные, жертвуя точностью[70]. В третьем – перепроверяют панельные измерения с помощью счетчиков и телефонных или реальных опросов. Последний способ кажется самым лучшим, его использует компания Mediascope (бывшая TNS), но у него свои недостатки – например, постоянные изменения в методике, следующие за структурой рынка.
• Не забывайте, что базы данных могут обновляться реже, чем ситуация в реальной жизни.
• Однофамильцы и компании с одинаковым названием встречаются чаще, чем нам кажется.
• Очень часто доступ к архивам ограничен (например, нельзя посмотреть, куда летал самолет пять лет назад, но можно – куда на прошлой неделе). Сохраняйте найденное, отслеживайте регулярно ваших героев.
• Используйте средства мониторинга изменений на сайтах. Человеку непросто постоянно делать то, с чем хорошо справляется робот.
• Пройдите базовый курс по бухгалтерской отчетности и финансам. Не одна новость окончилась пшиком из-за того,
что автор перепутал выручку и прибыль, или же валовую прибыль с чистой.
Часто данные существуют только в виде выгрузки, и вам придется их просеивать. Пройдите базовые курсы по обращению с данными. Начните со списка материалов для обучения сотрудников The New York Times[48].
Раз в неделю пересматривайте и переписывайте заново список ключевых слов. Рядом с каждым должно стоять число от 0 до 100 – уровень ваших знаний. Начните с этих слов и расширяйте список по мере необходимости: Excel, Power В1ЯаЫеаи, SQL, CSV/TSV. Если узнали что-то новое, увеличивайте оценку на один балл. Это не сделает вас профессионалом, но позволит разобраться в особенностях технологий анализа данных. Особое внимание обратите на SQL – даже базовые знания позволят вам позднее гораздо увереннее работать с любыми базами данных.
7.3.3 Программирование
Журналистам все чаще приходится программировать. Распространено мнение, что это сложный для освоения навык. Это неправда – просто сложность программирования зависит не только от знания, но и от первоначальных решений.
Здесь я перечисляю несколько простых правил, которые облегчат написание программ вне зависимости от того, какой язык программирования вы используете. Мои советы относятся в первую очередь к ситуации, когда журналисту надо что-то быстро проверить или подсчитать, а не спланировать, выпустить и поддерживать продукт.
• Выучите Markdown и HTML прежде, чем обратитесь к программированию.
• Ознакомьтесь с концепцией грамотного программирования[2]. Ее не обязательно внедрять в свою жизнь, но следует понимать две вещи: во-первых, программу иногда лучше написать после документации; во-вторых, документацию надо писать так, чтобы облегчить написание и модификацию программ.
• С самого начала постарайтесь использовать как можно меньше низкоуровневых решений. Если для решения вашей задачи есть распространенная библиотека, используйте ее.
• Постарайтесь рассматривать вашу программу как часть истории. Попробуйте вместо работы над скриптом в редакторе набросать прототип в интерактивном блокноте (для Python используйте Jupyter, для R – R Notebook). В текстовой части блокнота разместите свою заметку.
• Относитесь к себе так, будто вы ничего не вспомните уже через месяц. Давайте переменным и функциям понятные имена, оставляйте комментарии. Пишите свою программу как чужую. Если вам придется к ней возвращаться, чтобы поправить или позаимствовать удачное решение, вы сэкономите себе кучу нервов и времени.
• Не пытайтесь уследить за всеми новыми языками или задействовать все чудесные библиотеки. Выберите что-то надежное и придерживайтесь этой технологии. Думайте не о том, как программировать, а о том, как программирование встроено в вашу ежедневную работу.
8. Работа с фактами
8.1 Fake news
Фальшивые новости – чрезвычайно многогранное понятие, сильно расширившееся по сравнению со своим изначальным значением – «массово распространяемая ложь». Но, конечно, fake news не всегда ложь, иногда это просто сообщение, которое не является новостью.
Новость по своей природе ценна для общества. Именно ценные для общества актуальные сообщения позволяют гражданам делать выводы, принимать правильные решения, развивать экономику, культуру и выстраивать политические институты.
Fake news – все то, что не является новостью. В самом широком смысле это сообщение со сниженной ценностью для общества.
Но видов таких сообщений много! Пассивно-агрессивная фраза учительницы «а голову ты дома не забыл?» тоже в каком-то смысле fake news – обращается к массовой аудитории класса, реагирует на информационный повод (забытый портфель), вызывает эмоции и абсолютно бессмысленна.
Попробуем классифицировать fake news, разделив их сначала на три условные группы: «хорошие», «нейтральные» и «плохие».
8.1.1 «Хорошие» фейки
«Хорошие» fake news может написать любой человек.
Непреднамеренная ошибка. Журналист может заблуждаться или быть введен в заблуждение информатором. Мы живем в мире, где нельзя проверить все факты, как ни старайся. От этого заметка более правдивой не станет, но и называть ее на этом основании fake news язык не поворачивается.
Сатира. Юмористические и сатирические проекты – фактически те же перформансы идеалистов, пытающиеся сделать из этого актуальное и иногда злое медиа. Информационное агентство «Интерсакс»[71], например, публикует новости вроде «В Госдуме предложили платить зарплату мужчинам с 35 лет, женщинам с 30-ти» и «Россия вступит в НАТО, а США станет членом ЕврАзЭС».
Польза от сатиры очевидна – с помощью художественного приема доведения до абсурда она заставляет людей думать, прогнозировать развитие событий, по-новому взглянуть на расстановку сил в информационном поле. И, конечно, сатирические сайты вроде популярного The Onion[72] – очевидные фейкоделы, за что их недолюбливают платформы дистрибуции вроде Facebook.
Тенденциозная подборка. На любом журфаке учат правильному изложению фактов, представлению мнений всех сторон, взвешенной подаче. Студентов просят избегать тенденциозных подборок, зная, что это одна из самых распространенных ошибок и, конечно, показатель лени журналиста.
Но, как художественный, публицистический прием однобокие подборки трудно переоценить и легко поставить на пользу обществу. Когда необходимо привлечь внимание общества к важной проблеме, журналист может наплевать на взвешенный подход и оказаться прав.
Валерий Панюшкин, спасший десятки, если не сотни детей своими колонками, Андрей Колесников, пишущий о Путине словами и мыслями Путина, научные журналисты, которые не спрашивают мнения лжеученых и богословов о научных открытиях – все это примеры того, как тенденциозный отбор может оказаться полезен конечному потребителю.
8.1.2 Нейтральные фейки
«Нейтральные» fake news не ставят своей целью долгосрочную манипуляцию общественным сознанием.
Ошибки. Технические, смысловые, фактические ошибки, которые могли быть предотвращены, переводят заметку в разряд fake news. Это касается как искажения фактов, так и сообщений, в которых «все понятно, чего ты придираешься». Причина такой строгости проста: подобные заметки не соответствуют требованиям качеству, предъявляемым обществом к сообщениям о важных событиях.
Допущенная по невежеству или невнимательности ошибка способна породить множество невероятных слухов и долго жить в народной памяти. К счастью, крупные ошибки заставляют редакции реформировать свои процессы вычитки, нанимать корректора или улучшать схему выпуска.
Инфошум. Сообщения с нулевой информационной ценностью, прикидывающиеся журналистскими материалами, тратят невосполнимое время жизни читателя или зрителя.
Особого вреда от инфошума нет: каждый любит проглядывать бесконечные заголовки вроде «Панда в бассейне покорила интернет»[73] или «Собака месяц ждала хозяев у сгоревшего в калифорнийском пожаре дома. И дождалась!»[74]. Но нет и пользы. Это аналог фастфуда, прикидывающегося здоровой пищей.
Называть инфошум новостями не следует, так как выводов – даже минимальных – читатель из них сделать не сможет.
Отдельный вид информационного шума – политический. Когда депутат или группа заинтересованных лиц хотят, чтобы о них вспомнили, они вносят сравнительно безумный законопроект и, посеяв подобным образом ветер, пожинают бурю в СМИ. Это уже более серьезное преступление против психического здоровья граждан, ведь ни их, ни журналистов никто не предупреждает о том, что процедура политического института запущена не всерьез. Такие фейки относятся на грани манипуляции общественным мнением.
Обман/манипуляция. Самый плохой из нейтральных форматов, в использовании которого обычно виноват журналист, слишком некритично отнесшийся к ньюсмейкеру или слишком легко – к фактуре. На эту тему есть прекрасный вебкомикс:
1. Ученый заявляет, что в у лабораторных крыс удалось разрушить 10 % раковых клеток, а журналист пишет «Ученые вылечили рак»
2. Ученый говорит, что рак не вылечили, но продвинулись к лечению в будущем. Журналист пишет «Ученые путешествуют во времени»
3. Ученый посылает журналиста подальше. Газета выходит с заголовком «Ученый изнасиловал журналиста».
В большинстве случаев за манипулятивной новостью с привлекающим как можно больше кликов все-таки есть значимый информационный повод. Просто читателю придется быть или экспертом в области, или проделать массу работы, которую он делать не должен.
Основная опасность здесь даже не в искажении данных, а в том, что постоянная манипуляция заголовками и изложением создает у читателей ощущение, будто окружающий мир прост, тот же рак можно вылечить содой, а ракетостроением может заниматься любой фанат Илона Маска.
8.1.3 Самые плохие фейки
Простая ложь. Ложь ради лжи в fake news почти не встречается, если только ньюсмейкер не патологический врун[75].
Публикация ложных сообщений без особой на то причины – абсурд. Этим могут заниматься художники и идеалисты, а также ученые, которым интересно, как далеко разойдется новость о возвращении Плутону статуса планеты.
Естественно, ложь обычно преследует какие-то цели, обычно деловые или политические. Ложь бывает выгодна политтехнологам, специалистам по всем видам отношений – общественным, корпоративным, с госорганами и инвесторами.
Всему этому противостоит журналист, и только в самом простом случае он может понять, что его обманывают, используя стандартный арсенал фактчекера – проверку фактов, цифр, цитат. Считается, что надо о каждом факте спрашивать себя: «действительно ли это имело место?»
На деле основные вопросы звучат иначе:
• Почему мой источник решил вынести это в публичное поле?
• Кому выгодна публикация?
• Почему все это происходит именно сейчас?
Коммерческие фейки. Ложные сообщения, в которых не задействованы СМИ как таковые. Этот вид фейков особенно распространен на Западе, где системы автоматического размещения рекламы позволяют зарабатывать даже на сравнительно небольшом трафике. В результате создаются тысячи страниц, например, содержащих новости о звездах и упоминание маленьких городков. Затем поисковый и социальный трафик из локальных сообществ приносит рекламные деньги; публикуется свежий фейк, и цикл повторяется.
В России коммерческие фейки распространяются через трафикообменные сети и через очень дешевые показы рекламы (выкуп остаточного инвентаря на сайтах). Воскресают мертвые, умирают и разбиваются живые, смертельно (простудой) заболевают певцы. Схема точно такая же, только зачастую некритично мыслящих граждан не монетизируют рекламой, а перепродают сайтам, где нужно создать впечатление полезного трафика.
Пропагандистские фейки. Это наиболее отвратительный вид фейков, так как он осознанно направлен против основной миссии СМИ – объективного информирования избирателей о происходящем в стране и мире.
Нет ничего гаже, чем искажать информацию в угоду политическому заказу, формировать повестку по темнику, спущенному сверху, блокировать неугодные поводы, которые, как вы знаете, важны для общества.
Именно смычка журналистов и властей на ниве оголтелой пропаганды уничтожила на корню российскую районную прессу, которая гораздо чаще пишет статьи для одного читателя, а не для района.