Сегодня, извлечение смысла из больших объемов данных, в частности, неструктурированных данных, станет главной целью для ученых, работающих с данными по всему миру, неважно, работают ли они в ньюсрумах, на Уолл–Стрит или в Кремниевой долине. И самое важное, что эта цель будет реализовываться за счет растущего набора общих инструментов, неважно, используются ли они правительственными технологами, открывающими Чикаго, технологами в области здравоохранения или работниками ньюсрумов.
—
Наша жизнь – это данные
Качественная журналистика данных – сложное дело, потому что качественная журналистика – вообще сложное дело. Это означает знать, как получить данные, как понять их, и как найти сюжет. Порой выходит дохлый номер, порой заходишь в тупик, а порой просто оказывается, что нет хорошей темы. В конце концов, если бы все сводилось к тому, чтобы нажать на нужную кнопку, это была бы не журналистика. Но именно это делает ее целесообразной, и – в мире, в котором наши жизни все больше превращаются в данные – категорически необходимой для свободного и справедливого общества.
—
Способ сэкономить время
У журналистов нет времени, которое они могли бы бездарно потратить на переписывание чего–то от руки, и бездельничанье в попытке вытащить данные из PDF–файлов, поэтому некоторое знакомство с основами программирования, или знание того, где искать людей, которые могут помочь, невероятно ценно.
Один журналист из газеты «Фола де Сан–Паулу» (Folha de São Paulo) работал с местным бюджетом и позвонил мне поблагодарить за то, что мы выложили счета муниципалитета Сан–Паулу в онлайн (два дня работы одного хакера!). Он сказал, что он переписывал их от руки последние три месяца, пытаясь создать сюжет. Я также помню решение «PDF–ной проблемы» для Contras Abertas, парламентской организации, занимающейся мониторингом новостей: 15 минут и 15 строк в программе – и сделана работа, которая в противном случае занимает месяцы.
—
Неотъемлемая часть набора инструментов журналиста
Я думаю, важно подчеркнуть слово «журналистика», или репортерский аспект «журналистики данных». Дело должно быть не в том, чтобы анализировать данные или визуализировать данные ради самих данных, а в использовании этого метода как инструмента для того, чтобы подобраться ближе к правде о том, что происходит в мире. Я вижу в анализе и интерпретации данных жизненно необходимую часть современного багажа инструментов журналистики, а не отдельную дисциплину. В конечном итоге все это имеет отношение к качественной журналистике, к созданию профессиональных репортажей и рассказыванию историй самым подходящим способом.
Журналистика данных – еще один способ критически изучать мир и сдерживать власти, призывая их к ответу. В условиях, когда объемы доступной информации все увеличиваются, сейчас более чем когда–либо важно, чтобы журналисты знали о технике журналистики данных. Она должна быть инструментом, присутствующим в арсенале любого журналиста: будь то за счет изучения того, как работать с данными напрямую, или посредством сотрудничества с кем–то, кто умеет это делать.
Ее реальная сила – в том, чтобы помочь вам получить информацию, которую в противном случае было бы трудно отыскать или доказать. Хорошим примером этого является статья Стива Дойга (Steve Doig), в которой он проанализировал примеры ущерба от урагана «Эндрю». Он объединил два разных набора данных: один, показывающий уровень разрушений, причиненных ураганом, и второй, демонстрирующий скорости ветра. Это позволило ему выделить зоны, где слабые законы в области жилищного строительства и практика некачественного строительства внесли свой вклад в результаты урагана. Он завоевал Пулитцеровскую премию за эту свою статью в 1993 году, и это отличный, вдохновляющий пример того, чего можно достичь.
В идеале вы используете данные для того, чтобы точно определить и выделить секреты и провалы и всплески значений, очертить области интереса, или выделить факты, которые удивляют. В этом смысле данные могут служить исходником или источником конфиденциальной информации. Но хотя сами цифры тоже могут быть интересными, просто написать о данных недостаточно. Надо на их основе сделать репортаж, чтобы объяснить, что они значат.
—
Приспособление к изменениям в нашем информационном окружении