Читаем Пособие по журналистике данных (ЛП) полностью

TextWrangler отлично подходит для изучения текстовых данных в замысловатом формате и разделителями. Он также может выполнять сложный поиск и замену с распространенными выражениями. Когда мне нужны статистические методы (линейная регрессия), я использую SPSS. У него очень удобное и простое меню. Для мудреных заданий (например, массивов данных с миллионами записей, которые нуждаются в сортировке и программировании переменных трансформаций) я используют SAS.

Школа журналистики имени Уолтера Кронкайта— Стив Дойг

Мы используем Python и Django для обработки, очистки и переработки данных. PostGIS, QGIS и MapBox мы используем для создания навороченных веб–карт. R и NumPy + MatPlotLib сейчас борются за превосходство в анализе научных данных, хотя последнее время мы все чаще обращаемся к «доморощенному» инструменту, CSVKit. Практически все, что мы делаем, происходит в облаке.

Chicago Tribune— Брайан Бойер

В La Nacion мы используем: * Excel для очистки, структурирования и анализа данных; * Таблицы Google для публикации и объединения с сервисами типа Google Fusion Tables и Junar Open Data Platform; * Junar для расшаривания данных и внедрения их в статьи и блоги; * Tableau Public для интерактивной визуализации данных; * Qlikview – очень быстрый инструмент бизнес–аналитики для анализа и фильтрования больших массивов данных; * NitroPDF для конвертирования PDF в текстовые и Excel–файлы; * Google Fusion Tables для визулизации карт.

La Nacion (Аргентина)— Анхелика Перальта Рамос

Как стихийное сообщество без предубеждений относительно технических средств, мы в Transparency Hackers используем множество различных инструментов и языков программирования. У каждого из нас свой список предпочтений, и в этом разнообразии наша сила и слабость одновременно. Кто–то разрабатывает дистрибутив Linux от Transparency Hacker, который загружается где угодно и начинает вскрывать данные. Этот набор инструментов имеет несколько любопытных функций и библиотек для работы с данными (Refine, RStudio и OpenOffice Calc), о которых подкованные пользователи обычно забывают, но которые очень полезны для быстрых и мелких операций. Я также часто использую Scraperwiki, чтобы быстро смоделировать и сохранить результаты данных онлайн.

Для визуализации данных и создания схем есть много хороших инструментов. Например, очень много возможностей у Python и NumPy. Кое–кто из нашего сообщества балуется с R, но в конечном счете в большинстве проектов мы все равно используем библиотеки графиков на Javascript типа d3, Flot и RaphaelJS. Наконец, мы много экспериментировали с составлением диаграмм, и для этого нам очень интересным показался Tilemill.

Как использовать визуализацию данных для поиска взаимосвязей

Визуализация крайне важна для анализа данных. Это главная линия нападения, открывающая запутанные структуры в данных, которые нельзя получить другим способом. Мы находим то, что не ожидали найти, и ставим под вопрос то, что было ожидаемо.

— Уильям С. Кливленд: визуализация данных

Сами по себе данные, состоящие из битов и байтов в файле на жестком диске, невидимы. Чтобы увидеть данные и разобраться в них, нужно их наглядно представить. В этой главе я расскажу о более широком понятии визуализации, которая включает и чисто текстовое представление данных. Например, уже загрузка массива данных в программу создания таблиц будет визуализацией. Невидимые данные внезапно превращаются во вполне видимую картинку на экране. Вопрос не в том, нужно или нет журналистам наглядно представлять данные, а какой вид представления данных может быть наиболее наглядным в конкретном случае.

Другими словами, когда есть смысл идти дальше табличного представления? Ответ: почти всегда. Самих таблиц явно недостаточно для общего представления массива данных. И только таблицы не дают быстро определить закономерности в данных. Самый простой пример – географические закономерности, которые можно наблюдать только после визуализации данных на схеме. Есть и другие закономерности, о которых мы поговорим далее в этой главе.

Выявление взаимосвязей с помощью визуализации

Было бы опрометчиво ожидать, что инструменты для наглядного представления данных способны тут же обрушить на вас тонну готовых историй, возникших по мановению палочки из массивов данных. Нет никакого алгоритма, никакой гарантии, что вы получите сюжет. Напротив, думаю, имеет смысл искать взаимосвязи, которые руками хорошего журналиста мастерски вплетаются в статью.

Каждая новая визуализация, скорее всего, поможет увидеть взаимосвязи между данными. Какие–то взаимосвязи нам уже известны (но еще не доказаны), тогда как другие могут быть совершенно новыми и даже неожиданными. Какие–то новые взаимосвязи могут дать начало истории, в то время как другие будут просто результатом ошибки, которые наверняка обнаружатся в процессе визуализации.

Перейти на страницу:

Похожие книги

Справочник путешественника и краеведа
Справочник путешественника и краеведа

Обручев Сергей Владимирович (1891-1965 гг.) известный советский геолог и географ, член-корр. АН СССР. Высоко образованный человек - владел 10 иностранными языками. Сын академика В.А.Обручева, . будущий исследователь Азии, Сибири, Якутии, Арктики, родился в г. Иркутске, получил геологическое образование в Московском университете, закончив который в 1915 г., после недолгой работы на кафедре оказался в Геологическом комитете и был командирован для изучения геологии в Сибирь, на р. Ангара в ее среднем течении. Здесь он провел несколько полевых сезонов. Наиболее известны его экспедиции на Северо-Восток СССР. Совершил одно из значительных географических открытий в северо-восточной Азии - системы хр. Черского - водораздельной части Яно-Индигирского междуречья. На северо-востоке Якутии в Оймяконе им был установлен Полюс холода северного полушария На Среднесибирском плоскогорье - открыт один из крупнейших в мире - Тунгусский угольный бассейн. С.В. Обручев был организатором и руководителем более 40 экспедиций в неосвоенных и трудно доступных территориях России. С 1939 на протяжении более 15 лет его полевые работы были связаны с Прибайкальем и Саяно-Тувинским нагорьем. В честь С.В.Обручева названы горы на Северо-востоке страны, полуостров и мыс на Новой Земле.

Сергей Владимирович Обручев

Приключения / Природа и животные / Путешествия и география / Справочники
Религии народов современной России. Словарь
Религии народов современной России. Словарь

Словарь включает свыше 350 статей религиоведческого, этиологического, социально-психологического, этического, правового и политологического характера, отражающих с разных сторон религиозно-культурную ситуацию в Р оссии последнего десятилетия.Читатель найдет в книге обширную информацию не только о традиционных для Р оссии конфессиях (христианстве, исламе, Р±СѓРґРґРёР·ме и др.), но и о различного СЂРѕРґР° новых религиях и культах (Церковь Объединения, Общество Сознания Кришны, Церковь сайентологии и др.). Большое внимание уделено характеристике особенностей религиозной жизни каждой из наций, народностей и этнических групп, проживающих ныне на территории Р РѕСЃСЃРёР№СЃРєРѕР№ Федерации.Р

Миран Петрович Мчедлов , М. П. Мчедлов

Справочники / Прочая религиозная литература / Эзотерика / Словари и Энциклопедии / Словари
Боевое ремесло
Боевое ремесло

«Боевое ремесло» — так называется книга руководителя клуба «Щитень» Вадима Кондратьева, основателя Зареченской школы боевого фехтования. Для наших смутных времен книга своевременная.Вероятность оказаться в перестрелке астрономически меньше, чем вероятность быть забитым шайкой наркоманов или стать калекой под пьяным ножом, бутылкой или палкой.Как повысить шансы собственного выживания?Как определить тот самый момент, когда пора бить?Как именно бить?Тактика и навыки боя в самом широком спектре применяемого вооружения — от ножа, саперной лопатки и монтировки до палки, бейсбольной биты и меча.Техника Зареченской школы — это не спорт и не загадочное искусство.Это обычное боевое ремесло.

Вадим Вадимович Кондратьев , Вадим Кондратьев

Боевые искусства, спорт / Военная история / Справочники / Боевые искусства / Словари и Энциклопедии