Читаем Пособие по журналистике данных (ЛП) полностью

Мне нравится работа, которую каждый день выполняют небольшие независимые организации, такие как ProPublica или Texas Tribune, у которой есть великолепный журналист данных в лице Райана Мерфи (Ryan Murphy). Если бы меня попросили выбрать, я бы отметил Базу данных о зарплатах государственных служащих ( Government Employee Salary Database)Government Employee Salary Database), проект Texas Tribune ( Рис 6). В этом проекте собраны данные о зарплатах 660 000 государственных служащих, они сведены в базу данных, в которой пользователи могут осуществлять поиск и на основе которой могут создавать сюжеты. Можно осуществлять поиск по организации, по фамилии или по уровню зарплаты. Этот проект прост, выразителен, полон смысла и делает недоступную информацию публичной. Его легко использовать, и не менее легко автоматически генерировать сюжеты на его основе. Это великолепный пример того, почему большую часть трафика Texas Tribune набирает за счет своих страниц данных.

Саймон Роджерс, The Guardian

Полнотекстовая визуализация документов о войне в Ираке, Associated Press

Рис 7. Анализ военных отчетов (Associated Press)

Работа Джонатана Стрэя (Jonathan Stray) и Джулиан Берджесс (Julian Burgess) на основе документов о войне в Ираке ( Iraq War Logs) ) является воодушевляющим примером проникновения в текстовый анализ и визуализацию с использованием экспериментальной техники, чтобы разобраться в темах, заслуживающих пристального внимания, за счет большого набора текстовых данных ( Рис 7).

Средствами техники текстового анализа и алгоритмов Джонатан и Джулия создали метод, который позволяет демонстрировать кластеры ключевых слов, содержащихся в тысячах отчетов американских властей по Иракской войне, которые подверглись утечке благодаря WikiLeaks, в визуальной форме.

Хотя у представленных методов есть ограничения, и подход носит экспериментальный характер, он представляет собой инновационный подход. Вместо того, чтобы пытаться прочитать все файлы или просматривать записи о войне с предвзятым мнением о том, что там можно найти, вводя определенные ключевые слова и анализируя полученный на выходе результат, эта техника подсчитывает и визуализирует темы/ключевые слова, имеющие особое значение.

В условиях увеличивающихся объемов данных – как текстовых (сообщения электронной почты, отчеты), так и цифровых, оказывающихся в распоряжении общественности, поиск путей для выделения ключевых областей интересов будет становиться все более и более важным – это великолепная подобласть журналистики данных.

Синтия О'Мурчу, Financial Times

Тайны убийств

Рис 8. Тайны убийств(Scripps Howard News Service)

Одним из моих любимых примеров журналистики данных является проект «Тайны убийств»Тома Харгроува (Tom Hargrove) из Scripps Howard News Service ( Рис 8). На основе правительственных данных и запросов на получение данных из открытых источников он составил демографически детализованную базу данных из более чем 185 тысяч нераскрытых убийств, а потом сконструировал алгоритм для поиска по ней образцов, позволяющих объединять те или иные дела на основании предположений о наличии серийных убийц. В этом проекте есть все: упорный труд по сбору данных и составлению базы лучше, чем правительственная, мудрый анализ с использованием техники социальной науки, и интерактивное представление данных в режиме онлайн таким образом, чтобы читатели могли сами в этой базе работать.

Стив Дойг, Школа журналистики Уолтера Кронкайта, Университет штата Аризона

Машина текстовых сообщений (Message Machine)

Рис 9. Message Machine(ProPublica)

Мне нравится проект ProPublica под названием «Машина текстовых сообщений» ( Message Machine) и поств блоге ( Рис 9). Все это началось тогда, когда несколько пользователей твиттера выразили любопытство по поводу получения разных сообщений электронной почты во время проведения избирательной кампании Обамы. Ребята в ProPublica заметили это и попросили читателей форвардить им любые e–mail–ы, которые они получают от деятелей избирательной кампании. Представление этих данных весьма элегантно, а визуализация выгодно отличается от обычных сообщений электронной почты, которые обычно отправляешь вечерами. Этот проект классный, потому что они собрали свою собственную информацию (хотя, признаем, и небольшую по объему, но достаточную для того, чтобы рассказать историю). Но что еще более здорово, так это то, что они рассказывают историю развивающегося явления, повествуют о масштабных данных, используемых в политических кампаниях с целью целевой рассылки сообщений конкретным лицам. Это лишь первое знакомство, позволяющее попробовать на вкус то, что грядет.

Перейти на страницу:

Похожие книги

Справочник путешественника и краеведа
Справочник путешественника и краеведа

Обручев Сергей Владимирович (1891-1965 гг.) известный советский геолог и географ, член-корр. АН СССР. Высоко образованный человек - владел 10 иностранными языками. Сын академика В.А.Обручева, . будущий исследователь Азии, Сибири, Якутии, Арктики, родился в г. Иркутске, получил геологическое образование в Московском университете, закончив который в 1915 г., после недолгой работы на кафедре оказался в Геологическом комитете и был командирован для изучения геологии в Сибирь, на р. Ангара в ее среднем течении. Здесь он провел несколько полевых сезонов. Наиболее известны его экспедиции на Северо-Восток СССР. Совершил одно из значительных географических открытий в северо-восточной Азии - системы хр. Черского - водораздельной части Яно-Индигирского междуречья. На северо-востоке Якутии в Оймяконе им был установлен Полюс холода северного полушария На Среднесибирском плоскогорье - открыт один из крупнейших в мире - Тунгусский угольный бассейн. С.В. Обручев был организатором и руководителем более 40 экспедиций в неосвоенных и трудно доступных территориях России. С 1939 на протяжении более 15 лет его полевые работы были связаны с Прибайкальем и Саяно-Тувинским нагорьем. В честь С.В.Обручева названы горы на Северо-востоке страны, полуостров и мыс на Новой Земле.

Сергей Владимирович Обручев

Приключения / Природа и животные / Путешествия и география / Справочники
Религии народов современной России. Словарь
Религии народов современной России. Словарь

Словарь включает свыше 350 статей религиоведческого, этиологического, социально-психологического, этического, правового и политологического характера, отражающих с разных сторон религиозно-культурную ситуацию в Р оссии последнего десятилетия.Читатель найдет в книге обширную информацию не только о традиционных для Р оссии конфессиях (христианстве, исламе, Р±СѓРґРґРёР·ме и др.), но и о различного СЂРѕРґР° новых религиях и культах (Церковь Объединения, Общество Сознания Кришны, Церковь сайентологии и др.). Большое внимание уделено характеристике особенностей религиозной жизни каждой из наций, народностей и этнических групп, проживающих ныне на территории Р РѕСЃСЃРёР№СЃРєРѕР№ Федерации.Р

Миран Петрович Мчедлов , М. П. Мчедлов

Справочники / Прочая религиозная литература / Эзотерика / Словари и Энциклопедии / Словари
Боевое ремесло
Боевое ремесло

«Боевое ремесло» — так называется книга руководителя клуба «Щитень» Вадима Кондратьева, основателя Зареченской школы боевого фехтования. Для наших смутных времен книга своевременная.Вероятность оказаться в перестрелке астрономически меньше, чем вероятность быть забитым шайкой наркоманов или стать калекой под пьяным ножом, бутылкой или палкой.Как повысить шансы собственного выживания?Как определить тот самый момент, когда пора бить?Как именно бить?Тактика и навыки боя в самом широком спектре применяемого вооружения — от ножа, саперной лопатки и монтировки до палки, бейсбольной биты и меча.Техника Зареченской школы — это не спорт и не загадочное искусство.Это обычное боевое ремесло.

Вадим Вадимович Кондратьев , Вадим Кондратьев

Боевые искусства, спорт / Военная история / Справочники / Боевые искусства / Словари и Энциклопедии