Ключевыми продуктами для исследования данных являются Excel, Google Docs и Fusion Tables. Команда также использовала, но в меньшей степени, базы данных MySQL и Access, и Solr для обработки бОльших массивов данных, а также пользовалась RDF и SPARQL для того, чтобы начать искать способы, которыми мы можем моделировать события с использованием технологий Linked Data. Разработчики также использовали и используют языки программирования по своему вкусу, будь то ActionScript, Python или Perl для сверки, разбора и, возможно, опровержения наборов данных, над которыми мы работаем. Perl используется также для решения некоторых издательско–публикационных задач.
Для изучения и визуализации географических данных мы используем Google, Bing Maps и Google Earth, а также сервис ArcMAP от Esri.
Для графиков мы используем приложение Adobe Suite, включая Adobe After Effects, Adobe Illustrator, Adobe Photoshop и Adobe Flash, хотя мы редко публикуем флэш–файлы сейчас на сайте, так как JavaScript, в частности, JQuery и другие библиотеки JavaScript, такие как Highcharts, Raphael и D3, все больше отвечают нашим требованиям в области визуализации данных.
—
Как работает группа подготовки новостных приложений в Chicago Tribune
Рис 16. Команда по новостным приложениям Chicago Tribune (Фото Брайана Бойера)
Команда подготовки новостных приложений в Chicago Tribune – это просто сборище радостных компьютерщиков, внедренных в ньюсрум. Мы работаем в тесном контакте с редакторами и журналистами, помогая: (1) проводить исследования и создавать информационные материалы, (2) иллюстрировать сюжеты в онлайне, и (3) создавать неувядающие, незабываемые веб–ресурсы для прекрасных людей Чикаго.
Это очень важно, что мы сидим в ньюсруме. Мы обычно находим работу посредством диалогов лицом к лицу с журналистами. Они знают, что мы с удовольствием поможем написать скрин–скрэпер для отвратительного правительственного вебсайта, разорвем в клочки пачку PDF–ов, или каким–нибудь еще способом превратим то, что еще не является данными, в нечто, что вы сможете проанализировать. Это своего рода рекламная продажа с целью привлечения покупателей в нашей команде – таким способом мы узнаем о потенциальных проектах в области работы с данными еще на этапе их начала.
В отличие от многих других команд и групп подготовки в этой области, наша команда была основана технологами, для которых заняться журналистикой означало серьезную перемену в развитии карьеры. Некоторые из нас приобрели магистерскую степень в журналистике спустя несколько лет работы программистами в бизнес–целях, а других взяли из сообщества открытого правительства.
Мы работаем в очень подвижной и динамичной манере. Чтобы убедиться в этом и гарантировать, что мы всегда в синхронизированном режиме и готовы к бою, каждое утро начинается с пятиминутной летучки. Мы часто программируем парами – два разработчика за одной клавиатурой – зачастую такой вариант оказывается более продуктивным, чем вариант «два разработчика за двумя клавиатурами». Процесс производства большинства проектов занимает не более недели, но иногда бывают и более длительные проекты, над которыми мы работаем недельными циклами, а потом показываем результаты нашей работы заинтересованным группам лиц – обычно журналистам и редакторам – каждую неделю. Как мантра произносятся слова «Терпи неудачу быстро» (Fail fast). Если ты делаешь что–то неправильно, то нужно узнать об этом как можно скорее, особенно когда ты пишешь программу, что называется, «в жесткие сроки»!
Существует огромный плюс в программировании итерационно, в жесткие сроки. Мы всегда обновляем наш набор инструментов. Каждую неделю мы выдаем в свет одно или два приложения, потом, в отличие от обычных фабрик и магазинов программного обеспечения, мы имеем возможность задвинуть его на самую дальнюю полку нашего мозгового склада и перейти к следующему проекту. Это та радость, которую мы разделяем с журналистами, каждую неделю мы узнаем что–то новое.
Все идеи относительно приложений поступают от редакторов и журналистов в ньюсруме. Это, я уверен, отличает нас от команд, занимающихся приложениями, в других ньюсрумах, которые часто рожают свои собственные идеи. Мы построили крепкие личные и профессиональные отношения в редакции, и парни знают, что когда у них есть данные, они приходят к нам.
БОльшая часть нашей работы в ньюсруме – это поддержка журналистов. Мы помогаем репортерам раскапывать данные, превращать PDF–файлы в таблицы, разрабатывать скрин–скрэповые сайты, и так далее. Это услуги, которые нам нравится предоставлять, потому что благодаря им мы раньше всех знакомимся с данными, с работой над этими данными, которая идет в редакции. Какая–то часть этой работы превращается в новостное приложение – карту, таблицу, или порой крупномасштабный сайт.