Читаем Журнал «Компьютерра» N 9 от 06 марта 2007 года полностью

Год спустя Мартин Ваттенберг (Martin Wattenberg), математик из Беркли, разместил в Интернете графическую историю изменений имен, даваемых новорожденным. Простенькая визуализация породила волну обсуждений в блогах и традиционных изданиях. Тысячи пользователей ссылались на результаты, полученные Ваттенбергом, как на исходную точку для своих исследований, как любительских, так и профессиональных. После этого в VAL решили разработать универсальную платформу для проведения подобных обсуждений и совместить ее с новейшими программными продуктами, создаваемыми в исследовательских лабораториях IBM.


Исторические потоки


Среди других проектов визуализации данных, связанных с Web 2.0, можно отметить приложение HistoryFlow, над которым раньше трудились разработчики ManyEyes. Сервис иллюстрирует динамику модификации документов, с которыми одновременно работает многочисленная авторская команда. В настоящее время сервис позволяет отследить эволюцию статей в Wikipedia. Просматривая эти хроники, можно легко выявить конфликты между создателями, каждый из которых отстаивает свою точку зрения на описываемый предмет, а также определить влияние внешних событий на модификацию текста (например, для статьи «Iraq»). Результаты анализа представляются в виде диаграммы изменений, формирование которой разработчики объясняют на примере.

Пусть три автора под никами Mary, Suzanne и Martin в разное время участвуют в редактировании Wiki-статьи. Первую версию документа создает Mary. Этот этап отражается на диаграмме появлением первой вертикальной линии, окрашенной в авторский цвет, длина которой соответствует объему текста [1].



Через некоторое время Suzanne дописывает в конец этой статьи свои дополнения [2].



Martin полагает, что текст можно сократить, и удаляет часть дополнений от Suzanne [3].



Suzanne возвращается и вносит свою лепту в середину статьи [4].



Хронология перехода статьи от своего начального вида к текущему будет выглядеть следующим образом [5].



Полученную картинку можно просматривать в нескольких режимах. По умолчанию установлен вариант «комьюнити». При желании можно выделить деятельность конкретного автора, а также визуализировать «возраст» каждой правки (диаграмма в этом случае представлена в черно-белом цвете, и в зависимости от времени, прошедшего после редактирования, авторский «шлейф» будет темнеть).

Результаты такого анализа Wiki-статей позволяют выявить несколько интересных моментов. В частности, авторы HistoryFlow исследовали эволюцию нескольких спорных тем и заметили, что содержание ряда статей во время атак вандалов было удалено фактически полностью. Однако, как показывает практика, первоначальный вариант текста восстанавливается достаточно оперативно, и абсолютное большинство читателей просто не успевают заметить последствий. На картинке приведен пример со статьей «Islam», которая подвергалась вмешательству вандалов [6].



Как уверяют разработчики, ManyEyes позволяет обеспечить более глубокий анализ информации за счет использования знаний сотен и тысяч людей. В общем-то, это аргумент почти всех компаний, продвигающих средства для коллективной работы в онлайне, который сводится к старой пословице «Одна голова хорошо, а две лучше». В IBM указывают, что этот проект может быть полезен не только частным лицам, но и бизнесу и правительственным структурам при принятии более точных решений на основе предиктивного анализа. Приложение должно помочь компаниям и госведомствам значительно ускорить темпы освоения новых технологий за счет веб-сервисной модели ПО. Весьма полезной такая модель является и для самой IBM, поскольку стимулирует коллективные инновации среди пользователей и гарантирует оперативную обратную связь, что вкупе способствует быстрой отладке и выводу на рынок свежих технологий.

Впрочем, также ни для кого не является секретом, что создатели всех wiki-приложений и подобных им сервисов сталкиваются со спамерами, вандалистами и прочими любителями «посорить в общественных местах», вносящими некорректные правки в статьи, документы или, как в данном случае, наборы данных. Так например, в Wikipedia пришлось даже отказаться от излишней «демократии» во внесении правок, поскольку этим правом слишком часто злоупотребляли, что существенно подорвало репутацию проекта. Подастся ли модерированию ManyEyes или же в будущем возможности по редактированию визуализаций также придется ограничить, покажет время. Пока сервис еще не получил столь массовой популярности, и эти проблемы обходят его стороной.


Данные


Перейти на страницу:

Похожие книги

Искусство программирования для Unix
Искусство программирования для Unix

Книги, подобные этой, редко появляются на прилавках магазинов, поскольку за ними стоит многолетний опыт работы их авторов. Здесь описывается хороший стиль Unix- программирования, многообразие доступных языков программирования, их преимущества и недостатки, различные IPC-методики и инструменты разработки. Автор анализирует философию Unix, культуру и основные традиции сформированного вокруг нее сообщества. В книге объясняются наилучшие практические приемы проектирования и разработки программ в Unix. Вместе с тем описанные в книге модели и принципы будут во многом полезны и Windows-разработчикам. Особо рассматриваются стили пользовательских интерфейсов Unix-программ и инструменты для их разработки. Отдельная глава посвящена описанию принципов и инструментов для создания хорошей документации.Книга будет полезной для широкой категории пользователей ПК и программистов.

Эрик Стивен Реймонд

ОС и Сети / Программирование / Прочая компьютерная литература / Книги по IT