Приведу пример из личного опыта. Как-то раз мне довелось пообщаться с генеральным директором компании, специализирующейся не на чем-нибудь, а на data science. Я задал ему вопрос: «Сколько специалистов по обработке данных в вашем высшем руководстве или совете директоров?» Мой собеседник изобразил пальцами большой ноль. Удивительно: неужели сама мысль, что специалист по обработке данных может представлять компанию или выступать от ее имени, настолько всех пугает? Эта история иллюстрирует проблему – в пространстве данных и дата-аналитики постоянно действуют разрозненные и центробежные силы. В прошлом сфера данных, ПО и технологий всегда существовала в организациях как бы отдельно от всего остального. Ответственные за эту сферу сотрудники считались узкими специалистами, от них не требовалось владеть навыками коммуникации и публичных выступлений. Эту ситуацию необходимо в корне менять, и перемены должны стать частью стратегии.
Меня постоянно спрашивают: есть ли у специалистов по обработке данных собственное место в мире дата-грамотности? Я с полной уверенностью отвечаю: да! Если мы собираем мозаику информационно-аналитической стратегии и говорим о необходимости демократизации данных в организациях, то уметь эффективно общаться на языке данных должен каждый. Это означает, что внутриорганизационная подготовка специалистов-профессионалов по обработке данных будет отличаться от подготовки, которую должны пройти сотрудники, которые только начинают работать с данными. Нам нужно, чтобы настоящие специалисты учились выступать перед широкой публикой, эффективно общаться и помогать всем остальным путешествовать по миру данных. Готов поспорить, у большинства специалистов по обработке данных есть этот неприятный опыт: когда ты выступаешь перед аудиторией с результатами своей работы, а встречаешь абсолютно непонимающие взгляды. Масса важнейших знаний и идей остаются незамеченными просто потому, что аудитория не способна их воспринять. Дата-грамотность требует от специалистов строить выступление так, чтобы язык, на котором они говорят, был понятен каждому. Их роль должна измениться: теперь им следует вдохновлять других овладевать дата-грамотностью.
Что еще могут делать специалисты по данным в мире дата-грамотности? Мы установили, что не каждому нужно быть узким специалистом, но каждому нужна дата-грамотность. Так какое место в этом мире должны занимать узкоспециальные технические методы обработки и анализа? В организации должно – я подчеркиваю,
Дата-грамотность и визуализация данных
Мир дата-грамотности огромен и состоит из множества движущихся частей, но есть один элемент, способный облегчить работу буквально всем: визуализация данных. Что это такое? Это упрощенный подход к изучению данных. Представьте себе, что вам нужно проанализировать таблицу данных из 100 000 строк и 50 столбцов. Обрадует вас такая перспектива? Визуализация данных дает возможность упрощать большие объемы данных, поскольку мы с вами способны воспринимать зрительные образы. Поясню на примерах.
Рис. 4.2 представляет собой одну из моих самых любимых визуализаций. Мы можем проследить за походом Наполеона в Россию 1812 года и увидеть, как таяла его армия. И все это – в упрощенном виде. А теперь представьте себе те же данные, но в виде объемной таблицы. Или в виде множества публикаций в различных журналах (и вам нужно выискивать цифры самостоятельно, а затем составлять целостную картину). Много удовольствия вы бы получили, пытаясь таким образом понять, что же произошло с армией? Эта визуализация помогает упростить представление о наполеоновском походе.
Слышали ли вы про вспышку холеры, которая произошла в XIX веке в Лондоне на Брод-стрит (ныне Бродвик-стрит)? Если нет, взгляните на рис. 4.3. Это очень интересное исследование: визуализация данных помогла обществу сдержать эпидемию опасного заболевания. Врач Джон Сноу определил, что источником вспышки холеры стала загрязненная вода из водоразборной колонки, которой пользовалось множество людей. Получив нужную информацию, власти Лондона установили причинно-следственную связь и распорядились закрыть колонку, что предотвратило дальнейшее распространение болезни. Согласитесь, визуализация данных сработала на удивление эффективно!