Мы много говорили о дата-грамотности, а теперь давайте поговорим конкретно об анализе и обработке данных в научном смысле – о data science. Какую роль играют визуализация данных и управление данными? Относится ли к дата-грамотности такая область, как этика данных? В этой главе мы изучим эти (и некоторые другие) области мира данных. Мы рассмотрим их с точки зрения как общей стратегии, так и четырех элементах дата-грамотности… и в итоге увидим, как все элементы этого мира слаженно работают на общий результат. На рис. 4.1 приведены важнейшие области, о которых пойдет речь в этой главе:
● стратегия в сфере данных и аналитики;
● обработка данных;
● визуализация данных;
● топ-менеджмент;
● культура;
● качество данных;
● управление данными;
● этика и законодательство в сфере данных.
Подробно говорить о стратегии в сфере данных и аналитики мы не будем – эта тема заслуживает отдельной книги. Ее мы лишь слегка коснемся в одной из следующих глав, но сейчас нам важно одно: дата-грамотность – абсолютно необходимое условие для формирования успешной стратегии работы с данными (при проблемах с дата-грамотностью у сотрудников организации провалится любая стратегия). Для более полного погружения в тему я с удовольствием рекомендую вам замечательную книгу Бернарда Марра «Стратегия в сфере данных» (Data strategy). Для наших же целей подойдет небольшое введение в тему.
Стратегия в сфере данных и аналитики
В качестве такого введения давайте представим себе, что я пришел к вам и попросил вас построить дом. Но у меня нет ничего, кроме рисунка дома и кое-каких инструментов. Мы с вами даже не знаем, каким будет интерьер, но идея постройки дома меня чрезвычайно вдохновляет. Ах да, вы не строитель, да и у меня нет никакого опыта ни в строительстве, ни в проектировании, однако я по какой-то причине выбрал в качестве исполнителя задачи вас. Но есть и плюс: я хотя бы готов предоставить вам инструменты и материал. У вас есть коробка гвоздей, молоток, бревна и т. д. – и вы приступаете к работе. Как вы думаете, насколько успешно вы справитесь с задачей? Построите ли вы в таких условиях дом моей мечты? А, я еще не говорил? Это должен быть дом моей мечты, так что не разочаруйте меня!
Полагаю, все понимают, что такая стратегия постройки дома непременно провалится. Но… именно этого часто требуют и ожидают руководители организаций, когда дело касается данных и дата-аналитики. У них есть некая идеалистическая картина: чего мы хотим достичь. Они вкладывают деньги в инструменты и материалы (то есть данные), но руководствуются ли они четкой стратегией, чтобы достичь успеха? Рассчитывать, что дом будет успешно построен, можно только в одном случае: если у вас, помимо инструментов и материалов, есть чертежи, необходимые разрешения и порядок действий (то есть стратегия). С данными и дата-аналитикой все обстоит точно так же.
Мир данных и их анализа сложен – возможно, он куда сложнее, чем проектирование и строительство домов, однако следовать чертежам, то есть
Если руководство организации хочет сформировать стратегию в сфере данных и аналитики, то один из ключевых факторов успеха – дата-грамотность. В примере со строительством дома я упомянул одну важную деталь. Обратили ли вы на нее внимание? Я допустил, что вы – не профессиональный строитель! Как вы думаете, многие ли сотрудники вашей организации – обученные специалисты по работе с данными? «Обученные» – в самом буквальном смысле! Большинство людей не изучали data science ни в школе, ни в колледже, ни в университете. Когда я прошу вас построить дом, предоставляя лишь инструменты, материалы и рисунок, вы оказываетесь в том же положении, что и множество сотрудников, которые пытаются увидеть некий смысл в предоставляемых им данных, хотя даже не умеют пользоваться аналитическими методами… В целом можно сказать, что стратегия обязательно должна включать в себя человеческий фактор дата-грамотности.
Дата-грамотность и обработка данных