Кого-то может удивить, почему я включил сюда термин «исследователь данных», поскольку в свете поднявшегося вокруг него ажиотажа он представляется как новый. Но если вы изучите, что пишут о деятельности исследователей данных, о том, чем они руководствуются и об их методах, то увидите, что это не сильно отличается от того, чем занимались выдающиеся специалисты-аналитики на протяжении многих лет. Основное практическое отличие между исследователями данных и другими аналитиками состоит в том, что первые чаще имеют образование в области компьютерных наук и предпочитают работать с Hadoop и языками наподобие Python или R. Традиционные же специалисты-аналитики чаще имеют образование в области статистики, математики или исследования операций и предпочитают работают с серверами реляционного и аналитического окружения, а программируют на языках SAS и SQL. Однако какие бы платформы или языки ни использовались, фундаментальный набор навыков и склад ума, которые необходимы для успеха на данном поприще, остаются неизменными. По сути, все эти профессионалы используют одну и ту же аналитику в одних и тех же целях для крупных компаний, использующих инновационную аналитику.
В нынешней популярности термина «исследователь данных» есть свои плюсы. Годами, нанимая специалистов-аналитиков, я говорил: «Мне нужен статистик, который при этом также…» Ключевой частью фразы было «который при этом также…» Дело в том, что людей со специальностью «статистик» находится в избытке. Многие из них не работают на крупные компании и не создают инновационную аналитику. Например, могут заниматься статистическими исследованиями или научной деятельностью. Поэтому только часть тех, кого именуют «статистиками» или «добытчиками данных», специализируется на внедрении аналитики в бизнес-процессы и занимается деятельностью, ассоциируемой с исследователями данных.
Однако термин «исследователь данных» нов настолько, что та небольшая группа людей, претендующих на этот титул на законных основаниях, в основном отвечает той матрице, которую я всегда искал{73}
. Имидж и мыслительные процессы, ассоциируемые с термином «исследователь данных», соответствуют сути искомых мною всегда качеств «статистика, который при этом также…» Мне нравится, что у нас наконец-то появился термин, точно передающий ключевые требования при найме специалистов-аналитиков (даже если сам по себе термин мне не нравится).Вместе с компанией Talent Analytics и Международным институтом аналитики мы провели опрос среди большого числа специалистов-аналитиков, чтобы определить, что делает их уникальными{74}
. Это количественное исследование было призвано ответить на два вопроса:1. Обладают ли специалисты-аналитики неким уникальным, поддающимся количественной оценке складом ума и представляют ли они собой прирожденные таланты?
2. Как специалисты-аналитики расходуют свое время в рамках рабочего процесса?
Результаты исследования показали, что специалисты-аналитики обладают четкими и измеримыми характерными признаками прирожденных талантов. Среди 11 измеренных характеристик первое место заняли любопытство и креативность. Talent Analytics использует эту информацию для помощи компаниям в оценке существующих аналитических кадров и кандидатов при найме. Исследование также показало, что специалисты-аналитики значительную часть своего рабочего времени расходовали на подготовку данных и программирование и гораздо меньше времени на управление процессами и интерпретацию, визуализацию и представление результатов. Этот вывод отражает реальное положение дел. Нередко можно слышать, что у аналитиков 80 % и более усилий тратится на подготовку к анализу.
Старая и новая школы приходят к согласию
Возможно, услышав мое заявление о том, что исследователи данных не отличаются от выдающихся специалистов-аналитиков прошлого, вы сочли меня «парнем-статистиком из старой школы». Однако «исследователи данных из новой школы», такие как Саймон Чжан из LinkedIn, со мной согласны. Мы с ним выступали на конференции Big Analytics в Бостоне в 2012 г.{75}
В ходе своего доклада он рассказал о том, как его аналитическая команда в LinkedIn нанимает новых сотрудников и на какие характеристики при этом смотрит. Я был поражен, поскольку Саймон сказал фактически то же самое, что собирался сказать я, только немного другими словами. Он тоже получил удовольствие от моего доклада.