Читаем Разберись в Data Science полностью

Талантливая студентка, изучавшая сложные технические концепции в университете на протяжении последних пяти лет, работает над своим первым крупным проектом в маркетинговой фирме. За день до представления результатов ее менеджер предлагает ей представить результаты проведенного анализа в виде «истории» и сократить ее содержание до одного слайда PowerPoint.

«С ними надо говорить, как с пятиклассниками», – заявляет менеджер.

Она неохотно соглашается, хотя знает, что в аудитории будут ученые. Она считает, что презентация уже была достаточно сокращена. Кроме того, она проверила понятность своего выступления на технически не подкованных коллегах.

«Поверь мне, – говорит менеджер, – тебе не нужно, чтобы эта группа задавала какие-либо вопросы». Из-за отбрасывания большинства технических деталей и критических рассуждений результаты работы сводятся к простому заголовку.

Во время представления результатов в ходе презентации большинство зрителей кивает. Некоторые задаются вопросом: «Нам действительно нужны дата-сайентисты, находящие простые ответы?»[150] Другие зрители, обладающие некоторыми техническими знаниями, недоумевают, почему были проигнорированы технические аспекты проекта.

Обдумывая свою презентацию, студентка понимает, что многие нюансы были потеряны, – и чувствует, что в некотором смысле она предала свою исходную работу.

Игра «Телефон»

Во время случайной встречи за чашкой кофе дата-сайентист рассказывает своему коллеге об интересном факте, обнаруженном в данных компании. У нее еще не было возможности разобраться во всем как следует, но беглый обзор показал, что 75 % участников опроса заявили о своем намерении стать постоянными клиентами.

После встречи дата-сайентист возвращается к своему столу и снова просматривает результаты анализа. Она еще раз видит показатель 75 % и понимает, что в опросе приняли участие всего 8 человек из нескольких сотен. Затем она выясняет, что соответствующий вопрос был добавлен в анкету совсем недавно, так что ни один из тех людей, которые высказали намерение стать постоянными клиентами, еще не стал таковым.

Месяц спустя на общем собрании компании руководители хвастаются своими успехами в деле удержания клиентов. Они говорят о том, что 3 из 4 клиентов стали постоянными, судя по результатам опроса сотен людей.

Дата-сайентист понимает, что этот факт был озвучен во время случайной встречи за чашкой кофе и никогда не должен был распространяться без проверки. К этому моменту он повторялся в компании так много раз, что стал восприниматься как нечто самоочевидное. Дата-сайентист задается вопросом о том, можно ли как-то остановить его использование в компании – и стоит ли вообще это делать.

В дебри

Дата-сайентист применяет подходящие методы для решения сложной проблемы и, по общему мнению, отвечает на поставленные бизнес-вопросы. Но его итоговая презентация для проектной группы оказывается слишком технической. Он не предпринял практически никаких усилий для того, чтобы значимым образом связать полученные результаты с ценностью для бизнеса.

Пытаясь добиться признания в качестве уважаемого технического эксперта, он излишне увлекается технической терминологией, и хотя заинтересованные стороны считают результаты его работы впечатляющими, они покидают зал без четкого представления о том, что делать дальше. По их мнению, проект нельзя считать завершенным из-за того, что он не был представлен понятно.

Проблема превращается в порочный круг: специалиста по работе с данными просят разработать лучшее решение для завершения проекта. Дата-сайентист углубляется в дебри…

Проверка реальности

Дата-сайентист проводит анализ рынка, но разработанное им решение не может быть реализовано в качестве рыночной стратегии, так как оно оторвано от того, как работает бизнес. Если бы в распоряжении компании было бесконечное количество качественных данных, средств и времени, это было бы отличным решением! Однако в действительности это отличное решение идеальной проблемы, а не той, которая на самом деле стоит перед бизнесом.

Но дата-сайентист непреклонен. Он хочет реализовать это решение «правильным» (то есть своим) способом. Он высокомерно заявляет своим коллегам по бизнесу, что они должны придумать, как это сделать. Наконец вмешивается старший партнер и говорит, что проект будет свернут, если они не смогут проложить путь по текущей траектории.

«Что еще мы можем сделать?» – спрашивает старший партнер. (До сих пор никто не задавал этот вопрос.)

После этого команда находит способ, выигрышный для всех.

Захват власти

После многолетнего взаимодействия с клиентами в страховой отрасли команда проекта привлекает дата-сайентиста для анализа данных о клиентах, накопившихся за многие годы. Этот специалист недавно был повышен до старшего дата-сайентиста, и новое звание вскружило ему голову.

Перейти на страницу:

Все книги серии Мировой компьютерный бестселлер

Похожие книги

1С: Управление торговлей 8.2
1С: Управление торговлей 8.2

Современные торговые предприятия предлагают своим клиентам широчайший ассортимент товаров, который исчисляется тысячами и десятками тысяч наименований. Причем многие позиции могут реализовываться на разных условиях: предоплата, отсрочка платежи, скидка, наценка, объем партии, и т.д. Клиенты зачастую делятся на категории – VIP-клиент, обычный клиент, постоянный клиент, мелкооптовый клиент, и т.д. Товарные позиции могут комплектоваться и разукомплектовываться, многие товары подлежат обязательной сертификации и гигиеническим исследованиям, некондиционные позиции необходимо списывать, на складах периодически должна проводиться инвентаризация, каждая компания должна иметь свою маркетинговую политику и т.д., вообщем – современное торговое предприятие представляет живой организм, находящийся в постоянном движении.Очевидно, что вся эта кипучая деятельность требует автоматизации. Для решения этой задачи существуют специальные программные средства, и в этой книге мы познакомим вам с самым популярным продуктом, предназначенным для автоматизации деятельности торгового предприятия – «1С Управление торговлей», которое реализовано на новейшей технологической платформе версии 1С 8.2.

Алексей Анатольевич Гладкий

Финансы / Программирование, программы, базы данных
C++ Primer Plus
C++ Primer Plus

C++ Primer Plus is a carefully crafted, complete tutorial on one of the most significant and widely used programming languages today. An accessible and easy-to-use self-study guide, this book is appropriate for both serious students of programming as well as developers already proficient in other languages.The sixth edition of C++ Primer Plus has been updated and expanded to cover the latest developments in C++, including a detailed look at the new C++11 standard.Author and educator Stephen Prata has created an introduction to C++ that is instructive, clear, and insightful. Fundamental programming concepts are explained along with details of the C++ language. Many short, practical examples illustrate just one or two concepts at a time, encouraging readers to master new topics by immediately putting them to use.Review questions and programming exercises at the end of each chapter help readers zero in on the most critical information and digest the most difficult concepts.In C++ Primer Plus, you'll find depth, breadth, and a variety of teaching techniques and tools to enhance your learning:• A new detailed chapter on the changes and additional capabilities introduced in the C++11 standard• Complete, integrated discussion of both basic C language and additional C++ features• Clear guidance about when and why to use a feature• Hands-on learning with concise and simple examples that develop your understanding a concept or two at a time• Hundreds of practical sample programs• Review questions and programming exercises at the end of each chapter to test your understanding• Coverage of generic C++ gives you the greatest possible flexibility• Teaches the ISO standard, including discussions of templates, the Standard Template Library, the string class, exceptions, RTTI, and namespaces

Стивен Прата

Программирование, программы, базы данных
Programming with POSIX® Threads
Programming with POSIX® Threads

With this practical book, you will attain a solid understanding of threads and will discover how to put this powerful mode of programming to work in real-world applications. The primary advantage of threaded programming is that it enables your applications to accomplish more than one task at the same time by using the number-crunching power of multiprocessor parallelism and by automatically exploiting I/O concurrency in your code, even on a single processor machine. The result: applications that are faster, more responsive to users, and often easier to maintain. Threaded programming is particularly well suited to network programming where it helps alleviate the bottleneck of slow network I/O. This book offers an in-depth description of the IEEE operating system interface standard, POSIX (Portable Operating System Interface) threads, commonly called Pthreads. Written for experienced C programmers, but assuming no previous knowledge of threads, the book explains basic concepts such as asynchronous programming, the lifecycle of a thread, and synchronization. You then move to more advanced topics such as attributes objects, thread-specific data, and realtime scheduling. An entire chapter is devoted to "real code," with a look at barriers, read/write locks, the work queue manager, and how to utilize existing libraries. In addition, the book tackles one of the thorniest problems faced by thread programmers-debugging-with valuable suggestions on how to avoid code errors and performance problems from the outset. Numerous annotated examples are used to illustrate real-world concepts. A Pthreads mini-reference and a look at future standardization are also included.

David Butenhof

Программирование, программы, базы данных