Читаем Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики полностью

Однозначного определения понятия «большие данные» не существует, однако можно сослаться на два описания сути этой концепции, с которой согласится большинство людей. Первое определение предложил Мерв Адриан из компании Gartner[2] в статье для журнала Teradata Magazine в первом квартале 2011 года: «Большие данные – это данные, сбор, управление и обработку которых невозможно осуществить с помощью наиболее часто используемых аппаратных сред и программных инструментов в течение допустимого для пользователя времени»{1}. Другое хорошее определение появилось в докладе McKinsey Global Institute[3] в мае 2011 года: «Большие данные – это наборы данных, размеры которых выходят за пределы возможностей по сбору, хранению, управлению и анализу, присущих обычному программному обеспечению базы данных»{2}.

Из этих определений следует, что то, что считается большими данными, будет изменяться по мере развития технологий. То, что когда-то было «большими данными», или то, что считается «большими данными» сегодня, будет отличаться от «больших данных» завтрашнего дня. Некоторых настораживает этот аспект понятия больших данных. Приведенные определения подразумевают, что суть больших данных может отличаться в зависимости от отрасли или даже организации, если существует значительная разница в возможностях инструментов и технологий. Мы обсудим это более подробно в этой главе в разделе «Сегодняшние большие данные отличаются от завтрашних больших данных».

В докладе McKinsey отмечены несколько интересных фактов, которые дают представление об объеме существующих сегодня данных.

• За $600 сегодня можно купить диск, способный вместить всю музыку мира.

• Каждый месяц через сеть Facebook пользователи обмениваются 30 миллиардами фрагментов информации.

• В среднем компании пятнадцати из семнадцати отраслей промышленности Соединенных Штатов имеют больше информации, чем Библиотека Конгресса США{3}.

Слово «большие» характеризует не только объем

Хотя понятие «большие данные» подразумевает наличие большого количества данных, оно не относится только к объему данных. Большие данные характеризуются возросшей скоростью их передачи, сложностью и разнообразием по сравнению с источниками данных прошлого.

Понятие «большие данные» подразумевает не только их объем. Согласно Gartner Group, слово «большие» относится и к некоторым другим характеристикам источника больших данных{4}. Это не только возросший объем, но и возросшая скорость передачи и разнообразие источников. Такие факторы, разумеется, усложняют работу с большими данными, поскольку вам приходится иметь дело не просто с большим количеством данных, а с тем, что они поступают к вам очень быстро, в сложных формах и из разнообразных источников.

Легко понять, почему большие данные сравнивают с приливной волной и почему ее приручение – настоящий вызов! Методы, процессы и системы анализа, внедренные в организациях, будут использоваться до предела, а возможно, и сверх предела. Необходимо разработать дополнительные методы и процессы анализа на базе обновленных технологий и методов для того, чтобы эффективно анализировать большие данные и действовать на основании полученных результатов. Мы коснемся всех этих тем в данной книге, чтобы продемонстрировать целесообразность укрощения больших данных.

<p>Что важнее: «большие» или «данные»?</p></span><span>

А теперь устроим небольшую викторину! Остановитесь на минуту и попробуйте ответить на следующий вопрос, прежде чем читать дальше: что является самым важным в понятии «большие данные»: 1) слово «большие», 2) слово «данные», 3) оба слова или 4) ни одно из них? Задумайтесь об этом на минуту и, определившись с ответом, переходите к следующему абзацу. Мысленно проиграйте музыку, которую включают в игре, пока участники думают.

Теперь проверим, правы ли вы. Правильный ответ – вариант 4). В термине «большие данные» ни одну из составных частей нельзя считать важнейшей. Важнее всего то, как организации используют большие данные. Анализ больших данных, производимый вашей организацией, в сочетании с действиями, предпринимаемыми для улучшения вашего бизнеса, – вот что имеет значение.

Перейти на страницу:

Похожие книги

Управление рисками
Управление рисками

Harvard Business Review – ведущий деловой журнал с многолетней историей. В этот сборник вошли лучшие статьи авторов HBR на тему риск-менеджмента.Инсайдерские атаки, саботаж, нарушение цепочек поставок, техногенные катастрофы и политические кризисы влияют на устойчивость организаций. Пытаясь их предотвратить, большинство руководителей вводят все новые и новые правила и принуждают сотрудников их выполнять. Однако переоценка некоторых рисков и невозможность предусмотреть скрытые угрозы приводят к тому, что компании нерационально расходуют ресурсы, а это может нанести серьезный, а то и непоправимый ущерб бизнесу. Прочитав этот сборник, вы узнаете о категориях рисков и внедрении процессов по управлению ими, научитесь использовать неопределенность для прорывных инноваций и сможете избежать распространенных ошибок прогнозирования, чтобы получить конкурентное преимущество.Статьи Нассима Талеба, Кондолизы Райс, Роберта Каплана и других авторов HBR помогут вам выстроить эффективную стратегию управления рисками и подготовиться к будущим вызовам.Способность компании противостоять штормам во многом зависит от того, насколько серьезно лидеры воспринимают свою функцию управления рисками в то время, когда светит солнце и горизонт чист.Иногда попытки уклониться от риска в действительности его увеличивают, а готовность принять на себя больше риска позволяет более эффективно им управлять.Все организации стремятся учиться на ошибках. Немногие ищут возможность почерпнуть что-то из событий, которые могли бы закончиться плохо, но все обошлось благодаря удачному стечению обстоятельств. Руководители должны понимать и учитывать: если люди спаслись, будучи на волосок от гибели, они склонны приписывать это устойчивости системы, хотя столь же вероятно, что сама эта ситуация сложилась из-за уязвимости системы.Для когоДля руководителей, глав компаний, генеральных директоров и собственников бизнеса.

Harvard Business Review (HBR) , Сергей Каледин , Тулкин Нарметов

Карьера, кадры / Экономика / Менеджмент / Финансы и бизнес
Как устроен мир
Как устроен мир

Если судить по энергии, размаху; новизне и влиянию его идей, Ноам Хомский — возможно, самый значительный из живущих сегодня интеллектуалов«Нью-Йорк таймс»Ноам Хомский — мирно известный американский лингвист, оказавший огромное влияние на развитие науки о языке, публицист, психолог, преподаватель Массачусетского технологического института.Свободного рынка не существует, поскольку мировую экономику захватили корпорации, зависящие от субсидий государства.Внешняя политика США нацелена прежде всего на изменение окружающего мира в их собственных интересах. Они используют военные и финансовые средства даже в тех регионах, где у них нет особых экономических интересов.Внутренняя политика США направлена на удержание в повиновении населения и на перераспределение доходов в пользу крупных частных собственников.Ноам Хомский — известный своими леворадикальными взглядами публицист и ярый критик политической и экономической систем США — доказывает это на конкретных примерах. С ним многие не согласны.Чью сторону принять — решать читателю.Печатается пиратским сообществом без разрешения автора и литературных агентств.

Ноам Хомский

Экономика
Как Америка стала мировым лидером
Как Америка стала мировым лидером

Как Америка стала мировым лидером? Конечно же, благодаря предприимчивости, свободе, демократичности и трудолюбию американцев. Однако это лишь часть ответа. Вторая кроется в объективных силах и законах развития. Именно они позволили Америке преодолеть самую грандиозную экономическую катастрофу XX века, получившую название Великой депрессии и встать во главе человеческого развития.Сегодня человечество вновь переживает трудные времена, которые по своим масштабам грозят превзойти даже последствия мирового кризиса 1930-х годов. Поэтому ответ на вопрос «как Америка стала мировым лидером?» представляет собой далеко не праздный интерес, он дает возможность взглянуть из прошлого на наши дни и оценить возможности выхода из Великой Рецессии современности.Настоящая книга является продолжением серии «Политэкономия войны» В. Галина, посвященной исследованию политэкономической истории возникновения Второй мировой войны.

Василий Васильевич Галин

Экономика