Читаем О чем говорят цифры. Как понимать и использовать данные полностью

Неструктурированные данные в последнее время очень популярный предмет для обсуждения, поскольку слишком многие распространенные источники больших данных предоставляют их в неструктурированном виде. Но зачастую забывают об очень важном обстоятельстве: никакая аналитика не имеет дела напрямую с большими данными. Последние могут стать толчком к проведению анализа, но когда дело доходит до собственно аналитических процедур, то неструктурированные данные не обрабатываются. «Как же так?» – спросите вы. Позвольте объяснить.

Вот пример: отпечатки пальцев. Если вы любите сериалы вроде «CSI: полиция Майами», то постоянно видите, как эксперты идентифицируют их. Отпечатки пальцев представляют собой неструктурированные данные, причем довольно большого объема – если изображение высококачественное. Когда полицейские – в сериале или в жизни – сравнивают их, то есть ли смысл накладывать одно изображение на другое? Нет. Сначала они определяют несколько ключевых точек на каждом отпечатке. Затем по этим точкам формируется карта (многоугольник). Именно по этим картам производится сравнение. Особое значение имеет тот факт, что карта представляет собой структурированные данные, к тому же небольшого объема, даже если исходное изображение «весило» много. Как видите, хоть неструктурированные данные и необходимы для начала анализа, но в самом процессе обрабатываются не они, а полученные из них структурированные данные.

Всем понятный пример такого рода – анализ текстов. В общедоступных средствах массовой информации в последнее время принято вести смысловой анализ множества сообщений. Но можно ли непосредственно анализировать твиты, посты в Facebook и прочие посты и комментарии в соцсетях на предмет их смысловой оценки?

В действительности – нет. Текст необходимо разбить на фразы или слова. Затем определенным фразам и словам присваивается определение «положительный» или «отрицательный». В простом случае фразе или слову, определенному как «положительное», присваивается значение 1, «отрицательному» – 1, а «нейтральному» – 0. Смысл сообщения оценивается по сумме значений входящих в него слов или фраз. Таким образом, оценка ведется на основе структурированных количественных данных, полученных из первоначально неструктурированного источника – текста. Любой дальнейший анализ тенденций или стандартных моделей полностью основывается на структурированном, количественном выражении текста, но не на самом тексте.

Перейти на страницу:

Похожие книги

Психология согласия
Психология согласия

Если и существует на свете книга, которая может стать причиной экстраординарного рывка в карьере и бизнесе, вы держите ее в руках. Автор «Психологии согласия» Роберт Чалдини, самый цитируемый в мире социальный психолог, много лет, словно тайный агент, внедрялся в отделы продаж крупных корпораций. Он наблюдал за работой лучших из лучших, пока не пришел к неожиданному выводу. Гении переговоров интуитивно пользуются приемами, позволяющими добиться нужного результата, еще до начала процесса убеждения. Только представьте себе, вы получаете согласие руководителя повысить вам зарплату, едва войдя к нему в кабинет. Или заручаетесь поддержкой партнера в рискованном проекте, даже не начав его уговаривать. Или добиваетесь от клиента готовности заплатить максимально высокую цену, только-только приступив к переговорам. Это не шутка и не маркетинговая уловка. Это революционная методика, разработанная блестящим ученым и не менее блестящим практиком.В ней вы найдете:117 воодушевляющих примеров из реальной бизнес-практики и личного опыта автора;7 принципов, которые раскрывают механизмы влияния и убеждения;1 грандиозную идею, основанную на многолетних наблюдениях и масштабных социальных исследованиях.

Роберт Бено Чалдини

Деловая литература
Что самые успешные люди делают до завтрака. Как изменить к лучшему свое утро… и жизнь
Что самые успешные люди делают до завтрака. Как изменить к лучшему свое утро… и жизнь

Президенты, блестящие менеджеры и харизматичные лидеры, визионеры и гении – в чем секрет их успеха?Пока большинство пытается с утра выбраться из-под одеяла, эти люди уже начали свой день и побеждают в борьбе за карьеру и личную жизнь.Они на встречах, которые приносят миллионы от слияний и поглощений. Они на школьных выступлениях своих детей. Они на утренней пробежке. Они отключили телефон в субботу. Они фонтанируют идеями и знают, как «зажечь» свою командуОпираясь на истории из жизни и научные исследования, эксперт по тайм-менеджменту Лора Вандеркам рассказывает, что и как по-настоящему успешные люди делают по утрам для достижения того, что другим кажется невозможным.А вы не боитесь проспать свой шанс?

Екатерина Королева , Лора Вандеркам

Деловая литература / Публицистика / Самосовершенствование / Документальное / Финансы и бизнес