Недавно Samsung зарегистрировала неблагозвучный для русского уха бренд Gnusmas[9]
, название которого представляет собой перевернутое Samsung. Возможно, производитель не знал, что в нашей стране это слово стало довольно популярным и используется в негативном ключе, в том числе в качестве нарицательного для отзывов о неудачных продуктах рассматриваемой нами компании. А теперь представьте, что произойдет, если Samsung официально попросит всех владельцев ее устройств использовать слово Gnusmas в качестве ругательства, чтобы выражать недовольство продуктами компании на просторах интернета. Очевидно, что с наличием контрольного слова поиск и обработка отзывов, оставленных во всемирной паутине, будут занимать намного меньше времени. Благодаря чему отдел качества сможет быстрее получать обратную связь от пользователей, и данные станут точнее. Наличие такого слова-метки в интернет-публикациях – бесценная находка для компании, позволяющая действительно улучшить выпускаемые ею продукты за счет анализа огромного количества реальных откликов.К слову, обычно небольшие компании, у которых еще нет наработок в области искусственного интеллекта, используют сервисы «Google Alerts» или «Яндекс.Медиана» для обнаружения в интернете с помощью контрольных слов отзывов о своих товарах. Такие сервисы автоматически отправляют пользователю уведомление на почту, если в глобальной сети появляется заданное контрольное слово. То есть если у вашего товара достаточно уникальное название, можно настроить отслеживание прямо по нему и собирать обратную связь. Полученные отзывы необходимо классифицировать на положительные и отрицательные, определяя в каждом, какое преимущество или недостаток продукта озвучены как основные. В небольшой компании с этим может справиться один человек, но с ростом популярности продукта приходится создавать свой машинный интеллект для столь кропотливой и нудной работы. В любом случае без обработки и сбора больших данных по комментариям пользователей невозможно улучшить продукт и удовлетворить клиентов.
Отделение по работе с клиентами и партнерами
Именно в отделении по работе с клиентами и партнерами, в которое в том числе входит отдел по связям с общественностью, работают над тем, чтобы организация стала всемирно известной. И это действие напрямую влияет на стоимость привлечения новых клиентов.
Имидж создается различными способами: от публикаций в прессе до участия в общественных движениях, а иногда даже за счет обнародования некоторой закрытой информации с целью привлечения внимания партнеров и поиска клиентов-почитателей. Например, если компания собирает большие данные о своем продукте, то в публичный доступ может попасть часть уже обработанных сведений. Чтобы любители могли потренироваться в создании собственной системы для предсказаний, используя машинное обучение. Именно так и поступил «Сбербанк»[10]
, который выложил на соревновательную платформу Kaggle набор больших данных о недвижимости в России. Сейчас это один из самых популярных тренажеров, на котором учат будущих специалистов по данным на различных отечественных курсах по машинному обучению.По опубликованному набору можно сразу понять, как профессионалы в банке относятся к большим данным. Достаточно взглянуть на количество параметров, рассматриваемых для каждой квартиры:
• Описание квартир – 14 параметров.
• Описание ближайшей недвижимости – 24 параметра.
• Макроэкономические факторы, касающиеся недвижимости, – 101 параметр.
• Дополнительное описание ближайшей недвижимости – 288 параметров.
Данные представлены в форме таблиц, где квартиры – это строчки, а их параметры – колонки. Подобный вид является обычным для больших данных. Именно такие таблицы затем передаются машине для обучения, цель которого – натренировать ее на предсказание цены квартиры в зависимости от значений параметров.
В опубликованном наборе данных часть параметров не зависит от времени: количество комнат, географическое положение дома, расстояние от квартиры до ближайшей атомной станции, музея и университета. Таких пунктов почти триста. То есть в таблицах будет три сотни колонок, описывающих каждую квартиру.
Стоит обратить внимание на то, что значения некоторых изменяющихся параметров могут записываться несколько раз в привязке ко времени. Например, уровень безработицы или рождаемости в стране в разные дни[11]
: