Читаем Внедрение искусственного интеллекта в бизнес-практику. Преимущества и сложности полностью

Однако важен не только используемый алгоритм, но и принцип обучения создаваемых моделей. Модели обучения с учителем (на сегодняшний день наиболее распространенные в бизнесе) учатся на основе набора тренировочных данных с маркированным результатом. Например, модель машинного обучения, которая пытается предсказать мошенничество в банке, необходимо учить на системе, где мошенничество в некоторых случаях было однозначно установлено. Это непросто, поскольку частота мошенничества может составлять 1 случай на 100 000, и порой эту проблему называют проблемой несбалансированности классов.

Обучение с учителем очень похоже на традиционный аналитический метод регрессионного анализа, который используется в модели оценки. Цель регрессионного анализа заключается в том, чтобы создать модель, предсказывающую известный результат, используя набор входных переменных с известными значениями, которые могут быть связаны с этим результатом. Когда модель разработана, ее можно использовать для предсказания неизвестного результата на основе известных значений тех же входных переменных. Например, можно разработать регрессионную модель, предсказывающую вероятность заболевания диабетом в зависимости от возраста пациента, уровня его физической активности, количества потребляемых калорий и индекса массы тела. При разработке этой модели мы будем ориентироваться на пациентов, которые уже заболели или не заболели диабетом, используя все доступные данные для построения регрессионной модели. Обнаружив хорошую предсказательную регрессионную модель, мы сможем использовать ее на новом наборе данных, чтобы предсказать неизвестный результат – вероятность заболевания диабетом в зависимости от определенных значений входных переменных. Это называется скорингом (как в регрессионном анализе, так и в машинном обучении).

Регрессионный процесс напоминает машинное обучение с учителем, но имеет ряд особенностей:

 В машинном обучении данные, используемые для разработки (тренировки) модели, называются тренировочными данными и могут представлять собой подмножество данных, необходимых исключительно для тренировки системы.

 В машинном обучении тренировочная модель часто утверждается при помощи другого подмножества данных, для которого известен подлежащий предсказанию результат.

 В регрессионном анализе может и не возникнуть желание использовать модель для предсказания неизвестных результатов, тогда как в машинном обучении наличие этого желания подразумевается.

 В машинном обучении может использоваться множество различных алгоритмов, которые не ограничиваются простым регрессионным анализом.

Модели обучения без учителя, как правило, более сложны в разработке. Они распознают закономерности в данных, которые не маркированы заранее и для которых неизвестен результат. Третий способ обучения, обучение с подкреплением, предполагает, что система машинного обучения имеет определенную цель и каждое продвижение к этой цели вознаграждается. Такой способ весьма полезен в играх, однако он также требует огромного объема данных (и из-за этого порой теряет практичность)[15]. Важно отметить, что модели машинного обучения с учителем обычно не учатся непрерывно: они учатся на основе набора тренировочных данных, а затем продолжают использовать ту же модель, если только не задействуется новый набор тренировочных данных, на основе которого обучаются новые модели.

Модели машинного обучения опираются на статистику. Оценить их растущую ценность можно в сравнении с традиционной аналитикой. Как правило, они точнее традиционных «кустарных» аналитических моделей, основанных на человеческих предположениях и регрессионном анализе, но при этом они сложнее и хуже поддаются интерпретации. Автоматизированные модели машинного обучения могут создаваться намного быстрее и описывать более детализированные наборы данных, чем в случае с традиционным статистическим анализом. При наличии необходимого объема данных для обучения модели глубокого обучения очень хорошо справляются с такими задачами, как распознавание изображений и голоса. Они работают гораздо лучше, чем ранние автоматизированные системы для решения этих задач, а в некоторых сферах их возможности уже сравнимы с человеческими или даже превосходят их.

Обработка естественного языка (ОЕЯ)

Перейти на страницу:

Похожие книги

IT-рекрутмент. Как найти лучших специалистов, когда все вокруг горит
IT-рекрутмент. Как найти лучших специалистов, когда все вокруг горит

Специалисты в области информационных технологий сегодня нарасхват, и потребность в них в ближайшие годы будет только расти. Поиск разработчиков, тестировщиков, аналитиков и администраторов для компаний самых разных профилей — нетривиальная задача даже для опытных рекрутеров. Достойные специалисты требуют особого подхода: рекрутеру нужно ориентироваться в отрасли, обладать базовыми знаниями в IT-сфере, иначе выстраивать коммуникацию. Как научиться говорить с айтишниками на одном языке, пишет Егор Яценко — один из самых авторитетных российских IT-рекрутеров, энтузиаст и популяризатор новой профессии. Он дружелюбно и иронично объясняет, как быстро искать и убеждать кандидатов, рассказывает о секретах эффективного рекрутинга и закономерностях, которые узнал на собственном опыте. Но самое главное — эта книга поможет начинающим и даже опытным рекрутерам сохранить здравомыслие в любых обстоятельствах.«Как только появилась такая отрасль, как IT, рекрутерам пришлось искать специалистов для нее. Чаще всего в работе применялись те же инструменты и средства, что и в обычном рекрутменте, который далеко не всегда был передовым и технологичным. Чего уж там говорить — даже база кандидатов зачастую не велась».«Какой вывод из этого напрашивается? К черту рекрутеров. К черту компании, в которых работают непрофессиональные рекрутеры, путающие Java и JavaScript (да-да, это очень старая шутка, но даже в 2022 году встречаются люди, считающие, что это один и тот же язык программирования)».«Когда-то, когда я искал рекрутера к себе в компанию, я решил "по науке" составить профиль кандидата и расписать все качества и умения, которые должны у него быть, пояснив, каким образом я буду оценивать эти качества. Получился список из 43 пунктов. Только вдумайтесь: из 43!»Для когоДля рекрутеров и эйчаров, специалистов кадровых служб, как уже работающих в найме IT-специалистов, так и еще только планирующих перейти в эту сферу. Заинтересоваться профессией IT-рекрутера могут и выпускники вузов (причем не только технических), и абитуриенты, и представители других профессий, решившие перепрофилироваться.

Егор Яценко

Маркетинг, PR / Менеджмент / Финансы и бизнес