Читаем Свод знаний по управлению бизнес-процессами: BPM CBOK 4.0 полностью

● Статистическое моделирование подразумевает математическое уравнение, связывающее входы с выходами. В противоположность этому, машинное обучение и глубокое обучение не пытаются найти такое уравнение, а просто пытаются воспроизвести выходные данные по входным.

● Статистическое моделирование требует понимания используемых переменных и делает предположения о вероятностном распределении данных, а машинное обучение и глубокое обучение – нет.

8.3.2.2. Методы машинного обучения

Для обучения машин, как и для обучения людей, могут использоваться разные методы: с наблюдением, без наблюдения, с частичным наблюдением, с мотивацией, перенос знаний.


Обучение с наблюдением

При обучении с наблюдением преподаватель показывает, как правильно играть на пианино, а как неправильно. В идеале количество правильных и неправильных примеров равно. В случае машинного обучения данные состоят из целевой или результирующей (зависимой) переменной, которую требуется предсказать исходя из набора предикторов – независимых переменных. Используя эти наборы переменных, вы создаете функцию, которая сопоставляет входные данные с требуемыми выходными данными. Процесс обучения продолжается, пока модель не достигнет требуемого качества. Примером обучения с наблюдением являются заявки на получение кредита (предикторами здесь могут служить кредитная история, трудовая биография, владение активами, доход, образование), которые были или одобрены, или отклонены (целевые результаты и решения).


Обучение без наблюдения

При обучении без наблюдения вы предоставлены сами себе, никто не говорит вам, как играть на пианино. Вы составляете собственное представление о правильном и неправильном и оптимизируете параметры, которые считаете важными, такие как скорость завершения пьесы, соотношение громких и тихих нот или количество нажатий на клавиши. При машинном обучении без наблюдения к точкам данных не приклеены ярлыки правильно или неправильно. Цель в этом случае – каким-то образом организовать данные или описать их структуру. Организация данных может заключаться в их группировке в кластеры или в представления сложных данных таким образом, чтобы они выглядели более простыми или структурированными. Обучение без наблюдения обычно дает результат хуже, чем обучение с наблюдением, но без него не обойтись там, где нет ярлыков (другими словами, если правильные ответы неизвестны). Распространенный бизнес-пример – сегментация рынка. Часто бывает неясно, на какие сегменты делится рынок, и маркетологи ищут сегменты, объединенные естественными признаками, чтобы нацелить на них соответствующие слоганы, рекламные акции и товары.


Обучение с частичным наблюдением

Сочетание обучения с наблюдением и без наблюдения. Обучение с частичным наблюдением используется там, где наблюдаемых данных недостаточно. В примере с пианино вы получаете какие-то инструкции, но их немного (например, из-за того, что уроки дорогие или преподавателей не хватает).


Обучение с мотивацией

При обучении с мотивацией преподаватель не говорит вам, как правильно и неправильно играть на пианино. Вы не знаете, какой параметр вы пытаетесь оптимизировать, но вам говорят, когда вы делаете правильно, а когда неправильно. Инструктор бьет вас линейкой по пальцам, когда вы играете не ту ноту или не в том темпе. Если вы играете хорошо, вас похлопывают по плечу. Машинное обучение с мотивацией полезно в ситуациях, когда наблюдаемые данные скудны, но правильный ответ известен. Например, в шахматной игре слишком много вариантов ходов, чтобы все их задокументировать (приклеить ярлыки). Но обучение с мотивацией все же способно подсказать машине, когда она принимает правильные решения, приближающие победу, например взятие фигуры или усиление позиции.


Перенос знаний

Перенос знаний имеет место, когда вы используете свои знания игры на другом инструменте, например на трубе, чтобы научиться играть на пианино. Вы обучаетесь, используя уже приобретенные навыки, такие как умение читать ноты и гибкость пальцев. В машинном обучении перенос знаний используется для сокращения времени обучения, которое в случае моделей глубокого обучения может быть значительным (часы или даже дни).

8.3.2.3. Алгоритмы машинного обучения

Алгоритмы машинного обучения превращают набор данных в модель. Наиболее подходящий тип алгоритма определяется типом задачи, располагаемыми вычислительными ресурсами и характером данных.

Основные типы алгоритмов приведены в следующей таблице.



Следующая таблица показывает связь типов алгоритмов с методами обучения моделей [Hartanto 2019].




Следующий рисунок иллюстрирует концепцию моделей глубокого обучения, основанных на нейронных сетях.



Перейти на страницу:

Похожие книги