Очевидное применение этих принципов в разведывательной и охранной работе заключается в решении вопроса о том, достаточно ли человек связан с международным терроризмом, чтобы его можно было включить в список лиц, кому запрещены авиационные перелеты. Политики склоняются в сторону осторожности. Это означает принятие относительно большого количества неверных решений, которые доставят серьезные неудобства человеку, несправедливо рассматриваемому как опасному, потому что ему не разрешат летать, и это станет ценой за очень низкий уровень ложноположительных решений. В худшем случае следствием этого может стать террорист, тайно проносящий бомбу на борт самолета.
Другим примером является разработка алгоритмов для разведывательных служб, позволяющих извлекать информацию, касающуюся подозреваемых в терроризме, из неструктурированных цифровых коммуникационных данных. Если вы установите свои приоритеты слишком далеко в области ложноположительных решений, и результатом будет получение массы материала, не представляющего интереса для разведки. При этом окажется потрачено драгоценное время аналитика и будет существовать риск ненужного вторжения в частную жизнь.
Если же ваши приоритеты окажутся слишком далеко в области ложноотрицательных решений, риск того, что искомый материал не будет найден, а террористы ускользнут от внимания, возрастает. Невозможно найти оптимальное решение, не взвесив относительные потери за ложноположительные и за ложноотрицательные решения. Как мы увидим в следующей главе, одной из крайностей является так называемый принцип предосторожности, согласно которому риск причинения вреда людям означает невозможность наличия ложноположительных решений. Применение такого принципа сопряжено со значительными издержками[48]
.Дилемма ложноположительных и ложноотрицательных решений возникает с алгоритмами, которые должны разделять данные на категории. Такие алгоритмы обучаются на большом наборе исторических данных, где известно, к какой категории достоверности относится случай (например, уверенно подозреваю / не подозреваю), а затем искусственный интеллект разрабатывает наиболее эффективные индикаторы для использования в категоризации данных. Однако прежде, чем подобный алгоритм будет внедрен в эксплуатацию, точность его выводов должна быть оценена по известным характеристикам входных данных. Установка на то, чтобы 95 % алгоритмических решений были правильными по сравнению с известными обучающими данными, приведет, вероятно, к проблемам в зависимости от соотношения ложноположительных и ложноотрицательных результатов в результате ошибки, связанной с каждым из них. Одним из способов оценки точности алгоритма в выполняемой им задаче является определение его точности как числа истинных положительных результатов, получаемого как доли положительных результатов, которые алгоритм считает обнаруженными в обучающих данных. Точность часто измеряется как количество истинных положительных и отрицательных результатов в пропорции к общему числу в обучающем наборе. Современный статистический метод, полезный при работе с большими массивами данных, заключается в построении диаграммы количества ложных срабатываний и ложных отрицаний, ожидаемых при каждой установке правила, и просмотра области под результирующей кривой как меры общего успеха в задании[49]
.