Читаем Общество контроля. Как сохранить конфиденциальность в эпоху тотальной слежки полностью

Возможно, неврологам, программистам и другим людям, которые лучше меня разбираются в сложных научных и технологических аспектах распознавания лиц, знакомо приведенное ниже описание. Не исключено, они даже сочтут его упрощением. Но я не ученый, и эта книга предназначена для непрофессиональных читателей. Надеюсь, они не станут забегать вперед или скрежетать зубами, но продолжат читать. Я надеюсь, следующий раздел книги послужит полезным руководством по объяснению широкой публике опасности этих технологий.

Первым шагом в распознавании лиц является операция по определению лица в кадре, а первым шагом к тому и другому – обучение. Программисты показывают программе множество изображений и сообщают ей: это именно лица. Затем программа может сделать вывод, что подобные объекты на будущих фотографиях – круглые, с двумя круглыми впадинами, отражающими свет и расположенными над центральным выступом, с другими выступами по бокам и линией или открытым пространством под центральным выступом – по всей вероятности, тоже будут представлять собой лица (видимо, это глаза, нос, уши, рот).

Когда речь идет о современных алгоритмах, использующих глубинное обучение или нейронные сети, даже для их создателей остается загадкой, как именно эти программы приходят к такому выводу, да и вообще к любому выводу. Нельзя сказать, что это совсем удивительно: ведь мы до сих пор не понимаем, как на детальном уровне принятия решений функционирует человеческая нейронная сеть (которую мы называем мозгом). Эти алгоритмы в некотором смысле являются черными ящиками, и мы судим о них по достигнутым результатам, а не по тем маршрутам, которыми они добираются до цели.

Такого рода непрозрачные алгоритмы могут быть блестящими и эффективными, но они противоречат праву на очную ставку с обвинителем, которое занимает центральное место в судебной процедуре. Если этот обвинитель представляет собой сложную нейронную сеть, точное функционирование которой невозможно объяснить (и которой, в отличие от человека, использующего сложную нейронную сеть между ушами, не возразишь и ничего не докажешь), то указанное право нарушается.

Камера вашего телефона в режиме реального времени определяет, что в кадре находится лицо. Если вы готовитесь сделать снимок, вокруг лиц на экране появляются прямоугольники или круги. Когда это происходит, программное обеспечение камеры, по сути, говорит вам, что данный набор признаков – под признаками мы понимаем не черты конкретного лица, а определенные шаблоны: градации цвета относительно других градаций цвета на изображении, в том числе пятна белого вокруг темной сердцевины (глаза), над выступом, который улавливает или затеняет свет (нос), и т. д. – с большой вероятностью составляет то, что программа, основываясь на предыдущем опыте, понимает как человеческое лицо.

Затем алгоритмы определяют, как расположено изображение лица, например, анфас или в профиль. Обычно программа понимает, что в кадре именно лицо, даже тогда, когда оно плохо освещено, опущено вниз, повернуто в профиль или в сторону от камеры. Но для того, чтобы сравнить такое изображение со снимком из базы данных, обычно сделанным в условиях сотрудничества (когда объект смотрит прямо на камеры), необходимо повернуть его в позицию, как можно более близкую к прямолинейной. Большинство программ делает это быстро.

Затем программа переводит цветное изображение лица в шкалу серого. Избавившись от красок, алгоритм остается только с градациями яркости. Затем он будет искать на изображении уникальные опорные совпадения, которые в совокупности образуют уникальное лицо. Какие именно совпадения, зависит от алгоритма, но чаще всего речь идет о расстояниях: между глазами, от одной стороны подбородка до другой, от переносицы до кончика носа и т. д. – десятки маркеров расстояния. Алгоритм сравнивает эти уникальные особенности с теми, которые есть на лицах людей в его базе данных, и определяет вероятность их соответствия.

Внедрение сверточных нейронных сетей, о которых я расскажу позже, значительно повысило точность распознавания лиц по сравнению со старым методом, основанным исключительно на сравнении линейных расстояний между точками на лицах в файле. Тем не менее, насколько я знаю, большинство систем распознавания лиц еще не достигли золотого стандарта один к одному в естественных условиях, то есть они не всегда могут идентифицировать человека, когда тот проходит мимо камеры в своем обычном темпе, скрытый или плохо освещенный. Но они научатся.

Кроме того, эта способность распознавания не ограничивается лицами. В Израиле я видел систему, обученную распознавать походку и телосложение, а следовательно – идентифицировать человека со спины или без четкого снимка лица. Китайские системы определяют возраст и пол, их также обучают считывать эмоции. А современные программы, использующие машинное обучение и нейронные сети, совершенствуют сами себя: как и мы, они умеют учиться.

Перейти на страницу:

Похожие книги