Городские системы видеонаблюдения – это специальные аппаратно-программные комплексы[386]
, состоящие из тысяч камер (в крупных городах) и подключенные к системам распознавания лиц и разнообразным базам данных, например принадлежащих Федеральной налоговой службе или Интерполу. Они способны, к примеру, вычислять уклоняющихся он уплаты налогов, больных с повышенной температурой (с помощью тепловизора) и находящихся в розыске. Алгоритмы распознавания лиц на фотографиях (в частности, вышеупомянутый FindFace) сравнивают изображения с камер с фотографиями, опубликованными в интернете, например в социальных сетях, а также в базах данных, например паспортных, и с высокой точностью определяют сходство[387].Базы лиц
Существуют наборы фотографий людей, предназначенные для обучения систем распознавания лиц. К наиболее известным можно отнести Microsoft Celeb (8,2 млн снимков, собранных из открытых источников), Duke MTMC (2 млн снимков), Brainwash (фотографии посетителей одноименного кафе в Сан-Франциско), Oxford Town Centre (анализ записей камеры наблюдения[388]
) и др.[389] Компании и учебные заведения, отвечающие за сбор таких баз данных, утверждают, что на снимках зафиксированы лишь публичные фигуры, хотя в действительности там обнаружены фотографии людей, которые вряд ли ожидали себя увидеть в такой базе, в том числе журналистов, которые пишут об ИБ[390]. Многие базы данных собираются без ведома людей, чьи лица попали в кадр, и используются такими компаниями, как SenseNets, для слежки за людьми. Крупные социальные сети, например Facebook, Qzone, Weibo или «ВКонтакте», стремятся собирать как можно больше информации о своих пользователях. Вероятно, поэтому именно такие компании обладают крупнейшими базами лиц (вкупе с остальными персональными данными пользователей)[391],[392].Среди технологий распознавания лиц можно выявить две основные:
■ «Классическая» – используется тот же принцип, что в дактилоскопических исследованиях, когда нужно заранее снять эталонные отпечатки пальцев, а затем сравнивать с ними все получаемые в дальнейшем. Здесь сравниваются некие ранее сохраненные маркеры: расстояние между глазами, форма носа или губ и т. п. Для распознавания нужны качественные фотографии, сделанные при хорошем освещении. Получить их можно, например, при сканировании документов в центре государственных услуг или при фотографировании для оформления, скажем, загранпаспорта. Такие системы ошибаются часто: достаточно не смотреть в камеру, надеть бейсболку, светоотражающую одежду или солнцезащитные очки.
■ Новая технология GaussianFace, развиваемая крупнейшими компаниями, такими как Facebook и Google, включает алгоритмы машинного обучения и использует все доступные в интернете источники информации. В этом случае маркеры не нужны, так как система учитывает все особенности человека: форму тела, походку, осанку, одежду, татуировки и т. п. Чем больше фотографий человека опубликовано в интернете, тем точнее будет результат распознавания. Даже если человек не пользуется социальными сетями, его фотоизображения могут публиковать друзья и близкие. Также могут использоваться источники в государственных и коммерческих структурах со сканами его документов[393]
.