Читаем Как мы видим? Нейробиология зрительного восприятия полностью

Второй подход основан на машинном обучении и все больше начинает напоминать работу человеческого мозга. На данный момент кажется, что за этим подходом будущее. Именно он приводит в ужас защитников конфиденциальности. Назовем все версии на основе ИИ «умными» методами – потому что они имитируют работу нашего мозга, а я считаю мозг умной системой, – и дальше я сосредоточусь главным образом на них. На сегодняшний день именно умные методы доминируют в области распознавания лиц.

Задача алгоритма распознавания лиц состоит из двух основных шагов: сначала определить наличие лица, а затем установить, кому оно принадлежит. Первая задача называется обнаружением лица, вторая – идентификацией. Умные и глупые методы начинают с одинаковой исходной проблемы: им нужно проанализировать визуальную сцену со множеством различных объектов – например, в отделе мужской одежды в универмаге Macy’s, чтобы определить, есть ли там лица, и изолировать эти лица для дальнейшего анализа.

Но прежде, чем искать лица, компьютеру нужно подготовить изображение, сделать его максимально четким (для себя). Эти шаги, предшествующие запуску алгоритма обнаружения лиц, собирательно называются предварительной обработкой[30]. Существует множество разных способов улучшить четкость изображения, как это знает каждый, кому приходилось работать с Adobe Photoshop. Вот два примера. Во-первых, большинство естественных сцен имеют неравномерную освещенность: на открытом воздухе солнце создает тени и блики; в отделе мужской одежды Macy’s то же самое делает подсветка витрин. Благодаря особым свойствам нашего зрительного анализатора мы не замечаем различий в освещенности, чего нельзя сказать о цифровой камере в смартфоне или компьютере. Их педантичный цифровой анализатор воспринимает один и тот же по-разному освещенный объект как два разных объекта. Следовательно, первая операция по нормализации – «выравнивание» яркости. Компьютер вычисляет среднюю яркость всего изображения (иногда используя для этого мудреные средне-подобные величины) и затем корректирует яркость различных участков изображения так, как если бы вся сцена была равномерно освещена одинаковым источником света. Во-вторых, в большинстве случаев выполняется выделение краев, потому что, как мы уже не раз говорили, именно края несут основную информацию об объектах.

Подготовив изображение, компьютер может приступить к поиску лиц. Существует несколько способов это сделать. Один из наиболее любопытных, который отчасти копирует работу нейронных сетей в зрительной коре мозга, называется методом HOG (Histogram of Oriented Gradients), или гистограммой направленных градиентов.

В нашем случае градиент – это переход между ярким и менее интенсивным цветом, то есть мы имеем участок изображения (край), одна сторона которого яркая, а другая – тусклая. Другими словами, градиент показывает не только наличие края, но и его направление – внутрь или наружу. Компьютер измеряет все возможные градиенты на изображении, определяет их направление и отображает их все в виде карты.

На рисунке на следующей странице представлен пример такого редуцированного HOG-изображения. Чтобы его получить, алгоритм разбил исходное изображение на небольшие квадраты, 16×16 пикселей каждый. В каждом квадрате он вычислил градиенты по всем основным направлениям (вверх, вниз, по диагонали и т. д.) и затем заменил изображение в каждом квадрате его сжатой репрезентацией – обычной линией, показывающей направление края, наиболее выраженное в данной ячейке.

На самом деле здесь вы видите своего рода усредненную, универсальную HOG-структуру лица, созданную на основе множества изображений лиц. Такой шаблон удобно использовать для обнаружения лиц в толпе. Для этого компьютер преобразует каждый участок изображения толпы – каждый квадрат пикселей, размер которого примерно соответствует размеру лица, – в HOG-карту. После чего перемещает универсальный HOG-шаблон по всему преобразованному изображению, сравнивая локальные HOG-квадраты с шаблоном. Большинство квадратов будет содержать беспорядочную мозаику краев. Но некоторые из них приблизительно совпадут с HOG-шаблоном и, следовательно, будут идентифицированы алгоритмом как лица. Конечно, это не позволяет нам идентифицировать, кому именно принадлежит лицо. Но зато мы получаем изображение лица, которое можно преобразовать в стандартный формат и использовать как ввод для последующих шагов классификатора, которому гораздо проще работать с такими входными данными, чем с необработанными изображениями. Таким образом, алгоритм взял беспорядочную мешанину пикселей – отображающую визуальную сцену с толпой – и вычленил из нее несколько локальных массивов пикселей, которые предположительно являются лицами.



Перейти на страницу:

Похожие книги

Об интеллекте
Об интеллекте

В книге Об интеллекте Джефф Хокинс представляет революционную теорию на стыке нейробиологии, психологии и кибернетики, описывающую систему «память-предсказание» как основу человеческого интеллекта. Автор отмечает, что все предшествующие попытки создания разумных машин провалились из-за фундаментальной ошибки разработчиков, стремившихся воссоздать человеческое поведение, но не учитывавших природу биологического разума. Джефф Хокинс предполагает, что идеи, сформулированные им в книге Об интеллекте, лягут в основу создания истинного искусственного интеллекта – не копирующего, а превосходящего человеческий разум. Кроме этого, книга содержит рассуждения о последствиях и возможностях создания разумных машин, взгляды автора на природу и отличительные особенности человеческого интеллекта.Книга рекомендуется всем, кого интересует устройство человеческого мозга и принципы его функционирования, а также тем, кто занимается проблемами разработки искусственного интеллекта.

Джефф Хокинс , Сандра Блейксли

Научная литература / Прочая научная литература / Образование и наука
Российские университеты XVIII – первой половины XIX века в контексте университетской истории Европы
Российские университеты XVIII – первой половины XIX века в контексте университетской истории Европы

Как появились университеты в России? Как соотносится их развитие на начальном этапе с общей историей европейских университетов? Книга дает ответы на поставленные вопросы, опираясь на новые архивные источники и концепции современной историографии. История отечественных университетов впервые включена автором в общеевропейский процесс распространения различных, стадиально сменяющих друг друга форм: от средневековой («доклассической») автономной корпорации профессоров и студентов до «классического» исследовательского университета как государственного учреждения. В книге прослежены конкретные контакты, в особенности, между российскими и немецкими университетами, а также общность лежавших в их основе теоретических моделей и связанной с ними государственной политики. Дискуссии, возникавшие тогда между общественными деятелями о применимости европейского опыта для реформирования университетской системы России, сохраняют свою актуальность до сегодняшнего дня.Для историков, преподавателей, студентов и широкого круга читателей, интересующихся историей университетов.

Андрей Юрьевич Андреев

История / Научная литература / Прочая научная литература / Образование и наука