Читаем Профессиональный поиск в Интернете полностью

В общем виде CBIR-система, как и обычный поисковик, работает в два этапа: индексирование и собственно поиск по запросу пользователя. На первом этапе каждое изображение описывается и заносится в базу данных. Как мы уже выяснили, обычные интернет-поисковики ориентируются на тексты содержащих изображения веб-страниц, имена графических файлов и другие косвенные признаки. В отличие от них CBIR-система с помощью специальных алгоритмов анализирует характеристики самого изображения – его цветовую гамму, композицию, очертания предметов и другие подобные признаки. Есть принципиальные отличия и на этапе поиска картинок. Поскольку индексируемые признаки у CBIR-поисковиков не совсем обычные, то и предлагаемые пользователям инструменты составления запросов заметно отличаются от привычных форм с полями ввода ключевых слов.

В настоящее время различают несколько основных типов CBIR-систем, которые отличаются способом составления поискового запроса.

Первый вариант – уточнение запроса путем отбора похожих изображений пользователем. Сначала в базе системы по ключевым словам находится некоторое подмножество картинок нужной тематики, после чего пользователь выбирает среди них похожие на то, что он хотел бы увидеть в итоге. Ориентируясь на эти указания, поисковик предлагает новый набор картинок, отобранный по образцу одобренных пользователем изображений.

Второй тип CBIR-систем позволяет вести поиск изображений по точно заданными визуальным параметрам. В этом случае пользователь указывает точные значения различных характеристик необходимого изображения, которые затем сравниваются с имеющимися в базе поисковика.

Третий тип CBIR-систем работает с графическим запросом. Системе предъявляется некий образец, она производит его анализ, после чего проводит в своей индексной базе поиск изображений со сходными параметрами.

<p>Tiltomo</p>

Финский экспериментальный поисковик Tiltomo является примером реализации технологии уточнения запроса с помощью похожих изображений. Разработчики Tiltomo решили не тратить ресурсы на формирование самостоятельной базы изображений, а предпочли работать с готовой базой фотохостинга Flickr. Здесь действует ограничение – поиск идет не во всей многомиллионной базе Flickr, а в тестовой выборке, объем которой постоянно увеличивается и в настоящее время составляет несколько сотен тысяч фото.

Поиск начинается вводом ключевого слова-тега, которое нужно для формирования первоначальной выборки снимков с различными визуальными характеристиками. Начинать поиск можно также со случайного набора снимков, предлагаемого системой.

Интерфейс выдачи Tiltomo максимально прост. Пользователь работает со страницей, содержащей пару десятков миниатюр фотоснимков, сопровожденных несколькими ссылками-переключателями (рис. 7.4). Далее доступны два варианта действий: уточнение темы запроса и поиск по характеристикам изображения. Для уточнения темы достаточно выбрать понравившийся снимок-пример и щелкнуть на ссылке Find Similar by Theme, которая находится под каждой миниатюрой. Допустим, вам требуются фотоснимки обычных съедобных яблок – никаких проблем, выбирайте соответствующий образец и получайте новую страницу результатов, на которой все снимки будут содержать изображения яблок в различных ситуациях и ракурсах.

Рис. 7.4. Поисковик Tiltomo позволяет подбирать визуально похожие изображения

Другой инструмент поиска, запускаемый ссылкой Find Similar by Color/Texture, призван искать изображения, схожие по характеристикам цвета и очертаний. Получив такую обратную связь, поисковик ищет в своей базе картинки, визуальные индексы которых близки к отобранным изображениям. В результате пользователь получает новый список выдачи, картинки в котором визуально похожи на указанный им пример. Цикл может повторяться несколько раз, напоминая обычное уточнение запроса на универсальном поисковике, только инструментами здесь выступают не дополнительные ключевые слова, а содержимое изображения. Попадания могут быть достаточно точными – если, допустим, на снимке-образце была лужайка, мы получим набор фотоснимков с изображением различных зеленых растений. Справедливости ради заметим, что «тематический» фильтр при этом начинает давать сбои, поэтому для получения максимально точного результата приходится повторять поиск несколько раз.

Использование переключателей позволяет Tiltomo достойно справляться со словами-синонимами. Для примера: в списке выдачи по запросу «apple» система позволяет уточнить, что имеется в виду: продукция компьютерной компании Apple, яблоки и яблони разных сортов или же фотографии. Нью-Йорка, известного также как «Big Apple».

<p>Retrievr</p>
Перейти на страницу:

Похожие книги

Полное руководство по Microsoft Windows XP
Полное руководство по Microsoft Windows XP

В книге известного американского автора описывается среда ОС Windows XP и принципы ее функционирования, приведен сравнительный анализ Windows XP с предшествующими версиями операционной системы Windows. Рассматриваются вопросы применения и модификации нового интерфейса с целью получения прямого доступа ко всем функциям Windows XP обсуждаются варианты подключения к компьютерным сетям. Несколько разделов посвящены работе с реестром и конфигурационными файлами, мультимедийным функциям и разнообразным системным службам, а также методам решения проблем с программным обеспечением и оборудованием. Особое внимание уделено обеспечению безопасности операционной системы.Издание адресовано пользователям и сетевым администраторам, желающим активно применять возможности операционной системы Windows XP (в том числе и недокументированные).

Джон Поль Мюллер , Питер Нортон

ОС и Сети, интернет / ОС и Сети / Книги по IT
Недокументированные и малоизвестные возможности Windows XP
Недокументированные и малоизвестные возможности Windows XP

Книга содержит подробные сведения о таких недокументированных или малоизвестных возможностях Windows XP, как принципы работы с программами rundll32.exe и regsvr32.exe, написание скриптов сервера сценариев Windows и создание INF-файлов. Р' ней приведено описание оснасток, изложены принципы работы с консолью управления mmc.exe и параметрами реестра, которые изменяются с ее помощью. Кроме того, рассмотрено большое количество средств, позволяющих выполнить тонкую настройку Windows XP.Эта книга предназначена для опытных пользователей и администраторов, которым интересно узнать о нестандартных возможностях Windows. Тем более что довольно часто эти возможности позволяют обойти ограничения на те или иные функции Windows, установленные администратором. Р

Роман Александрович Клименко

ОС и Сети, интернет / ОС и Сети / Книги по IT