Читаем Профессиональный поиск в Интернете полностью

После включения режима распознавания лиц выяснилось, что на обоих поисковиках он работает отменно, сбоев не было. Яндекс нашел 102 портрета, Google – 282. Что же касается точности, то оба поисковика опростоволосились уже на первых страницах выдачи Яндекс показал Павла Поповича на 18-й позиции, а Google – неизвестную даму на 11-й. Информационно-мусорный «полураспад» наступил в Яндексе на четвертой странице (6 из 20 изображений не относились к теме). Заметим, что численное превосходство релевантных результатов на сервисе Яндекс.Картинки сохранилось до последней страницы выдачи Google в аналогичных условиях сдался уже на четвертой странице. Перелом был достаточно резкий: начиная с шестой-седьмой страницы в результатах можно было найти практически кого угодно, но только не космонавта Гагарина.

В случае использования цветовых фильтров при отборе портретов количество результатов предсказуемо и резко сокращается. Максимум результатов на Яндексе дала белая гамма. Правда, там было немало ложных срабатываний на картинки с белым фоном и обводками. Что касается остальных цветов, то Яндекс оказался достаточно требовательным: искомый цвет для прохождения фильтра должен быть преобладающим в изображении. Как и прежде, Google превосходил Яндекс в количестве результатов каждого цвета – у Google список выдачи после применения фильтра измерялся сотнями картинок. Однако нельзя не заметить, что Google демонстрирует другой, гораздо более либеральный подход к фильтрации: для прохождения фильтра на изображении достаточно простого присутствия объекта искомого цвета.

<p>Flickr</p>

В качестве примера системы поиска изображений рассмотрим принадлежащий Yahoo! проект фотохостинга Flickr – один из крупнейших в мире ресурсов такого плана. Количество изображений в его базе исчисляется многими миллионами. Данный проект предлагает практически все типичные для данного класса ресурсов инструменты поиска.

Поиск ведется только в собственной базе Flickr, изображения в которую загружаются пользователями ресурса. Необходимо помнить, что снимки на ресурсе могут быть как публичными, так и приватными. В последнем случае они доступны только владельцам и приглашенным пользователям.

На Flickr доступны простой и расширенный режимы поиска. Простой режим поиска, кроме поля ввода запроса, предлагает несколько фильтров. Область поиска определяется переключателями, расположенными над полем ввода запроса. При выборе одного из трех доступных вариантов (Photos, Groups, People) меняется содержимое расположенного рядом меню Search. Переключатель Photos позволяет вести поиск среди всех публичных изображений базы Flickr, в архивах персональных профилей, в загрузках пользователей из адресной книги вашего аккаунта или же в базе Getty Images, в которую попадают наиболее удачные снимки. При желании можно воспользоваться опциями, ограничивающими поиск введенного текста только описаниями фото или же присвоенными им тегами. Переключатель Groups позволяет найти тематические группы пользователей Flickr. Необходимо отметить, что последующий поиск в архивах таких тематических групп достаточно эффективен и позволяет добиться хороших результатов. Переключатель People предлагает поиск имен пользователей (рис. 7.3).

Рис. 7.3. Интерфейс простого поиска фотохостинга Flickr

Режим расширенного поиска предлагает поиск с использованием логических операторов и поиск по точной фразе. Присутствуют и дополнительные фильтры, позволяющие указывать тип нужного контента (фото, видео, рисунки), вести поиск по дате создания или загрузки изображения, включать «семейный фильтр», а также отбирать фотоработы, предоставленные по лицензии Creative Commons.

Страница результатов поиска предлагает просмотреть расположенные мозаикой миниатюры изображений. Предлагаются три режима отображения миниатюр, отличающиеся размером каждой миниатюры и подробностью текстового описания. Боковая панель страницы выдачи содержит список групп, изображения из архивов которых попали в результаты поиска, список фотографов, а также перечень географических местоположений, где были сделаны найденные снимки. Расширить или уточнить свой запрос можно с помощью инструмента Tag Clusters, в котором демонстрируется перечень тегов, отмечающих изображения текущей страницы выдачи.

<p>CBIR-системы</p>

Аббревиатура CBIR обозначает технологии поиска картинок, основанные на анализе характеристик изображенных на них объектов. Другими словами, CBIR-система пытается «рассмотреть» содержимое самой картинки.

Контентный анализ изображения нельзя назвать «горячей новинкой» – подобные технологии давно и активно используются в системах видеонаблюдения, более того, они давно работают за кулисами универсальных поисковиков в качестве части так называемых «семейных» фильтров. Экспериментальные машины просто дают пользователям контроль над таким режимом поиска и предлагают новые, оригинальные интерфейсы.

Перейти на страницу:

Похожие книги

Полное руководство по Microsoft Windows XP
Полное руководство по Microsoft Windows XP

В книге известного американского автора описывается среда ОС Windows XP и принципы ее функционирования, приведен сравнительный анализ Windows XP с предшествующими версиями операционной системы Windows. Рассматриваются вопросы применения и модификации нового интерфейса с целью получения прямого доступа ко всем функциям Windows XP обсуждаются варианты подключения к компьютерным сетям. Несколько разделов посвящены работе с реестром и конфигурационными файлами, мультимедийным функциям и разнообразным системным службам, а также методам решения проблем с программным обеспечением и оборудованием. Особое внимание уделено обеспечению безопасности операционной системы.Издание адресовано пользователям и сетевым администраторам, желающим активно применять возможности операционной системы Windows XP (в том числе и недокументированные).

Джон Поль Мюллер , Питер Нортон

ОС и Сети, интернет / ОС и Сети / Книги по IT
Недокументированные и малоизвестные возможности Windows XP
Недокументированные и малоизвестные возможности Windows XP

Книга содержит подробные сведения о таких недокументированных или малоизвестных возможностях Windows XP, как принципы работы с программами rundll32.exe и regsvr32.exe, написание скриптов сервера сценариев Windows и создание INF-файлов. Р' ней приведено описание оснасток, изложены принципы работы с консолью управления mmc.exe и параметрами реестра, которые изменяются с ее помощью. Кроме того, рассмотрено большое количество средств, позволяющих выполнить тонкую настройку Windows XP.Эта книга предназначена для опытных пользователей и администраторов, которым интересно узнать о нестандартных возможностях Windows. Тем более что довольно часто эти возможности позволяют обойти ограничения на те или иные функции Windows, установленные администратором. Р

Роман Александрович Клименко

ОС и Сети, интернет / ОС и Сети / Книги по IT