Социальное индексирование изображений – способ хороший, однако не лишенный недостатков. Если в случае автоматического индексирования мы зависим от алгоритмов универсального поисковика, то здесь мы вынуждены полагаться на мастерство и добросовестность авторов. А индексаторская квалификация у владельцев картинок разная. У кого-то получается лучше, у кого-то хуже. Не надо забывать, что для описания близких по содержанию картинок разные авторы могут использовать различные ключевые слова. Кроме того, совершенно не факт, что автор картинки посчитает достойными индексирования именно интересные вам признаки. Свою роль может сыграть и фактор времени. Хорошо если человек загружает за один сеанс несколько фотографий – можно спокойно подумать над хорошим подбором тегов. А если таких снимков сотня? Скорее всего, всякий нормальный человек сэкономит время, в результате чего вся подборка будет описана всего несколькими общими тегами, и только некоторые фото удостоятся подробного описания. Такое сокращение поисковых признаков неизбежно сказывается на качестве будущего поиска.
Третья «генеральная» технология поиска, так называемая технология CBIR (Content Based Image Retrieval – поиск изображений по содержанию), делает ставку на системы автоматического распознавания изображений, которые работают напрямую с картинкой и индексируют такие ее параметры, как цвет, очертания изображенных объектов, их взаимное расположение.
Далее мы рассмотрим возможности поиска изображений с помощью вертикальных баз крупнейших универсальных поисковиков, попробуем определиться с качеством их поиска, а затем познакомимся с лучшими представителями семейства современных CBIR-поисковиков.
Для оценки качества работы универсальных поисковиков мы прибегнем к тестовому поиску по одинаковым запросам. Конечно, абсолютно исчерпывающим результат такого исследования не будет, однако предлагаемый подход хорош тем, что максимально приближен к повседневной работе и может быть легко воспроизведен: вам останется только подобрать собственные запросы из хорошо известной тематической области. Работать мы будем только с русским языком, а «семейные» фильтры отключим. Кроме того, тестовые запросы будут выполняться без входа в персональные аккаунты – в Google эта операция способна заметно повлиять на результаты выдачи.
Google Картинки
Google Картинки – один из основных сервисов Google, ориентированный на поиск изображений, находящийся в постоянном развитии. В последнее время он заметно изменился и усовершенствовался, продолжая оставаться одним из самых популярных и мощных средств поиска изображений, обеспечивая широкий охват за счет больших объемов индексных баз. Доступно две версии такого поиска: усовершенствованная, которая сейчас является стандартной, и упрощенная. Отличаются они в основном внешним видом страницы выдачи, возможности формулирования запроса у них одинаковые.
Изображения в Google можно искать в режимах простого и расширенного поиска. При вводе запроса в режиме простого поиска действуют инструменты, привычные по обычному текстовому веб-поиску: предложения по дополнению запроса и виртуальная клавиатура.
Форма расширенного поиска состоит из двух блоков: стандартного для всех поисковых продуктов Google и специфического блока, содержащего инструменты, необходимые именно для поиска изображений. Стандартный блок предлагает поля поиска по всем словам, по любым указанным словам, по точной фразе, а также поле исключения определенных слов. Специфический блок содержит большее количество инструментов. Кроме привычного фильтра поиска по конкретному сайту или домену, остальные инструменты позволяют описать различные характеристики нужных изображений.
Фильтр Типы картинок позволяет искать изображения, содержащиеся только в новостных сообщениях. Помимо этого, здесь можно увидеть работу новых инструментов Google, проводящих определенный контентный анализ изображения. С их помощью можно отбирать только цветные или только черно-белые изображения, фотографии или клипарт. Кроме того, в системе реализован механизм распознавания лиц, соответственно, возможен отбор таких изображений.