Целью ИПС является выдача документов,
Информационная
потребность
?
Формулировка
информационного
запроса
?
Поисковое
предписание
? Релевантность Релевантность ?
содержательная формальная
: Документы
?
Индексирование
?
Поисковый
массив
В автоматизированных системах поиск основан на формальной релевантности, содержательная релевантность в них определяется, например, путем экспертных оценок и используется для получения данных об
В рассматриваемом примере при выборе в качестве критерия выдачи полного совпадения ключевых слов документа и запроса клиенту должны быть предоставлены письма персонажей, полностью отвечающих его требованиям. Навряд ли это их удовлетворит, так как явно выбор будет не слишком велик. Этот критерий больше бы подошел для системы, где необходима точность, например, определяющей выбор лекарства при лечении определенной болезни (пусть их будет немного, зато все подходящие), здесь же, наверное, уместен критерий на пересечение.
Дескрипторам могут быть приданы весовые коэффициенты в зависимости от степени их соответствия запросу; при поиске коэффициенты дескрипторов, обнаруженных и в запросе и в документе, суммируются, и документы выдаются в зависимости от значения этой суммы (например, если она превысила некоторое значение). Таким образом, если указать, что наиболее весомыми являются характеристики
Идеальная ИПС должна выдавать документы, содержательно релевантные запросу, и ничего кроме них. Однако на практике это обычно не достигается, наблюдаются молчание ИПС (невыдача некоторого количества релевантных документов) и шум (выдача лишних документов). Массив документов разделяется на выданные и невыданные - по одному критерию, и на релевантные и нерелевантные - по другому.
Таким образом, для каждого запроса получаем 4 группы документов:
Соотношение количества документов в каждой из этих групп определяет эффективность информационного поиска. Для оценки эффективности используют следующие характеристики:
Рв
Полнота выдачи =
tabletable--
х 100%
Рв+Рн
Рв
Точность выдачи =
tabletable--
х 100%
Рв+Нв
Рн
Потери информации =
tabletable--
х 100%
Рв+Рр
Нв
Информационный шум =
tabletable--
х 100 %
Рв+Нв
Рв
Чувствительность =
tabletable--
x 100 %
Рв+Рн
Нн
Специфичность =
tabletable--
x 100%
Нн+Нв