Субъект-субъектная версия коллаборативной фильтрации лишена этого недостатка. Клиент может запросить набор произведений, высоко оцененных его кругом рекомендателей, и обнаружить что-то совершенно новое.
Сотрудники Amazon сообщают, что справились с рядом недочетов пообъектной коллаборативной фильтрации, разработав собственную оригинальную схему (хотя, как показывает опыт с Шекспиром, с внедрением ноу-хау еще не все гладко)[353]
. Ими разработан алгоритм коллаборативной фильтрации для работы с громадными базами данных (что актуально для Amazon.com[354]), способный выдавать качественные, по мнению авторов, рекомендации в режиме реального времени. Смысл в том, что система соотносит каждый из приобретенных пользователем товаров с близкими товарами, купленными другими клиентами, и формирует рекомендательный список[355].Создав (в оффлайновом режиме) таблицу сходных товаров, программа находит среди них те, что перекликаются с покупками и оценками конкретного пользователя. Затем ему подсказывают самые популярные из продуктов, сходных с теми, что он еще не покупал или близких к уже купленным. (При этом, какие именно ему нужны рекомендации, никто не спрашивает!) Вычисление занимает мало времени, поскольку основная работа делается в режиме оффлайн, и в этом секрет масштабируемости пообъектной схемы. На выходе предлагаются только в большой степени сходные и, как уверяют авторы, желанные товары, хотя не ясно, откуда при высоком сходстве возьмутся рекомендации нового, оригинального произведения искусства.
2.7.4. Гибридные методы производства рекомендаций
Эти методы представляют собой комбинацию коллаборативного и контентного подходов и позволяют избежать ограничений, свойственных каждой из систем в отдельности[356]
. Преимущества гибридной схемы[357] видны из простого примера. Предположим, один пользователь высоко оценил веб-страницу, освещающую итоги кинофестиваля, второй в тех же целях изучил другой интернет-источник. Коллаборативная фильтрация поклиентского типа ничего ценного отсюда не вылущит, а вот анализ содержания покажет, что объекты сходны, и выявит связь между пользователями.Комбинации могут быть разными. Можно произвести расчеты в рамках коллаборативной и контентной схем по отдельности, а затем объединить предсказания. Можно встроить некоторые из контентных принципов в коллаборативную методику, и наоборот[358]
. Наконец, в рамках гибридного подхода возможно построение единой рекомендательной модели.[359] Сложность, которая возникает в этом случае, заключается в необходимости получения информации об объектах рекомендаций.В таблице, составленной Адомявичусом и Тужилиным, дана классификация рекомендательных систем (см. ниже)[360]
.2.7.5. Эффективность и многомерность рекомендаций
Хотя эта проблема активно обсуждалась[361]
, к однозначным выводам специалисты пока не пришли. Вопрос об эффективности часто сводится к покрытию и точности. Покрытие – это количество товаров, для которых рекомендательная система способна выдать прогноз. ТочностьКлассификация рекомендательных методов[362]
измеряется по расхождению предсказанных оценок и фактических. (Ее может оценить для себя любой пользователь, сверяя рекомендации с оценками уже известных ему произведений.) Очевидно, что рекомендательные системы еще не настолько вошли в жизнь, чтобы можно было судить об их эффективности со всей определенностью. Поэтому выводы, встречающиеся в литературе, носят предварительный характер. Надо делать поправку и на то, что некорректно сравнивать рекомендательные системы, отличающиеся друг от друга по охвату материала. Одно дело подсказки в области узкоспециальной литературы, другое – музыки, третье – рекомендации в области культурного потребления вообще.
Очевидно, рекомендательные системы в ближайшей перспективе будут доработаны и приспособлены для обслуживания непростых задач из смежных сфер, таких как советы путешественникам, образовательные и медицинские услуги. Проблема в том, что нынешние системы обходят стороной контекстуальную информацию, без которой точность предсказаний резко снижается. Так, если в ходе выработки рекомендаций по фильмам учесть, когда, где и с кем смотрится кино, то эффективность прогнозов возрастет. Очевидно, что ценность целого ряда действий, в частности турпоездок, зависит от момента (сезона, времени суток, дня недели), а также от того, с кем, в какой компании и при каких обстоятельствах человек воспользовался услугой. Имело бы смысл учитывать все эти дополнительные данные[363]
. Интересные возможности открываются и при включении в расчеты информации о цели, которую преследует пользователь[364].Глава 2.8. Тендер на экспертизу