Но своей популяризации «совместные фильтры» обязаны огромному книжному интернет-магазину Amazon. Инновация Аmazon заключалась в проведении взаимосвязи между отдельными предметами, а не пользователями. Другими словами, тщательно отслеживая покупки каждого покупателя, Amazon может использовать огромное количество результативных данных, чтобы провести параллель между «Биографией Ральфа Эллисона» Арнольда Рам-персада и романом Жуно Диаса «Короткая и удивительная жизнь Оскара Уао». Эти книги не имеют ничего общего, между тем люди, которые покупают одну из этих книг, часто покупают и вторую. Почему? Amazon не делает никаких предположений на этот счет, да в общем-то и не нуждается в них. Подчеркнув связь между этими двумя книгами, Amazon просто увеличил их продажи. Система рекомендаций Amazon оказалась настолько эффективной, что подобные методики стали активно применяться и другими сайтами.
И хотя совместные фильтры обычно имеют отношения к системам рекомендаций наподобие той, которую использует Amazon, они предоставляют полезный материал, с помощью которого можно определить, каким образом предпочтения «толпы» используются в разных сферах деятельности. Механизмы коллективного принятия решений подразделяются на две категории: активные и пассивные. Amazon использует пассивный фильтр, данные, являющиеся «побочным продуктом» покупок, осуществляемых клиентами на сайте компании. Пассивная фильтрация нацелена на данные, генерируемые нами в процессе нашей повседневной современной цифровой жизнедеятельности: добавление ссылок к блогам, просмотр видео на YouTube, покупку миски на Williams – Sonoma.com, которые в дальнейшем используются в рациональных целях.
Экспериментальная система PARC, напротив, является активным фильтром. Эта технология опирается на сознательные действия пользователей, оценивающих имеющийся у них материал. Netflix использует активный фильтр, хотя компания имеет ту же цель, что и Amazon, – продать как можно больше продуктов посредством рекомендаций. В то время как Amazon берет за основу совместных фильтров покупательские привычки своих потребителей, Netflix полагается на своих участников в вопросе оценки/рейтинга просмотренных ими фильмов, с тем чтобы поднять уровень влияния своей рекомендательной системы «Cinematch». Подобным же образом рейтинговая система eBay полагается на то, какую оценку ставит покупатель продавцу в зависимости от его надежности и гарантоспособности.
В последнее время фильтрация вышла далеко за пределы поисковых технологий и электронного бизнеса. Точно так же, как когда-то библиотекари создали алфавитный указатель с целью организовать имеющиеся информационные ресурсы по темам, интернет-сообщество все чаще использует теги для классификации контента, создаваемого и потребляемого им. Например, я присваиваю теги каждой своей публикации в блоге. Для статьи о краудсорсинге для рекламных роликов Frito-Lay Super Bowl я использовал теги «Doritos» и «коммерческая реклама». И если кому-то будет необходимо сделать поиск в Интернете на тему «краудсорсинг» или «Doritos», они смогут найти мои публикации на самом верху огромного количества информации. Такие ярлыки, будь это номер на карточке библиотечного каталога или теги для описания публикаций в блогах, имеют свое название – «метаданные».
Использование тегов началось с блогов, но они достаточно быстро стали использоваться и во многих других формах социальных сетей, которые стали появляться на рубеже XXI столетия. Сайт, предлагающий услугу хранения и публикации закладок на страницах всемирной сети, Del.icio.us и сайт по обмену фотографиями Flickr активно используют теги, что позволяет отдельным пользователям классифицировать закладки и фотографии. В общей сложности эти метаданные включают в себя инициированную пользователем систему классификаций. Если я заведу поиск на тему «ловля рыбы нахлыстом» (надо же иногда отвлекаться от научно-технической тематики) на сайте Del.icio.us, я получу ссылки на 2509 сайтов, которые пользователи «пометили» как имеющие отношение к «ловле рыбы нахлыстом», начиная с пособия по завязыванию узлов и заканчивая сайтом, специализирующимся на подводной съемке форели.
Такая детальная классификация называется еще фолксономией и представляет собой огромный интерес для специалистов библиотечного дела. «Профессионально созданные метаданные являются дорогостоящим продуктом с точки зрения времени и усилий. Это усложняет процесс охвата и возможность поспевать за огромным количеством производимого информационного контента, особенно таким современным средством, как Интернет», – пишется в одной из ранних публикаций, посвященных фолксономии78. И в то же время фолксономия демонстрирует и существенные недостатки: по мнению авторов, она является «изначально хаотичной». Тем не менее она невероятно чувствительна к потребностям пользователей и, что не менее важно, беспредельно масштабна. Преимущества фолксономии не отличаются от многих других приложений краудсорсинга: она делает изначально непосильную задачу выполнимой.