Говоря о том, насколько нам что-либо понравилось или не понравилось, мы выставляем оценку. Такая оценка называется рейтингом. Каждый рейтинг имеет шкалу оценок, например шкалу от одного до пяти, где один — «очень плохо», пять — «очень хорошо». В такой шкале всем приблизительно понятно, что означают оценки 2, 3, 4. На этапе такого приблизительного понимания возникает первая погрешность, присущая рейтингам. Некая вольность толкования оценок.
Для оценки фильмов многие используют десятибалльную шкалу. Например, крупнейший в мире сервер, посвященный кино, IMDB (Internet Movie Database). Выясняется, что, выставляя фильму «десять баллов», многие пользователи вкладывают в это разный смысл. Кто-то выражает этим, что ему фильм очень понравился, а кто-то хочет сказать, что он без ума от этого фильма. Зачастую распределение рейтингов выглядит следующим образом (см. рис. 25.1 и 25.2).
Римские каникулы
Пираты Карибского моря 2: Проклятие черной жемчужины
Видно, что оценка 10 «аккумулирует» в себе оценки различных превосходных степеней, таких как 11, 12 и т. д., если бы они были. Будь шкала изначально более широкой, распределение выглядело бы так, как показано черными линиями на
рисунках. Естественно, что этот феномен также вносит погрешность в то, как рейтинг отражает реальную картину.
Собрав рейтинги, с ними начинают некие действия, от простых — «рассчитать средний рейтинг» — до более сложных. Например, сравнить вкусы разных людей или применить процедуру коллаборативной фильтрации. Во всех случаях нам понадобится вычитать из одного рейтинга другой или складывать их между собой. И тут выясняется, что рейтинг имеет нелинейную природу. Возьмем трактовку шкалы рейтингов (например, принятую на сервере www.pokazuha.ru):
12 шедевр
11 гениально
10 великолепно
9 отлично
8 очень хорошо
7 хорошо
6 неплохо
5 никак
4 плохо
3 очень плохо
2 отвратительно
1 хуже некуда
Видно, что разница между оценкой 4 и оценкой 1,— это разница между «плохо» и «хуже некуда». Разница составляет 3 балла, но при этом выражает непринципиальное различие в негативной оценке. Разница между оценкой 9 и оценкой 6 тоже составляет 3 балла, но в этой разнице — принципиальное отличие «неплохого» от того, что очень понравилось и заслужило оценку «отлично». Причина этого в том, что шкала рейтингов является ранговой (порядковой). Оценки выстроены по принципу возрастания положительных эмоций. Но ранговая шкала, в отличие от количественной шкалы, не гарантирует осмысленность сложения и вычитания. Задумайтесь: складывая рейтинги, вы складываете не столько оценку впечатления, сколько порядковый номер этой оценки.