Шкалы качественных признаков - это шкалы интервалов, отношений, разностей, абсолютная. По шкале интервалов измеряют величину потенциальной энергии или координату точки на прямой, на которой не отмечены ни начало, ни единица измерения; по шкале отношений - большинство физических единиц: массу тела, длину, заряд, а также цены в экономике. Время измеряется по шкале разностей, если год принимаем естественной единицей измерения, и по шкале интервалов в общем случае. В процессе развития соответствующей области знания тип шкалы может меняться. Так, сначала температура измерялась по порядковой шкале (холоднее - теплее), затем - по интервальной (шкалы Цельсия, Фаренгейта, Реомюра) и, наконец, после открытия абсолютного нуля температур - по шкале отношений (шкала Кельвина). Следует отметить, что среди специалистов иногда имеются разногласия по поводу того, по каким шкалам следует считать измеренными те или иные реальные величины.
3.3. Инвариантные алгоритмы и средние величины
Основное требование к алгоритмам анализа данных формулируется в РТИ так: выводы на основе данных, измеренных в шкале определенного типа, не должны меняться при допустимом преобразовании шкалы измерения этих данных (другими словами, выводы должны быть инвариантны по отношению к допустимым преобразованиям шкалы). Таким образом, цель теории измерений - борьба с субъективизмом исследователя при приписывании численных значений реальным объектам. Так, расстояния можно измерять в метрах, микронах, милях, парсеках и других единицах измерения. Выбор единиц измерения зависит от исследователя, т.е. субъективен. Статистические выводы могут быть адекватны реальности только тогда, когда они не зависят от того, какую единицу измерения предпочтет исследователь, т.е. когда они инвариантны относительно допустимого преобразования шкалы.
В качестве примера рассмотрим обработку мнений экспертов, измеренных в порядковой шкале. Пусть Y1, Y2,...,Yn - совокупность оценок экспертов, "выставленных" одному объекту экспертизы (например, одному из вариантов стратегического развития фирмы), Z1, Z2,...,Zn - второму (другому варианту такого развития).
Как сравнивать эти совокупности? Самое простое - по средним значениям. А как вычислять средние? Известны различные виды средних величин: среднее арифметическое, медиана, мода, среднее геометрическое, среднее гармоническое, среднее квадратическое. Обобщением нескольких из перечисленных является среднее по Колмогорову. Для чисел X1, X2,...,Xn среднее по Колмогорову вычисляется по формуле
G{(F(X1)+F(X2)+...F(Xn))/n},
где F - строго монотонная функция, G - функция, обратная к F. Если F(x) = x, то среднее по Колмогорову - это среднее арифметическое, если F(x) = ln x, то среднее геометрическое, если F(x) = 1/x, то среднее гармоническое, и т.д. Медиану и моду нельзя представить в виде средних по Колмогорову.
Напомним, что общее понятие среднего (введенное французским математиком первой половины Х1Х в. академиком О.Коши) таково: средней величиной является любая функция f(X1, X2,...Xn) такая, что при всех возможных значениях аргументов значение этой функции не меньше, чем минимальное из чисел X1, X2,...Xn , и не больше, чем максимальное из этих чисел. Среднее по Колмогорову - частный случай среднего по Коши. Медиана и мода не являются средними по Колмогорову, но тоже - средние по Коши.
При допустимом преобразовании шкалы значение средней величины, очевидно, меняется. Но выводы о том, для какой совокупности среднее больше, а для какой - меньше, не должны меняться (в соответствии с требованием инвариантности выводов, принятом в РТИ) . Сформулируем соответствующую математическую задачу поиска вида средних величин, результат сравнения которых устойчив относительно допустимых преобразований шкалы. Пусть f(X1, X2,...,Xn) - среднее по Коши. Пусть
f(Y1, Y2,...,Yn) f(Z1, Z2,...,Zn). (1)
Тогда для устойчивости результата сравнения средних необходимо, чтобы для любого допустимого преобразования g из группы допустимых преобразований в соответствующей шкале было справедливо также неравенство
f(g(Y1), g(Y2),..., g(Yn)) f (g(Z1), g(Z2),..., g(Zn)), (2)
т.е. среднее преобразованных значений из первой совокупности также было меньше среднего преобразованных значений для второй совокупности. Причем сформулированное условие должно быть верно для любых двух совокупностей Y1, Y2,...,Yn и Z1, Z2,...,Zn. Согласно РТИ только такими средними можно пользоваться при анализе мнений экспертов..
С помощью математической теории [2] удается описать вид допустимых средних в основных шкалах:
в шкале наименований в качестве среднего годится только мода;
из всех средних по Коши в порядковой шкале в качестве средних можно использовать только члены вариационного ряда (порядковые статистики), в частности, медиану (при нечетном объеме выборки; при четном же объеме следует применять один из двух центральных членов вариационного ряда - как их иногда называют, левую медиану или правую медиану), но не среднее арифметическое, среднее геометрическое и т.д.;