Объединение выборок
– объединение наблюдений за одной или более группами. Если группы схожи в каком-то важном аспекте, то есть гомогенны, то это правильный подход. Если нет, это может привести к искажению данных.Ошибка подтверждения следствием.
См.Противоположное утверждение
– вид необоснованного дедуктивного рассуждения, имеющего следующую форму:Если
Не
Следовательно, не
Разделение на группы
– разделение серии наблюдений на более мелкие группы. Это допустимо, когда мы имеем дело с разнородными данными и когда большая группа состоит из объектов, отличающихся только по одному важному показателю. Однако разделение на группы может применяться в жульнических целях, чтобы создать много маленьких групп, которые не сильно отличаются по изучаемой переменной.Распространенность
– число существующих случаев (например, заболевания).Силлогизм
– тип логического утверждения, в котором выводы должны обязательно следовать из посылки.Среднее
– суммарный показатель, характеризующий серию наблюдений. «Среднее» – нетехнический термин, часто под ним понимаютСреднее арифметическое
– один из показателей среднего (центральная тенденция целой серии наблюдений). Его можно высчитать, суммировав все наблюдения и поделив на их количество. Два других типа среднего – это медиана и мода. Например, для (1, 1, 2, 4, 5, 5) среднее арифметическое равно (1 + 1 + 2 + 4 + 5 + 5) / 6 = 3. Обратите внимание, что, в отличие от моды, среднее арифметическое не обязательно находится среди наблюденных значений.Точные цифры
показывают, с точностью до какого десятичного разряда проводили измерение. Например, в числе 909 нет знаков после запятой, это результат измерения с точностью до целых. В числе 909,35 – два знака после запятой, это результат измерения с точностью до сотых. Точные цифры не всегда верные: второе число точнее первого, но не вернее его, если настоящее значение 909,00.Усеченные оси
используются в графиках, в которых шкалы на осях начинаются не с самых низких возможных значений. Иногда это может быть полезно: подробнее изображается та часть графика, где фиксируются результаты наблюдений. Но если использовать эту технику с целью манипуляции, то можно сильно исказить реальность. График, приведенный в качестве примера в этом разделе (см.Условная вероятность
– вероятность, что какое-то событие произойдетФрейминг
– способ, которым сообщают о статистических данных. Например, предоставленный контекст, группа сравнения или объединение выборок могут повлиять на то, как человек интерпретирует информацию. Сравнение общего числа авиакатастроф за 2016 год с показателями за 1936-й может быть неверным, потому что по сравнению с 1936-м в 2016-м было намного больше перелетов, – поэтому такие показатели, как количество авиакатастроф на 100 тысяч перелетов или количество авиакатастроф на 100 тысяч преодоленных километров, предоставляют более точную информацию. Нужно всегда найти лучший фрейм для статистического показателя – это значит наиболее подходящий и информативный. В этом смысле показатели в виде относительных частот обычно оказываются лучше, чем в виде общего количества.Экологическая ошибка
– ошибка в рассуждениях, которая случается, когда делают выводы о человеке, основываясь на совокупных данных (например, на среднем внутри класса).Экстраполяция
– процесс угадывания или выведения заключения о том, какие значения могут принимать величины за пределами интервала наблюденных значений.Благодарности
Вдохновение для написания я почерпнул у Даррелла Хаффа в книге How to Lie with Statistics, которую прочитал несколько раз, с каждым разом все больше и больше понимая ее ценность. Я был большим фанатом книги Джоэла Беста Lies and Statistics, а также Чарльза Уилана и его Naked Statistics[267]
. Я обязан всем троим юмором, мудростью и озарением. И, надеюсь, у всех тех, кто хочет научиться мыслить критически, моя книга займет достойное место на полке рядом с трудами этих авторов.