Читаем Путеводитель по лжи полностью

Объединение выборок – объединение наблюдений за одной или более группами. Если группы схожи в каком-то важном аспекте, то есть гомогенны, то это правильный подход. Если нет, это может привести к искажению данных.

Ошибка подтверждения следствием. См. Обратное утверждение.

Противоположное утверждение – вид необоснованного дедуктивного рассуждения, имеющего следующую форму:

Если А, то B

Не A

Следовательно, не B

Разделение на группы – разделение серии наблюдений на более мелкие группы. Это допустимо, когда мы имеем дело с разнородными данными и когда большая группа состоит из объектов, отличающихся только по одному важному показателю. Однако разделение на группы может применяться в жульнических целях, чтобы создать много маленьких групп, которые не сильно отличаются по изучаемой переменной.

Распространенность – число существующих случаев (например, заболевания).

Силлогизм – тип логического утверждения, в котором выводы должны обязательно следовать из посылки.

Среднее – суммарный показатель, характеризующий серию наблюдений. «Среднее» – нетехнический термин, часто под ним понимают среднее арифметическое, медиану или моду.

Среднее арифметическое – один из показателей среднего (центральная тенденция целой серии наблюдений). Его можно высчитать, суммировав все наблюдения и поделив на их количество. Два других типа среднего – это медиана и мода. Например, для (1, 1, 2, 4, 5, 5) среднее арифметическое равно (1 + 1 + 2 + 4 + 5 + 5) / 6 = 3. Обратите внимание, что, в отличие от моды, среднее арифметическое не обязательно находится среди наблюденных значений.

Точные цифры показывают, с точностью до какого десятичного разряда проводили измерение. Например, в числе 909 нет знаков после запятой, это результат измерения с точностью до целых. В числе 909,35 – два знака после запятой, это результат измерения с точностью до сотых. Точные цифры не всегда верные: второе число точнее первого, но не вернее его, если настоящее значение 909,00.

Усеченные оси используются в графиках, в которых шкалы на осях начинаются не с самых низких возможных значений. Иногда это может быть полезно: подробнее изображается та часть графика, где фиксируются результаты наблюдений. Но если использовать эту технику с целью манипуляции, то можно сильно исказить реальность. График, приведенный в качестве примера в этом разделе (см. Диаграмма рассеяния), эффективно использует две усеченные оси и не искажает данных. График, приведенный в части 1, данные искажает, истинные значения представлены на переделанном графике ниже.

Условная вероятность – вероятность, что какое-то событие произойдет при условии, что произойдет или уже произошло другое событие. Например, вероятность того, что сегодня пойдет дождь, при условии, что дождь шел вчера. Слова «при условии» обозначаются вертикальной чертой: |.

Фрейминг – способ, которым сообщают о статистических данных. Например, предоставленный контекст, группа сравнения или объединение выборок могут повлиять на то, как человек интерпретирует информацию. Сравнение общего числа авиакатастроф за 2016 год с показателями за 1936-й может быть неверным, потому что по сравнению с 1936-м в 2016-м было намного больше перелетов, – поэтому такие показатели, как количество авиакатастроф на 100 тысяч перелетов или количество авиакатастроф на 100 тысяч преодоленных километров, предоставляют более точную информацию. Нужно всегда найти лучший фрейм для статистического показателя – это значит наиболее подходящий и информативный. В этом смысле показатели в виде относительных частот обычно оказываются лучше, чем в виде общего количества.

Экологическая ошибка – ошибка в рассуждениях, которая случается, когда делают выводы о человеке, основываясь на совокупных данных (например, на среднем внутри класса).

Экстраполяция – процесс угадывания или выведения заключения о том, какие значения могут принимать величины за пределами интервала наблюденных значений.

Благодарности

Вдохновение для написания я почерпнул у Даррелла Хаффа в книге How to Lie with Statistics, которую прочитал несколько раз, с каждым разом все больше и больше понимая ее ценность. Я был большим фанатом книги Джоэла Беста Lies and Statistics, а также Чарльза Уилана и его Naked Statistics[267]. Я обязан всем троим юмором, мудростью и озарением. И, надеюсь, у всех тех, кто хочет научиться мыслить критически, моя книга займет достойное место на полке рядом с трудами этих авторов.

Перейти на страницу:

Похожие книги