Еще одна возможность для фальсификации данных – раздельное их хранение. Самым ярким примером этого может послужить банкротство в 2002 году компании WorldCom[18], годовой доход которой составлял $30 млрд. Компания фальсифицировала скорее не данные, а отчетность. Впоследствии аудиторы выяснили, что цифры в балансовом отчете были завышены на $75 млрд, а доходность компании – на $11 млрд. Как такое вообще стало возможно? Основная причина заключалась в том, что в компании применялось несколько разных систем бухгалтерского учета, между которыми не было обмена данными. Двойной учет был обычным делом.
Проблема часто состоит в том, что люди считают, будто владеют какими-то данными, и не хотят делиться информацией. Даже если ваша компания, к счастью, непохожа на WorldCom, ваши аргументы могут оказаться не вполне убедительными, так как вы не видите всю картину целиком.
Люди склонны искажать факты (иногда нарочно, иногда непреднамеренно) и оперировать неверными заключениями. В одних случаях это проявление некомпетентности, в других – злого умысла. Вот три способа подтасовать данные.
• Выборочное использование доказательств. В 2013 году исследователь Стэнфордского университета Джон Иоаннидис наугад выбрал 50 продуктов из кулинарной книги и обнаружил, что для 80 % из них есть хотя бы одна научная работа, доказывающая, что они вызывают рак, и одна – доказывающая, что они служат средством профилактики рака. Однако продавец будет ссылаться на информацию, отражающую только одну сторону.
• Неверные причинно-следственные отношения. Результаты одного из нашумевших исследований свидетельствовали о том, что курение повышает вероятность самоубийства. Ужасно! Через несколько лет результаты этого исследования были оспорены, когда исследователи доказали, что курильщики также в два раза чаще погибают насильственной смертью. Подсказка: причину и следствие поменяли местами. У людей, испытывающих депрессию, стресс, постоянно подвергающихся опасности, гораздо выше вероятность того, что они начнут курить.
• Неправильный выбор временных рамок. Начало и завершение периода, за который делается отчет, имеет значение. Если вам говорят, что темпы роста составили 5 % с 2007 года, поинтересуйтесь, какими они были в 2006 или 2004 году. Очень часто статистические данные выглядят радужно, потому что выбраны годы с лучшими показателями. Происходит ли глобальное потепление в последние годы? Кривая графика будет зависеть от того, что вы подразумеваете под словами «в последние годы».
Что делать с искаженными данными? Главный урок – со всем возможным скептицизмом относиться к людям, которые сообщают вам информацию и хотят, чтобы вы приняли ее за чистую монету. Существует взаимосвязь между так называемыми вуду-опросами (то есть данными, которые появляются в федеральных изданиях и о которых моментально забывают), и тем, кто за это платит и что при этом происходит в реальности.
Второй урок – следует с крайней подозрительностью воспринимать единичную информацию. Сенсационные результаты привлекают больше внимания, но это не свидетельствует об их истинности. Если взаимосвязь между данными возникает снова и снова, это показатель ее достоверности. Если мы получили совсем другие результаты при повторе эксперимента, возникают вопросы к методу проведения исследования. Цифры не врут, но когда их пытаются подтасовать, они искажают действительность.
19. Из чего сделана колбаса
Результаты исследований всегда в той или иной степени пристрастны. Главное – не слишком доверять некачественным доказательствам.
Вот интересный график, с помощью которого компания C Space пытается убедить нас в полезности своих услуг:
Рост больше роста рынка
Этот график отражает уровень роста наших клиентов по сравнению с индексом S&P. Взаимосвязь простая. Сотрудничайте со своими клиентами, и прибыльность вашего бизнеса будет расти.)
И вот мы уже думаем, что это впечатляющий результат и что разница между серой и черной линиями отражает ту ценность, которую создает компания C Space. При этом объяснение самой компании гораздо сдержаннее: «сотрудничайте со своими клиентами» – вот что определяет разницу, а не собственно компания C Space. Но даже эта формулировка весьма сомнительна.
При использовании статистики для сравнения двух выборок или чтобы получить информацию о целостной группе (например, по всем своим клиентам) на основании одной выборки (по данным от тех клиентов, кто согласился принять участие в вашем опросе), самое важное – понимать, что вы сравниваете подобное с подобным.