Быстрых и четких ответов на этот вопрос нет. Мы могли подбрасывать монетку миллиард раз, и каждый раз выпадал бы орел, и это, в принципе, возможно – просто нам очень, очень везло. Так же работает и наука. Мы не «доказываем» правильность результатов, как это можно сделать в математике или логике, а просто накапливаем все больше и больше свидетельств их правильности, увеличивая их достоверность. Если полученные данные уже существенно отличаются от тех, которые можно было бы ожидать в случае верности нулевой гипотезы, мы отвергаем ее и двигаемся дальше. Поскольку мы рассматриваем процессы, вероятностные по своей сути, и имеем дело только с конечным числом событий, неудивительно, что мы получаем некоторое отклонение от идеального результата. Типичное отклонение обозначается греческой буквой сигма (ст). Это позволит нам выразить в удобном виде, насколько велико отклонение реально наблюдаемых данных от идеального результата, то есть насколько оно больше, чем сигма. Если разница между наблюдаемым результатом измерения и теоретическим прогнозом в два раза больше типичного ожидаемого разброса, мы говорим, что получен результат «две сигмы».
Доверительные интервалы для 100 бросков монеты, когда математическое ожидание равно 50, а среднеквадратичное отклонение в сигмах равно 5. Длина интервала в одну сигму – от 45 до 55, а интервала в пять сигм – от 25 до 75.
Когда мы делаем измерения, разброс вокруг предсказанного исхода часто имеет форму колокола, что и изображено на рисунке вверху. Здесь мы изобразили вероятность получения различных результатов (в данном примере это количество выпадений орла, когда мы бросаем монетку 100 раз). Кривая достигает максимума при наиболее вероятном значении, которое в данном случае равно 50, но есть некоторый естественный разброс вокруг этого значения. Этот разброс – ширина колоколообразной кривой – и есть неопределенность в прогнозе, то есть ст. Для числа подбросов монеты, равного 100, она равна 5, и тогда мы говорим: «Мы ожидаем, что орел выпадет 50 раз плюс-минус 5».
Сигма хороша тем, что она может трансформироваться в вероятность того, какой реальный результат будет получен (даже несмотря на то, что точная формула очень сложна и, как правило, вы просто ищете число в справочнике). Если мы бросаем монетку 100 раз и от 45 до 55 раз выпадает орел, мы говорим, что результат находится «в интервале одной сигмы», что происходит в 68 % испытаний.
Другими словами, результаты, отличающиеся более чем на одну сигму, мы получаем примерно в 32 % испытаний, что немало, так что в результате, отличающемся на одну сигму, нет ничего, что могло бы насторожить. Вы бы не стали подозревать, что монетка «неправильная», только потому, что в 100 подкидываниях 55 раз выпал орел и 45 решка.
Большие сигмы соответствуют все менее вероятным результатам (при условии, что верна нулевая гипотеза). Если у вас из 100 раз орел выпал 60, это отклонение в две ст, и такое происходит только примерно в 5 % испытаний. Этот результат кажется маловероятным, но не совсем неправдоподобным. Его недостаточно, чтобы отвергнуть нулевую гипотезу, но достаточно, чтобы возбудить некоторые подозрения. Выпадению 65 раз орла соответствовало бы отклонению в три ст, что соответствует вероятности 0,3 %. Эти события случаются довольно редко, и теперь у нас появились законные основания думать, что происходит нечто странное. Если бы у нас выпал орел 75 раз из 100, это бы было отклонением в пять ст, а такие события случаются реже чем один раз на миллион. И тогда мы вправе сделать вывод, что сигнал был не просто статистической флуктуацией, и нулевая гипотеза неверна – монетка попалась явно неправильная.
Сигнал и фон
Поскольку физика элементарных частиц управляется квантовой механикой, она очень похожа на подкидывание монетки: самое большее, что мы можем сделать, это предсказывать вероятности. На БАКе мы сталкиваем протоны друг с другом и предсказываем вероятность различных взаимодействий. Для частного случая поиска бозона Хиггса мы рассматриваем различные «каналы», каждый из которых определяется типом частиц, захваченных детекторами. Есть двухфотонный канал, двухлептонный канал, четырехлептонный канал, канал с двумя струями и двумя лептонами, и так далее. В каждом случае мы суммируем энергии вылетающих частиц и с помощью аппарата квантовой теории поля (дополненного реальными измерениями) рассчитываем, сколько событий могли бы ожидать для каждого значения полной энергии. Результаты, как правило, изображаются в виде гладкой кривой.