4. Отсюда следует еще один вывод. Если мы торгуем систему на дневных или недельных таймфреймах, то нам потребуется очень большое статическое преимущество, чтобы получить закономерный результат. Когда же мы торгуем высокоскоростную HFT-стратегию, нам достаточно иметь самое минимальное статистическое преимущество в каждой сделке, чтобы закрывать каждый день в плюс. Например, на конкурсе ЛЧИ 2015, робот, заработавший 1500 % прибыли меньше чем за два месяца, совершал в среднем около 10 000 сделок в день.
5. Суммируя вышесказанное, можно сделать еще один вывод: если мы создадим систему с небольшим положительным матожиданием, то на тестах с маленькой выборкой (< 250 сделок) она чисто случайно, в силу большой дисперсии результатов, может показаться нерабочей и быть ошибочно забракована.
Сформулируем два критерия оценки:
Критерий 1
. Для того чтобы убедиться в неслучайности системы, необходимо совершить большое количество сделок на тесте – не меньше 1000.Критерий 2
. Желательно, чтобы система была равномерно прибыльна на всем интервале тестирования (в нашем примере – на каждой серии из 250 сделок). Это повышает шансы на то, что мы получили неслучайный результат.Здесь надо сделать несколько оговорок. В реальности бывает так, что вы не в состоянии совершить 1000 сделок на истории для данной системы. В этом случае вы можете сделать 10 тестов по 100 сделок на 10 инструментах и оценить результативность таким образом. Но тестирование на столь большой выборке не всегда обязательно. Если вы при работе с информацией используете подход «Снизу вверх», описанный в седьмой главе, и понимаете логику ошибки участников рынка, то вам не обязательно совершать такое количество тестов. Вы можете обойтись без выборки из 1000 наблюдений. Допустим, вы уловили закономерность, которая работает на утренних гэпах в одном инструменте. Даже если рынок каждый день будет открываться с гэпом, за год вы соберете всего 250 наблюдений. В реальности, когда вы понимаете логику ошибки («Снизу вверх»), вам может хватить и 10 наблюдений для построения прибыльной системы.
Требования к количеству сделок на тесте повышается при использовании подхода «Сверху вниз», который мы также разбирали в седьмой главе. Если вы уловили закономерность в процессе датамайнинга и не до конца понимаете логику ошибки, делайте как можно больше сделок на тесте и проверяйте их в соответствии с первым и вторым критериями, приведенными выше. Бывает, что требование к большому числу сделок возникает даже в случае, когда вы понимаете логику, но ваше статистическое преимущество незначительно: например, если вероятность прибыльной сделки составляет всего 51 %.
На практике если вы оцениваете систему за последние несколько лет, то результаты каждого года не должны сильно отличаться. Это также будет свидетельствовать о статистической устойчивости метода.
Есть и еще одна практическая подсказка от успешных алготрейдеров относительно размера выборки тестирования. Важно, чтобы число сделок на тесте было выше числа «особей» варьируемых параметров системы. Желательно, чтобы 50 % «особей» были жизнеспособны. Что это значит? Допустим, есть два параметра оптимизации. Первый может принимать три различных значения, а второй – пять. Следовательно, число всевозможных «особей» равно: 3 × 5 = 15. То есть число сделок на тесте должно быть >15, а система должна показывать хорошие результаты как минимум в 8 из 15 параметров.