Вернемся к верхней левой части рис. 3.2.1. Логично предположить, что слабая зависимость между значениями критерия и прибылью объясняется влиянием большого количества внешних факторов, зашумляющих зависимость и снижающих корреляцию. Мы исходим из предположения, что как минимум некоторые из этих факторов хаотичны и изменчивы во времени. Это означает, что их влияние на прибыль непредсказуемо и с течением времени может менять направленность. Если предположение о случайном влиянии этих факторов на прибыль верно, то объединение нескольких дней в одном анализе должно вызвать взаимную нейтрализацию воздействий посторонних факторов.
Речь не идет о простом объединении в одном анализе данных, относящихся к нескольким дням (например, объединении синих и красных точек на верхней левой части рис. 3.2.1), что, возможно, повысило бы значение коэффициента корреляции, но только за счет увеличения размера выборки.
Мы будем действовать иначе. Возьмем две следующие одна за другой даты и для каждой из них отсортируем по значениям критерия все 1500 комбинаций. Совместим оба списка и вычислим среднее для двух значений критерия, относящихся к первым комбинациям в обоих списках. Аналогично вычислим среднее значение прибыли для тех же двух первых комбинаций. Затем спустимся на вторые номера обоих списков и так же усредним для них значения критерия и прибыли. Повторим эту операцию для всех номеров вплоть до 1500-го.
Выполнив такие преобразования, получим набор данных, состоящий из усредненных по двум дням значений критерия и прибыли. Рассмотрим зависимость этих величин (верхняя правая часть рис. 3.2.1) и сравним ее с аналогичной зависимостью до усреднения (верхняя левая часть рис. 3.2.1). В одном случае, когда усреднение проводилось для 27 августа 2007 г. и соседней даты, квадрат коэффициента корреляции вырос с 0,043 до 0,075 (синие кружки на графике). Во втором случае, когда усреднялись данные 10 сентября 2007 г. и соседней даты, также наблюдается рост с 0,001 до 0,004. Несмотря на то что рост корреляции кажется очень незначительным, не стоит забывать, что усреднению подверглись данные только двух соседних дат. Попробуем продвинуться дальше в этом направлении.
Усредним теперь данные для четырех дат, начиная с тех же дат, что и в предыдущем примере. Корреляции возрастают еще больше, в одном случае R2 увеличивается вдвое по сравнению с двухдневным усреднением, в другом случае – почти на порядок (рис. 3.2.1). Продолжая увеличивать размерности усреднений, получаем дальнейшее повышение коэффициентов корреляции. Дойдя до десяти дней, мы убеждаемся в наличии явно выраженной зависимости между значениями критерия и прибыли (рис. 3.2.1), о чем свидетельствуют достаточно высокие коэффициенты детерминации (R2 = 0,24 для 27 августа 2007 г. и R2 = 0,16 для 10 сентября 2007 г.).
Интересно проследить эволюцию зависимости между критерием и прибылью по мере увеличения периода усреднения. Продвигаясь от верхней левой части рис. 3.2.1 к нижней правой части, без труда можно заметить нарастание зависимости прибыли от значений критерия.
Итак, мы удостоверились в работоспособности по крайней мере одного критерия, задействованного в оценке одной стратегии. Для этого достаточно было применить довольно несложное преобразование. Вместе с тем многие вопросы остались нерассмотренными. Расширяя диапазон усреднения, мы остановились на десятидневном периоде. Следует продолжить увеличение глубины усредняемого периода с тем, чтобы попытаться установить оптимальную величину этого параметра. Необходимо изучить влияние преобразовательной процедуры на временную динамку корреляции. Кроме того, необходимо протестировать влияние усреднения на оценку эффективности других критериев. Также желательно убедиться в действенности данной процедуры применительно не только к короткой, но и к длинной стратегии.
|