Заметка

Статистические модели трендов. Смещение среднего

  3  

Попросили объяснить без специальных терминов, что такое персистентность и как она связана с трендовостью рынка. Совсем без терминов вряд ли получится, но, если их минимизировать, достаточно будет понятия плотности вероятности.

Что такое плотность вероятности? Это функция интеграл интервала которой, дает нам вероятность попадания в этот интервал. Или в простейшем случае, если мы рассматриваем ее эмпирическую оценку в виде гистограммы распределения, это будет просто частота попадания в набор фиксированных интервалов.
Для примера рассмотрим гистограмму нормального распределения.

Собственно что мы видим — разбиение на набор фиксированных интервалов, затем подсчет попадания каждого значения в тот или иной интервал, который дает частоту. Если мы хотим посчитать частоту попадания в бОльший интервал, например от 0 до 2, то нам необходимо сложить (проинтегрировать) частоту попадания во все маленькие интервалы внутри этого отрезка [0, 2]. Таким образом плотность вероятности дает возможность, зная интервал, получить вероятность попадания в него. Или если рассматривать на более «интуитивном» уровне — показывает какие значения выпадают более часто, а какие менее. В приведенном примере наиболее часто выпадают значения вокруг нуля распределения и затем частота постепенно уменьшается. 

Если мы рассмотрим распределение как набор значений, расположенных во времени (привычные для трейдинга представления в виде графиков числовых рядов), то получим для все того же нормального (гауссового) распределения следующую картинку:

Как и ожидалось из гистограммы распределения, 95% значений находятся внутри интервала от -2 до +2, с центром в нуле. 

Каждый наверняка видел график случайного блуждания и этот на него мало похож. Разница в том, что для того, чтобы получить случайное блуждание, необходимо последовательно сложить эти значения. Или наоборот, чтобы получить из случайного блуждания — распределение приращений, необходимо взять разность соседних значений. 

Таким образом мы подходим к первой простейшей модели тренда. Рассмотрим распределение приращений: 

которое практически на глаз не отличается от предыдущего, но среднее (центр) сдвинуто на +0.1. Теперь просуммируем значения распределений для первого случая с нулевым и положительным (+0.1) смещением среднего, таким образом получим два графика случайных блужданий. 

Первый, без смещения в мат ожидании приращений:

А второй с «ничтожным» (едва разлечимым на графике распределения приращений) смещением(+0.1):

Разница разительная: на первом графике заработать невозможно, а на втором - вполне. 

В данном случае мы рассматриваем зависимость (смещение в мат. ожидания), которая не изменяется во времени, то есть стационарна: 0 для всего графика, или +0.1 другого. Теперь представим, что эти значения сами изменяются во времени и представляют, к примеру, кусочно-постоянную функцию. То есть набор констант, из которого мы выбираем значение, действующее на каком-то интервале. Соответственно, если это значение положительное, возникает «растущий кусок тренда», если отрицательное — «падающий». А сам график «сшит» из таких интервалов с постоянными значениями. Таким образом мы получим приближенную к реальности простейшую динамическую модель тренда, у которого стационарное среднее приращений равняется 0, но при этом существуют интервалы, на которых оно отклоняется от 0 как в положительную, так и отрицательную сторону. При этом в среднем количество таких участков «уравновешивается», и мы получаем среднее всех приращений близким к нулю.

Или если мы будем рассматривать среднее как функцию времени, то для кусочно-постоянной модели получим следующую картинку:

Или ввиде формулы, P_i+1 = P_i + A_k + N(0, 1) , где A_k это значение среднего на данном временном интервале (t_k, t_k+1), N(0, 1) стандартизированное нормальное распределение, а Pi это получившийся стохастический процесс. 

Для примера рассмотрим реализацию такого стохастического процесса при t_k = (0, 100, 200, 400, 450, 600, 650) и A_k = (+0.1, -0.1, +0.05, +0.15, -0.2, -0.05), что примерно соответствует представленному выше графику зависимости от времени. 

Первая реализация:

Вторая реализация:

Как видно они мало похожи, и в них гораздо менее очевидно наличие трендов, чем в простейшем стационарном случае, но тем не менее они там присутствуют, а значит на таком процессе возможно заработать.

В следующей серии мы поговорим о еще одной модели тренда, которая связана с персистентностью. Более конкретно, мы будем понимать под персистентностью — авто-регрессивность числового ряда.

Комментарии

Kelvinoid — 27 апреля 2012 г.

Спасибо за статью! Скажите пожалуйста можно ли сосчитать в текущий момент времени значение среднего норм распределения?

0 +

Николай Камынин — 28 апреля 2012 г.

Данный результат есть случайная величина и не является статистикой тренда, так как фактически получено случайное распределение по интервалам на данной исторической выборке.
Чтобы это распределение стало статистикой, надо взять еще примерно 100 таких исторических участков, рассчитать на каждом из них рассчитать оценку распределения по интервалам, после этого найти среднее по 100 оценкам значения в каждом из интервалов.
Полученная оценка плотности вероятности будет статистикой с примерно 10% доверительным интервалом. При этом надо обеспечить некоррелированность выбранных 100 участков истории иначе полученный результат не станет статистикой а останется все той-же случайной величиной с начальным доверительным интервалом.

0 +

vlad1024 — 29 апреля 2012 г.

Николай, там в конце статьи приведен пример процесса, то есть мы априори знаем истинное значение среднего и по нему генеративно строим реализацию процесса, в биржевой торговле конечно необходимо решать обратную задачу, то есть по реализации процесса восстановить оценку среднего, для этого существуют определенные методы и т.д. можно к примеру посмотреть статьи Горчакова (А.Г.) там это более подробно рассматривается. По поводу статистики и прочего, это все верно для теории независемо распределенных случайных переменных, на рынке же приходится иметь дело с одной единственной реализацией процесса, который очевидно нестационарен.

0 +

vlad1024 — 29 апреля 2012 г.

Kelvinoid, можно по сути это будет скользящая средняя, но взятая по окну с переменным периодом + критерии изменения среднего.

0 +

Написать комментарий

Чтобы написать комментарий, необходимо авторизоваться.

Написать администратору