Статистика зависимостей в котировках (теория информации, корреляция и другие методы feature selection) - страница 16

 
А я концептуально додумал дальнейших ход исследований (пишу для заинтересованных, а не ругающихся на языке формул). Если мы имеем зависимости по волатильности (зависимость как от ближайших лагов, так и цикличную - 24-часовую для H1), то почему бы не посчитать ту же взаимную информацию для returns взятых по модулю (это и будет в чистом виде волатильность), а затем полученное количество информации вычесть из сходного (где возвраты были со знаком +-). Если все корректно обсчитать, то в отстаке будем иметь зависимость по знакам. Вот это дело уже можно сравнить с шумовым временным рядом.
 
alexeymosc:
А я концептуально додумал дальнейших ход исследований (пишу для заинтересованных, а не ругающихся на языке формул). Если мы имеем зависимости по волатильности (зависимость как от ближайших лагов, так и цикличную - 24-часовую для H1), то почему бы не посчитать ту же взаимную информацию для returns взятых по модулю (это и будет в чистом виде волатильность), а затем полученное количество информации вычесть из сходного (где возвраты были со знаком +-). Если все корректно обсчитать, то в отстаке будем иметь зависимость по знакам. Вот это дело уже можно сравнить с шумовым временным рядом.

даже если будет найдено что-либо нетривиальное, то всегда останется вопрос правильного применения формул и главное как это применять на практике. Т.е. интерес чисто академический)))
 
avatara:

Но не могли бы Вы, Алексей, более чётко сформулировать ( по своей таблычке) какой гипотезе о распределении возвратов соответствую оценки хи-квадрат?

Приснописному "броуну", или что-то покруче?

А никакой. При оценивании зависимости хи-квадратом никаких гипотез о распределениях не измышляют. Получается, что это непараметрический критерий.

 
Mathemat:

А никакой. При оценивании зависимости хи-квадратом никаких гипотез о распределениях не измышляют. Получается, что это непараметрический критерий.

В смысле никакой?

Можно написать оцениваемую зависимость?

Может после формулок я вкурю. Или Вы надеетесь на равномерное распределение...

;)

 
Avals:

даже если будет найдено что-либо нетривиальное, то всегда останется вопрос правильного применения формул и главное как это применять на практике. Т.е. интерес чисто академический)))
Я думаю, результаты экспериментов по прогнозированию - это и есть основной критерий. Если будет очевидно, что статистика ТИ помогает, то все хорошо. А применять формулы конечно правильно нужно, сейчас начитываю про это статьи.
 
avatara: В смысле никакой?

Можно написать оцениваемую зависимость?

Может после формулок я вкурю. Или Вы надеетесь на равномерное распределение...

Да никакой, правду говорю. Hypotheses non fingo.

Вы когда-нибудь пробовали применять критерий хи-квадрат независимости величин? Я и сам несколько месяцев назад этого не умел, но вот взял и сделал. Попробуйте и Вы, там ничего сложного нет. Найдите методичку по матстату для какого-нибудь заштатного заведения и прочитайте. Чем проще и нагляднее будет расписана метода, тем быстрее вкурите.

На самом деле критериев хи-квадрат несколько. Но я говорю именно о том, который оценивает независимость величин. Этот критерий не оценивает ее, исходя из заданных априори распределений. Он всего лишь проверяет гипотезу о независимости двух величин при заданном уровне значимости (обычно 0.95 или 0.99). Чем ближе уровень значимости к 1, тем достовернее заключение.

Идеологическая основа критерия - обычная формула совместной вероятности двух величин. На пальцах: если P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) для любых допустимых x1,y1, то величины X и Y независимы. И наоборот. А хи-квадрат считает, грубо говоря, взвешенную сумму отклонений от этого равенства по всем возможным случаям и сравнивает с некоей граничной. Если полученная сумма больше этой граничной, то гипотеза о независимости величин (Нулевая) не принимается. Если меньше, то Нулевая не отвергается.

 
Mathemat:

Да никакой, правду говорю. Hypotheses non fingo.

Вы когда-нибудь пробовали применять критерий хи-квадрат независимости величин? Я и сам несколько месяцев назад этого не умел, но вот взял и сделал. Попробуйте и Вы, там ничего сложного нет. Найдите методичку по матстату для какого-нибудь заштатного заведения и прочитайте. Чем проще и нагляднее будет расписана метода, тем быстрее вкурите.

На самом деле критериев хи-квадрат несколько. Но я говорю именно о том, который оценивает независимость величин. Этот критерий не оценивает ее, исходя из заданных априори распределений. Он всего лишь проверяет гипотезу о независимости двух величин при заданном уровне значимости (обычно 0.95 или 0.99). Чем ближе уровень значимости к 1, тем достовернее заключение.

Идеологическая основа критерия - обычная формула совместной вероятности двух величин. На пальцах: если P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) для любых допустимых x1,y1, то величины X и Y независимы. И наоборот. А хи-квадрат считает, грубо говоря, взвешенную сумму отклонений от этого равенства по всем возможным случаям и сравнивает с некоей граничной. Если полученная сумма больше этой граничной, то принимается гипотеза о зависимости величин. Если меньше, то гипотеза о независимости не отвергается.

Не смешите...

Вам задали про гипотезу о распределении, а Вы о том, что только вчера об этом методе узнали.

Я настойчиво хочу узнать - какая нулевая гипотеза? Что они независимы?

 

Нулевая - "возвраты независимы". Ничего смешного, чесслово!

Никаких гипотез о распределениях я не проверял! Это другой хи-квадрат. А я проверял только зависимость!

Если Вам так хочется проверить распределение, - пожалуйста. С приличной точностью оно лапласовское.

 
Mathemat:

Нулевая - "возвраты независимы". Ничего смешного, чесслово!

Никаких гипотез о распределениях я не проверял! Это другой хи-квадрат. А я проверял только зависимость!

Если Вам так хочется проверить распределение, - пожалуйста. С приличной точностью оно лапласовское.

Ок!

бум смотреть.

---

гипотеза о независимости равнозначна гипотезе о равномерном распределении или нормальном?

Я хочу это выяснить.

Тогда при "лапласовости" - всё понятно.

 
alexeymosc:
А я концептуально додумал дальнейших ход исследований (пишу для заинтересованных, а не ругающихся на языке формул). Если мы имеем зависимости по волатильности (зависимость как от ближайших лагов, так и цикличную - 24-часовую для H1), то почему бы не посчитать ту же взаимную информацию для returns взятых по модулю (это и будет в чистом виде волатильность), а затем полученное количество информации вычесть из сходного (где возвраты были со знаком +-). Если все корректно обсчитать, то в отстаке будем иметь зависимость по знакам. Вот это дело уже можно сравнить с шумовым временным рядом.

Можно я по своему текущий момент сформулирую?

Итак, выбранный подход показывает наличие зависимостей. Наиболее очевидная, резонная и видимая невооружённым глазом зависимость - суточная периодичность волатильности.

Поэтому мне логичным следующим шагом исследования представляется попытка исключить из данных эту очевидную и очень сильную зависимость и посмотреть, покажет ли наш(ваш) метод наличие других зависимостей.

В качестве метода исключения я предлагаю просто отнормировать приращения на суточный профиль волатильности.

Причина обращения: