Статистика зависимостей в котировках (теория информации, корреляция и другие методы feature selection) - страница 22

 
alexeymosc: Может быть, Алексей. По крайней мере стандартные ТФ можно проверить за 3-4 часа. А есть вообще способ выгружать из МТ кастомные таймфреймы для анализа?

Насчет кастомных (нестандартных типа М10, М20 и т.п.) не знаю, но стандартные всегда можно. На М5 я могу попытаться сам проверить на своем хи-квадрате. Считать будет долго, но искусство требует жертв.

Кастомную историю вроде можно выгрузить с помощью скрипта period_converter.

joo: А я шибко сомневаюсь, что это М1. На М1 у меня не получалось добиться приемлемой обучаемости сеток.

Андрей, у тебя, наверно, "целевая функция" сетки не информационная.

Я не агитирую тебя обучать сетку на М1. Это просто дело принципа - проверить зависимости на как можно более мелком ТФ. Во всяком случае, процент баров на истории, от которых зависит нулевой, у меня явно возрастал в последовательности D1 -> Н4 -> Н1 -> М30. На самых мелких не проверял.

Было бы слишком просто, если бы вся инфа в котировках передавалась только через волатильность. Не верю я, что рынкет настолько примитивен, чтобы он тупо сводился к эконометрическим моделям с гетероскедастичностью.

 
joo:

1. Индикаторы не использую, последнее время совсем (если понимать под понятием "индикатор" процедуру преобразования котира в вид, дающий количество сигналов меньше, чем содержится баров за отчетный период).

2. Нет, но с удовольствием попробую, если просеку как это делать, начитавшись этой ветки.

1. А если нужно как-то объединить инфу по нескольким барам, то преобразование уже станет тех.индикатором?

2. А я попробовал это сделать. Провел простой эксперимент с машкой. Обычно как делают? Если машка пошла вверх, то цена пойдет вверх. Вот я взял разницу между соседними значениями MA и посмотрел на каком именно лаге достигается максимальная информативность для знака изменения цены. Оказалось, что отнюдь не последнее изменение, а отстоящие на десятки баров. Также я посмотрел для какого именно изменения цены наиболее информативна MA, попробовал изменение цены на бар вперед, на 2,3 ... 10. Максимум оказался на 5 барах вперед, MA была с периодом 5. Может просто совпадение... Но, это важно.

Хотя, конечно, в MT это все можно прогнать механическим перебором.

 
Mathemat:

Не верю я, что рынкет настолько примитивен, чтобы он тупо сводился к эконометрическим моделям с гетероскедастичностью.

Использовал 5 разных тестов на разные виды гетероскедастичности для большого числа моделей - ни разу не нашел этой гетероскедастичности.

 
Mathemat:
Подозреваю, что это М1.

На маленьких таймфреймах нужно будет правильно выбрать цены для расчётов. Делать их только по Bid - нехорошо. Лучше по 0.5*(Bid+Ask).
 
Mathemat:


Я не агитирую тебя обучать сетку на М1. Это просто дело принципа - проверить зависимости на как можно более мелком ТФ. Во всяком случае, процент баров на истории, от которых зависит нулевой, у меня явно возрастал в последовательности D1 -> Н4 -> Н1 -> М30. На самых мелких не проверял.

Было бы слишком просто, если бы вся инфа в котировках передавалась только через волатильность. Не верю я, что рынкет настолько примитивен, чтобы он тупо сводился к эконометрическим моделям с гетероскедастичностью.

Алексей, согласен! Я прямо сейчас замер сделаю для часовых баров, чтобы сравнить с дневками и 5-ми минутками.

И я не верю в том, что вся отличная от шумов взаимная информация сводилась в волатильности. Привожу пример, и основа моих сомнений.

Вот так выглядит матрица частот (1-ый лаг - целевая переменная) для случайных данных с характеристиками 5-ти минуток.

Видим, что вероятности равномерны, как и полагается для таких данных.

А так выглядит матрица для естественных данных:

Видим, 1-5 и 5-1 - выделяющиеся из общего ряда частоты (хотя, 5-5 - тоже выделяется из-за кучности волатильности). И, хотя именно на этом баблишко и не сделаешь, скорее всего, то предмет интереса есть. А если взять несколько лаговых переменных, глядишь и еще повысится надежность прогноза. (Кстати, отметим, что кросс-энтропия системы для реальных данных меньше, то есть, предсказуемость увечилась, как и полагается. Это относится к прошлым дискуссиям на тему одного числа, описывающего всю систему.)

Дальше, возьму часовки и потом возьму значения returns по модулю, вычту одно из другого и посмотрим, что останется (остаться должна взаимная информация относящаяся к знаку изменения цены). Если успею сегодня - сегодня сделаю, нет - завтра.

 
faa1947: Использовал 5 разных тестов на разные виды гетероскедастичности для большого числа моделей - ни разу не нашел этой гетероскедастичности.
И за что тогда Инглу дали Нобелевку (здесь см. 2003 год)?
 
faa1947:

Не верю я, что рынкет настолько примитивен, чтобы он тупо сводился к эконометрическим моделям с гетероскедастичностью.

Использовал 5 разный тестов на разные виды гетероскедастичности для большого числа моделей - ни разу не нашел этой гетероскедастичности.


Верно, рынок сложнее. Однако это не повод игнорировать наблюдаемый феномен.

Насчёт тестов: гетероскедастичность returns - общепризнанный в литературе факт, который можно очевиден даже на глаз. Если вы её не нашли - значит что-то делали не так. Иногда тесты на гетероскедастичность применяют к предикторам и ошибкам модели, но это больше проверка спецификации модели.

 
Mathemat:

Андрей, у тебя, наверно, "целевая функция" сетки не информационная.

Я не агитирую тебя обучать сетку на М1. Это просто дело принципа - проверить зависимости на как можно более мелком ТФ. Во всяком случае, процент баров на истории, от которых зависит нулевой, у меня явно возрастал в последовательности D1 -> Н4 -> Н1 -> М30. На самых мелких не проверял.

Было бы слишком просто, если бы вся инфа в котировках передавалась только через волатильность. Не верю я, что рынкет настолько примитивен, чтобы он тупо сводился к эконометрическим моделям с гетероскедастичностью.

Да не, я собственно против М1 "ничего не имею". Однако, при прочих равных условиях (при чем подавая на вход данные в таком виде, что бы отсутствовала информация о волатильности) наилучшие результаты наблюдал на Н1. Вот я и высказался, возможно есть какой то другой, отличный от Н1 ТФ, где то рядом, который "лучше".
 
alexeymosc:

2. А я попробовал это сделать. Провел простой эксперимент с машкой. Обычно как делают? Если машка пошла вверх, то цена пойдет вверх. Вот я взял разницу между соседними значениями MA и посмотрел на каком именно лаге достигается максимальная информативность для знака изменения цены. Оказалось, что отнюдь не последнее изменение, а отстоящие на десятки баров. Также я посмотрел для какого именно изменения цены наиболее информативна MA, попробовал изменение цены на бар вперед, на 2,3 ... 10. Максимум оказался на 5 барах вперед, MA была с периодом 5. Может просто совпадение... Но, это важно.

Хотя, конечно, в MT это все можно прогнать механическим перебором.

Вот поэтому мне и интересны ваши изыскания, потому что дают ответ на вопрос:"Какие порядковые номера баров лучше скармливать сетке и в каком сочетании?"
 
Mathemat:
И за что тогда Инглу дали Нобелевку (здесь см. 2003 год)?
Я упомянул пять разных тестов - тоже вроде для чего-то нужно. Есть более смешной факт: тулбокс Матлаба под названием "эконометрика" рассматривает только разные ARCH модели. Я никогда не торговал опционы. Быть может там. Но на Форексе и смотрел некоторые фондовые инструменты, в которых моделируется уровень инструмента - ни разу. Причем при создании модели, прежде чем получить что-то стоящее, рассматриваешь очень большое число вариантов - и ни разу. Хотя быть может не умею, или не тот класс моделей. Кстати, была как-то здесь статья про моделирование ARCH, так там тоже был комментарий, что у нас это не применимо.
Причина обращения: