Статистика зависимостей в котировках (теория информации, корреляция и другие методы feature selection) - страница 23

 
joo:
... и в каком сочетании?"
Это сложнее. Намного сложнее и затратнее по вычислениям. Скажу так: набор информативных переменных отобрать просто, убрать из них избыточные (взаимоинформативные) посложнее; а подобрать пары, тройки.... до куда хватит компьютера, переменных, чьи сочетания влияют на целевую переменную - это сложнее в экспоненциальной прогресии, во-первых, из-за колоссальных вычислений.
 
alexeymosc:
Это сложнее. Намного сложнее и затратнее по вычислениям. Скажу так: набор информативных переменных отобрать просто, убрать из них избыточные (взаимоинформативные) посложнее; а подобрать пары, тройки.... до куда хватит компьютера, переменных, чьи сочетания влияют на целевую переменную - это сложнее в экспоненциальной прогресии, во-первых, из-за колоссальных вычислений.
а каким образом осуществляется поиск, не перебором ли?
 

Очень странно, что полученное распределение для GARCH(1,1) имеет вид нормального. Скажу больше, этого просто не может быть. Фирменной фишкой подобных моделей является толстохвостость и вытянутость, - прямо для подражания реальным рыночным распределениям. По всей видимости полученный график просто не показателен, либо период учета волатильности (P=1, Q=1) не достаточно большой, отсюда хвостатость проявляется слишком слабо.

Но интересно другое:

На расчетном графике четко виден след влияния GARCH(1,1), а именно на первом лаге видно показательное возмущение "взаимосвязи" и неопределенность на всех остальных данных. Именно так и должно быть, ведь модель помнит только волатильность предыдущего бара. Уверен, что для GARCH(3,3) будет четкое выделение первых трех лагов, для GARCH(20, 20) первых двадцати лагов и т.д.

Попробую повоевать с MathLab'ом и все-таки добиться от него данных GARCH(20, 20). Если их анализ покажет взаимосвязь на 20 периодов, дело ясное - формула показывает взаимосвязь волатильности.

 
C-4:


Попробую повоевать с MathLab'ом и все-таки добиться от него данных GARCH(20, 20). Если их анализ покажет взаимосвязь на 20 периодов, дело ясное - формула показывает взаимосвязь волатильности.

Не стоит. Я и так знаю, что формула ЭТО учитывает... Взгляните на график 5-ти минуток. Очевидная зависимость волы на ближайших лагах и на лаге 288 - суточный цикл. Хотя, если хочется, валяйте. Проверю.

Мы то пытаемся отыскать "другие зависимости", ведь взаимная информация вбирает в себя ВСЕ возможные зависимости. Надо их уметь отделять.

 

EURUSD H1.

I по исходному ряду (та же дискретизация на 5 квантилей):

Сумма взаимной информации: 3,57 Бита! Самое большое значение из всех протестированных таймфреймов.

А теперь возьмем returns ^ 2, избавимся от знака, изучаем волатильность:

Похоже. Но сумма I = 5,35 Бита.

Логично! Ведь, неопределенность по ряду чистой волатильности меньше.

А что будет если из одно вычесть другое?

 
alexeymosc: Вот так выглядит матрица частот (1-ый лаг - целевая переменная) для случайных данных с характеристиками 5-ти минуток.

Черт побери. Мне в твоих матрицах почудились пробит и логит. Заглянул в поисковик - и к чему они тут... потом понял, что это просто вероятность и ее логарифм.

P.S. Лю-у-у-у-ди, вам все понятно в этих табличках? Если непонятно - спрашивайте, спрашивайте. За глупые вопросы бить не будем (т.к. я и сам себя тут немного дурачком ощущаю).

В кои-то веки нарисовалась приличная тема, в которой почти нет стёба, ехидства и ориентации на немедленную рыбу вместо удочки - зато есть очень интересный процесс поиска истины...

Где в эконометрике можно найти такие вопросы?

 
anonymous:


Верно, рынок сложнее. Однако это не повод игнорировать наблюдаемый феномен

Я не занимаюсь научными исследованиями на рынке. Цель конкретная - сделать прогноз на шаг вперед.

Насчёт тестов: гетероскедастичность returns - общепризнанный в литературе факт

Это лозунг, который говорит, что где-то что-то видел. От чтения этих публикаций денег у меня больше не становится.

Если быть точным, то на гетероскедастичность исследуется не только ретернс, которые вычисляются по разным формулам, а остатки моделей, причем именно это является стандартом в в пакетах эконометрики.

Иногда тесты на гетероскедастичность применяют к предикторам и ошибкам модели.

Если под "ошибки модели" вы имеете ввиду остаток от модели = разность между исходной котировкой и моделью, то я согласен. Причем тесты на гетероскедастичность применяются не иногда, а всегда. Если в остатке от модели имеется гетероскедастичность, то она моделируется, а конечная цель совокупной модели - это получение стационарного остатка (мо и дисперсия - константа). Если мо и/или дисперсия переменные величины - то прогноз не возможен, так как ошибка прогноза становится переменной величиной.

 
Mathemat:?

В кои-то веки нарисовалась приличная тема ..

Хотелось бы заметить, что все посты, которые ставили под сомнение приличность темы, были проигнорированы.

 
не надо генерить СБ на основе GARCH. Нужно взять реальный ряд и сгенерить СБ на основе реальной волатильности. Здесь выкладывал скрипт https://forum.mql4.com/ru/41986/page10 который заменяет в оффлайн историю реального инструмента на СБ используя тиковый волюм. Такой СБ будет практически на 100% повторять реальную волу. GARCH и т.д. они не учитывают множество нюансов типа различных цикличностей волы и многие другие. Если с этим рядом СБ и с рядом на основе которого он сгенерирован будут отличия, то это уже интересней :)
 
alexeymosc:

EURUSD H1.

I по исходному ряду (та же дискретизация на 5 квантилей):

Я правильно помню что в качестве исходных данных здесь модуль процентных приращений?

Но если так, то это по сути та же волатильность (то есть её монотонная и однозначная функция), можно ожидать что все связанные с волатильностью эффекты будут проявляться и здесь, пусть и в несколько фильтрованном виде. И поскольку эффекты волатильности видимо далеко превосходят по силе все остальные феномены рынка, перспектива разглядеть на их фоне "что-то ещё" выглядит довольно проблематично. Я, повторюсь, считаю более перспективным пытаться последовательно исключать из исходных данных известные, но "бесполезные" эффекты.

Кстати, Алексей (Mathemat), у тебя исходные данные тоже модули?

Причина обращения: