Статья "Проект Meta COT - новые горизонты анализа отчетов CFTC в терминале MetaTrader 4" - страница 27

 
C-4:
продолжение

Файлы раскрыл.

Давайте начнем с Газпрома. Вот два файла. Что означают цифры?

К примеру, OPEN в одном и другом файле - вроде должны быть равны, а они в разы расходятся 

кроме этого есть еще один файл. А здесь что есть что? Особенно последний столбик.

 

 

 

 
faa1947:

Файлы раскрыл.

Давайте начнем с Газпрома. Вот два файла. Что означают цифры?

К примеру, OPEN в одном и другом файле - вроде должны быть равны, а они в разы расходятся

кроме этого есть еще один файл. А здесь что есть что? Особенно последний столбик. 

Каждый файл содержит уникальную информацию, это непрерывный тиковый поток, сжатый в формат OHLCV в виде минутного таймфрейма. Таким образом, все файлы одного формата, и содержат одни и те же колонки, но информация в них абсолютно разная, поэтому они не совпадают между собой. Последняя колонка, Volume или колонка G, содержит тиковый объем или количество изменений параметра.

Например, рассмотрим файл открытого интереса 'GAZR-6.12 - OpenPosition'. Читаем первую строчку: на момент 23.04.2012 12:40 открытый интерес был 588412, затем в течении минуты менялся 22 раза (колонка G) в диапазоне от 588230 (колонка E) до 588462 (колонка D). Последнее поступившее значение было равно 588230 (колонка F).

Теперь по таблицам:

AskCount - Количество, контрактов выставляемых в стакане на покупку, или объем всех отложенных ордеров на покупку.

BidCount - Количество контрактов, выставляемых в стакане на продажу, или объем всех отложенных ордеров на продажу.

AskVolume - Количество участников, выставивших отложенные ордера на покупку.

BidVolume - Количество участников, выставивших отложенные ордера на продажу.

OpenPosition - количество открытых позиций, оно же открытый интерес умноженный на два. У одной единицы открытого интереса две разнонаправленных, равнообъемных позиции. 

 
C-4:

Каждый файл содержит уникальную информацию, это непрерывный тиковый поток, сжатый в формат OHLCV в виде минутного таймфрейма. Таким образом, все файлы одного формата, и содержат одни и те же колонки, но информация в них абсолютно разная, поэтому они не совпадают между собой. Последняя колонка, Volume или колонка G, содержит тиковый объем или количество изменений параметра.

Например, рассмотрим файл открытого интереса 'GAZR-6.12 - OpenPosition'. Читаем первую строчку: на момент 23.04.2012 12:40 открытый интерес был 588412, затем в течении минуты менялся 22 раза (колонка G) в диапазоне от 588230 (колонка E) до 588462 (колонка D). Последнее поступившее значение было равно 588230 (колонка F).

Теперь по таблицам:

AskCount - Количество, контрактов выставляемых в стакане на покупку, или объем всех отложенных ордеров на покупку.

BidCount - Количество контрактов, выставляемых в стакане на продажу, или объем всех отложенных ордеров на продажу.

AskVolume - Количество участников, выставивших отложенные ордера на покупку.

BidVolume - Количество участников, выставивших отложенные ордера на продажу.

OpenPosition - количество открытых позиций, оно же открытый интерес умноженный на два. У одной единицы открытого интереса две разнонаправленных, равнообъемных позиции. 


1. Что с чем мы собираемся сравнивать?

2. А цен нет? 

 
C-4:

Каждый файл содержит уникальную информацию, это непрерывный тиковый поток, сжатый в формат OHLCV в виде минутного таймфрейма. Таким образом, все файлы одного формата, и содержат одни и те же колонки, но информация в них абсолютно разная, поэтому они не совпадают между собой. Последняя колонка, Volume или колонка G, содержит тиковый объем или количество изменений параметра.

Например, рассмотрим файл открытого интереса 'GAZR-6.12 - OpenPosition'. Читаем первую строчку: на момент 23.04.2012 12:40 открытый интерес был 588412, затем в течении минуты менялся 22 раза (колонка G) в диапазоне от 588230 (колонка E) до 588462 (колонка D). Последнее поступившее значение было равно 588230 (колонка F).

Теперь по таблицам:

AskCount - Количество, контрактов выставляемых в стакане на покупку, или объем всех отложенных ордеров на покупку.

BidCount - Количество контрактов, выставляемых в стакане на продажу, или объем всех отложенных ордеров на продажу.

AskVolume - Количество участников, выставивших отложенные ордера на покупку.

BidVolume - Количество участников, выставивших отложенные ордера на продажу.

OpenPosition - количество открытых позиций, оно же открытый интерес умноженный на два. У одной единицы открытого интереса две разнонаправленных, равнообъемных позиции. 


1. Что с чем мы собираемся сравнивать?

2. А цен нет? 

 
faa1947:


1. Что с чем мы собираемся сравнивать?

2. А цен нет? 


Как же нет? Цены в архиве 1m_quotes1.zip + Дневные данные по РТС в файле RTS_Daily.csv.
 
C-4:

Как же нет? Цены в архиве 1m_quotes1.zip + Дневные данные по РТС в файле RTS_Daily.csv.

Действительно. Буду работать.

 

Итак, некоторый результат.

Взял в качестве зависимой переменной close цены по газпрому из GASP small

 

 

, а независимыми переменными: объем из GASP small (не знаю, что это такое) по газпрому,

 

 

 

close количества контрактов из GAZP-6.12-AskCount,

 

 

и close открытый интереса из файла GAZP-6.12 OpenPosition. 

 

Так как в исходных файлах дырки, то выбрал кусок из файлов, что выглядит так:

Date Time Open_q High_q Low_q Close_q Volume Open_con High_con Low_con Close_con Count_cont Open_OI High_OI Low_OI Close_OI Count_+OI
24.04.2012 10:00 16041 16041 16041 16041 687 6728 7590 6667 7559 270 608336 608336 607906 608258 98

.

.

24.04.2012 13:59 15968 15971 15933 15950 175 8408 8497 7399 8129 282 612984 615424 612984 615306 89

 Всего 241 наблюдение.

 Вот результат подгонки по МНК

 

 

Как видим исходные данные (независимые переменные) имеет крайне слабое отношение  к котиру.

 Посмотрим на график объемов - явно не к селу. выкинем.

 

Все также плохо. Показатель R-квадрат - отрицателен (!?).

Также очень плохой признак - разность между ценой и подгонкой явно не стационарна - имеет тренды. 

Готов реализовывать предложения. 

 

А R-квадрат-то как у Вас получился отрицательным!? Этож квадрат корреляции исходного ряда с его же аппроксимирующей функцией.

Неплохо было бы построить матрицу корреляций для начала + посмотреть как меняется корреляционная функция при смещении исходного ряда на несколько лагов вперед/назад.

 
faa1947:

, а независимыми переменными: объем из GASP small (не знаю, что это такое) по газпрому, 


Объем это обычный объем. Как минимум он влияет на волу.
 
C-4:

А R-квадрат-то как у Вас получился отрицательным!? Этож квадрат корреляции исходного ряда с его же аппроксимирующей функцией.

Неплохо было бы построить матрицу корреляций для начала + посмотреть как меняется корреляционная функция при смещении исходного ряда на несколько лагов вперед/назад.

У меня EViews. Отрицательный говорит об ошибке модели. Учитывая расхождение - величины не связаны о чем говорит не стационарный остаток.

Дел в том, что правая сторона уравнения (независимые переменные) образуют своеобразную "машку", я бы ее назвал "справедливой" ценой. Наиболее яркий пример такой цены - индекс. Отклонения любой составляющей от индекса - это широко используемая вещь. 

Причина обращения: