Линейная регрессия. Вроде должно сходиться, а не сходится. А может не должно?

 

Сверху. Получаю параметры линейной регрессии между еврой и фунтом. По этим параметрам подгоняю фунт к евре на графике евры.

Снизу. Получаю параметры линейной регрессии между фунтом и еврой. По этим параметрам подгоняю евру к фунту на графике фунта.

По идее картинки должны быть одинаковые, только цвета местами должны меняться, а по факту - разные картинки.

iS-1 - для графика евры. iS-2 - для графика фунта.

Файлы:
ind.zip  2 kb
 

Не думаю, что картинки должны быть одинаковые.

Когда Вы делаете линейную регрессию для двух рядов {Х} и {Y}, то у Вас действительно получается одна прямая в координатах [X,Y]. Однако, угловые коэффициенты при этом разные, потому что один из них - угол к оси ОХ, а другой - к оси OY. По идее их произведение должно быть равно 1. Проверьте.

Дальше. Приведенные 2 графика это вообще другие системы координат. Здесь на каждом присутствует только один из рядов {Х} и {Y}. Красная же линия - это (насколько я понял) скользящая ЛР от другого ряда. Поэтому они (картинки) в принципе не должны совпадать, также как не совпадают графики фунта и евры.

ИМХО

 
Integer:

Сверху. Получаю параметры линейной регрессии между еврой и фунтом. По этим параметрам подгоняю фунт к евре на графике евры.

Снизу. Получаю параметры линейной регрессии между фунтом и еврой. По этим параметрам подгоняю евру к фунту на графике фунта.

По идее картинки должны быть одинаковые, только цвета местами должны меняться, а по факту - разные картинки.

iS-1 - для графика евры. iS-2 - для графика фунта.


http://stat.smmu.edu.cn/history/pearson1901.pdf

Страница 8 - см. рисунок.

Ну и решение проблемы (чтобы были одинаковые результаты) там тоже найдете.

 

Да есть таки вечные ценности :). По крайней мере в математике :).

Если кому лень читать статью, могу предложить вот такое рассуждение:

Чтобы графики были одинаковыми, речь должна идти об одной и той же ЛР. То есть если EUR = B*GBP + Val_0, то GBP = EUR/B - Val_0/B. То есть, если fLR_AB("EURUSD",0,"GBPUSD",0,period,0,Val_0,B) возвращает V0 и B0, то fLR_AB("GBPUSD",0,"EURUSD",0,period,0,Val_0,B) должна возвращать -V0/B0 и 1/B0. Однако выражения для коэффициентов ЛР несимметричны по отношению к X и Y, поэтому точно это правило выполняться не может. Интересно, кстати, будет ли оно выполняться в статистическом смысле?

 
Candid:

Чтобы графики были одинаковыми, речь должна идти об одной и той же ЛР. То есть если EUR = B*GBP + Val_0, то GBP = EUR/B - Val_0/B.

При этом хорошо бы еще учитывать, что EUR и GBP это не реальные данные цены пар EURUSD и GBPUSD, а точки линии регрессии, то есть некоторое приближение реальных данных.

 

Yurixx, вы немного не правильно понимаете линейную регрессию. Линейная регрессия это установление линейной взаимосвязи между двумя рядами данных. Известная всем прямая линия называемая линеной регрессией это частный случай применения метода линейной регрессии.

 

Integer, не буду в ответ оценивать ваше понимание, просто скажу, что упомянутая вами "линейная взаимосвязь между двумя рядами данных" графически выражается прямой линией. И никакой больше.

Попытаюсь еще раз объяснить вашу проблему словами (рисовать графики облом - извините). Есть у вас два ряда {Xi} и {Yi}. Построили вы их линейную регрессию Yi = B*Xi + Val_0. Это прямая в координатах [x,y]. Произвольная точка [Xi,Yi] в общем случае не лежит на этой прямой. Если вы строите линии на графике евро (т.е. Х), то для каждого Xi по приведенной формуле вы вычисляете Y1i. Как вы должно быть понимаете Y1i <> Yi. Аналогично, на графике фунта вы по значению Yi из этой формулы вычисляете X1i. Но X1i <> Xi.

Отклонения (Y1i - Yi) и (X1i - Xi) не коррелируют друг с другом и зависят только от положения точки [Xi,Yi] относительно линии регрессии. Поэтому картинки на графиках евро и фунта должны и будут отличаться друг от друга.

Впрочем, думаю, что можно привести эти картинки к некоторому единству. Для этого нужно ввести параметризацию временем и для каждого момента времени получить пару координат [X1i,Y1i] точки ЛР в этот момент времени. Ряды {X1i} и {Y1i} позволят нарисовать две линии, евро и фунта, на любом из ваших графиков. То есть линий всего будет три: график цены инструмента и два графика скользящей ЛР, один для евро, другой для фунта.

По-моему это немного проще, чем читать статью по ссылке lea.

 

я уже неоднократно говорил о несимметричности оценок для прямой пары и обратной ей. Т.е. аппроксимация Х/Z(y)!=Z/X(y), так мне подметилось. ;)

y=t. к слову.

МНК эксплуатирует минимум квадрата отклонения. Но это справедливо для значений больше 1. и ровно наоборот к данным <1.

Почему правдоподобие аппроксимации индексов хуже реальных данных?

;)

 
FreeLance:

...

МНК эксплуатирует минимум квадрата отклонения. Но это справедливо для значений больше 1. и ровно наоборот к данным <1.

..

алгоритмы должны быть правильные. вот пример все нормально. вродебы

 

 

В данном случае речь идёт о разных регрессиях: одна минимизирует квадрат отклонения Xi, другая Yi . Они совершенно не обязаны совпадать.

Да и формулы у них разные :)


Yurixx:

При этом хорошо бы еще учитывать, что EUR и GBP это не реальные данные цены пар EURUSD и GBPUSD, а точки линии регрессии, то есть некоторое приближение реальных данных.

Нет, я говорю здесь о конкретных индикаторах Integer'а, поэтому в правых частях реальные данные цены пар EURUSD и GBPUSD, а вот в левых - значения этих самых индикаторов, которые, по его предположению, "должны" совпадать с реальной ценой с точностью до масштабного коэффициента. То есть на самом деле не должны. В этом смысле формулы действительно не совсем корректны, поскольку этот самый масштабный коэффициент для простоты опущен :)

Кстати, вот это утверждение ошибочно:

Yurixx:

Когда Вы делаете линейную регрессию для двух рядов {Х} и {Y}, то у Вас действительно получается одна прямая в координатах [X,Y].

- прямые как раз будут разные (см. начало этого поста). Именно про это рекомендованная lea картинка из Пирсона.


 

Про то, что значения должны совпадать я не говорил. Если привести обе картинки к одному масштабу, то должно быть совпадение. Зрительно должны быть одинаковые картинки.

Причина обращения: