Оценка погрешности прогноза - страница 2

 
Nimnul:

Здравствуйте!

Я не специалист в тех.анализе, да и вообще в таких "страшных" словах как трейдинг, форекс, и т.п.
Просто как раз сейчас я занимаюсь одной похожей математической проблемой. Зашел в тупик и уверен, что никто лучше профессионалов тех.анализа не ответит на мой вопрос.

У меня есть временной ряд за некоторый период (для примера, пусть это будет ежедневный курс франка по отношению к доллару за последний год). Я хочу выявить общий тренд этого ряда (то есть оценить, куда движется этот курс). Для этого я каким-то образом аппроксимирую этот ряд (пусть, для простоты, прямой линией). Далее я хочу экстраполировать этот тренд на некоторое расстояние вперед (то есть попробовать предсказать курс на последующие годы).

ВОПРОС: как оценить погрешность этой экстраполяции.

Первое что приходит на ум математику, это посчитать среднеквадратичное отклонение на известной выборке и считать его отклонением для экстраполяции. НО:

1. Очевидно, что чем данные выборки "старее", тем меньше их влияние на "свежие" данные. Иными словами, если в начале года расхождение было сильным, а под конец стало более-менее совпадать, то не правильно считать именно среднеквадратичное отклонение. Очевидно, нужно задаться отклонением на некотором интервале перед концом выборки. Как оперделить и обосновать на каком?

2. Очевидно, что величина отклонения для экстраполяции должна быть тем больше чем больше период экстраполяции. То есть если, например, можно взять среднеквадратичное отклонение в качестве отклонения для 1-го прогнозного значения, то, очевидно, что для 2-го погрешность должны быть уже больше. Следовательно, нужно задаться неким темпом роста этой погрешности. Как определить и обосновать этот темп?

Большое спасибо!
С уважением,
Никита


ну если прям так нужно учитывать "свежесть" данных, то можно вклад ско считать неодинаковым, а экспоненциально взвешенным к примеру.

в классической формуле равный вклад каждого отклонения в дисперсию (вес 1/N ). Можно по другому распределить веса, но чтобы в сумме была 1. Вобщем, по аналогии с разными вариантами скользящего среднего выбирайте https://ru.wikipedia.org/wiki/Скользящая_средняя

Будет типа: ско=SQRT(Wn(Xn-Xср)^2+......+ W1(X1-Xср)^2 ), где Wn+...+W1=1

На счёт пункта 2, логично чтобы величина ско увеличивалась пропорционально квадр.корню из увеличения данных. Т.е. если на 100 данных ско=X, то на 400 - ско=2X

 

Вообще есть такое выражение для дисперсии случайного блуждания

,

где альфа - тот самый дробный порядок дифференцирования, который и определяет, с чем мы имеем дело - диффузией (а=1, обычная производная в левой части СДУ) или суб/супердиффузией (a<1 и a>1 соответственно). Если вспомнить, например, эмпирическое значение для показателя роста СКО на EURUSD (2*a-1)/2 ~ 0.48, то отсюда a~0.98, т.е. действительно имеем дело с субдиффузией.

 
Nimnul:

Здравствуйте!


что никто лучше профессионалов тех.анализа не ответит на мой вопрос.

Технического анализа как науки не существует. Это чрезвычайно развитые средства отображения графической информации, глядя на который некоторые умники анализируют и прогнозируют - у кого-то получается, у большинства нет, все строго индивидуально, т.е. не обладает признаком научности.

ВОПРОС: как оценить погрешность этой экстраполяции

Все поставленные вами вопросы пытаются решить в рамках- эконометрики (математической статистики).

Из эконометрики на данном этапе я бы выделил следующее:

1. Исходный временной ряд нестационарен, т.е имеет переменное мо, а главное, переменную дисперсию. Поэтому все Ваши рассуждения о прогнозе на основе ско не верны, так как мы не можем прогнозировать значение ско за правой стороной графика.

2. Первый шаг - детрендирование позволяет избавиться от первой составляющей нестационарности и дает основу для прогноза вперед

3. Вся собака зарыта в остатке = исходный котир - тренд. Очевидно, что он не стационарен. Занимаются этой нестационарностью. Имеется довольно развитые модели ARCH (GARCH, EGARCH и т.д.), которые моделируют остаток. Эти два шага (детрендирование и ARCH) позволяют решить проблему моделирования и прогноза, но далеко не во всех случаях.

4. В рамках эконометрики существует набор тестов, который позволяет судить о стабильности полученной модели для нестационарного ряда, но они тоже не решают проблемы полностью.

5. Основной проблемой является проблема сдвига (breakpoint). Сдвиг может менять детерминированно и стохастически параметры модели, а также саму функциональную форму модели (была линейной, а потом стала квадратичной и т.д.). Большинство последних публикаций направлено на решение проблемы сдвига.

На форуме имеется несколько моих веток, где обсуждаются поднятые Вами проблемы и имеются ссылки на литературу и программные средства.


 
Nimnul:

Мне не нужно как можно точнее прогнозировать значение ряда. Нужно 1 - определить тренд (ну это понятно как) и 2 - оценить погрешность для этого тренда в будущем (вот тут то и есть моя проблема).

То есть нужно не точное значение точки Yi(факт)=Yi(прогноз), а такой парамент Di, чтобы можно было утверждать, что значение Yi(факт) обязательно попадет в интервал [Yi(прогноз) - Di, Yi(прогноз) + Di]

Ну вроде по задаче есть две прямые, прогнозная и истинная, то не подойдет ли тут угол расхождения между ними в каком-то интервале?
 

alsu:

Короче, правильно вам сказали - вопросы ваши настолько фундаментальны, что их прояснение сделало бы вас весьма богатым человеком (даже против вашей воли, если, конечно, ваша фамилия не Перельман:)), но чтобы их решить одного лишь знания математики недостаточно. Скорее всего, тут необходимо еще и прозрение)). По крайней мере, того, кто это реально сделает, я бы без сомнения назвал гением.

Все уже сделано, т.е. на вопросы автора ответы в большинстве даны, и не гением, а простым математиком из Москвы. Однако, рыбы в этом особой нет для форекса, т.к. степень нестационарности форексных рядов очень велика. Да, диапазон можно определить, и длину выборки обосновать, но это ничего не дает, т.к. в условиях изменчивости ФР либо он будет огромным, либо ФР будет многомодальная, либо будет меняться та самая альфа-т.е. вид диффузии, т.е. вид основной модели. На слабо-нестационарных рядах такой подход может работать. Ссылку на работу готов дать только Alsu, учитывая его безвозмездную помощь многим.
 
Да, все тренды в прошлом...
 

Уважаемые Коллеги!

Большое спасибо всем откликнувшимся.

Хотелось бы кое что пояснить. Я НЕ занимаюсь форексом. Поэтому я, увы и ах, Вам не конкурент (зарабатываю я совершенно на другом), по этой же причине и специальными знаниями в этой области я не обладаю (да и не стремлюсь).

С форекса я просто беру данные как примеры, потому, что, по моему мнению, процессы здесь наиболее хаотические (то есть в изменении курса валют нет системы которую можно было бы описать математически). Есть и технические задачи этого же уровня, но такой числовой базы как на форексе не найти нигде, потому что в технике эксперимент дело дорогое и долгое.

Мне нужно решить задачу прогнозирования погрешности для тренда временного ряда.

Я попробовал в Экселе набросать простенький пример. Есть ряд Y(i+1)=Y(i)+i - четкий возрастающий тредн. на первых семи значениях этого ряда по МНК найдено уравнение Yi_прогноз=4,5x-6. Я специально взял самую простую линейную ситуацию. Я формирую два прогноза Прогноз MIN = Yi_прогноз - Di и Прогноз MAX = Yi_прогноз + Di. Где Di - среднеквадратичное отклонение на i-м шаге. таким образом добиваясь того, что Yi_факт попадает в интервал [Yi_прогноз - Di, Yi_прогноз + Di]. Заканчиваются мои 7 экспериментальных значения и я экстраполирую ряд еще на два шага. На графиках видно, что Y8_факт и Y9_факт в указанный интервал уже не попадают. Причина понятна - для этого случая нельзя использовать в качестве погрешности среднеквадратическое отклонение, так как должно быть D9>D8>D7 (а не как у меня D9=D8=D7).

Мой вопрос, как можно было бы определить и обосновать эти D9 и D8.

Еще раз большое спасибо!

С уважением, Никита

 

Почему-то не получается прикрепить файл :(

Прошу прощения.

Вот ссылка для загрузки: http://narod.ru/disk/48317665001.5a0a2315e86190a19984447d29752c4f/%D0%9F%D1%80%D0%B8%D0%BC%D0%B5%D1%80.xlsx.html

 

отсебячу.

График - это полимодельное поле, где существуют мономодельные цепочки однородных по характеристикам торговые события.

Когда мы определяем функцию описывающую однородные события, мы тем самым минимизируем наличие чужеродных моделей на исследуемом sample.

Но к сожалению, в будущем мы натолкнёмся на совсем новые ценовые модели, природа которых не была известна ранее.

 
Jingo:

отсебячу.

Когда мы определяем функцию описывающую однородные события, мы тем самым минимизируем наличие чужеродных моделей на исследуемом sample.


Фух. Да не об определении функции идет речь, не о выборе наиболее подходящего решения из набора возможных решений.

РЕЧЬ ОБ ОЦЕНКЕ ПОГРЕШНОСТИ ДЛЯ УЖЕ ЗАДАННОЙ ФУНКЦИИ

Причина обращения: