Как не "перетренировать" НС - страница 2

 

Вы на каждом баре тренируете?

ИМХО, НС MLP лучше дополнять готовую ТС.

Скажем, у ТС сигнал на открытие, НС анализирует текущее состояние рынка, возвращает вероятность результата.

Эти же сигналы ТС формируют обучающее множество векторов (может быть постоянного количества)...

 
YDzh >>:

4.000 EURUSD15. Альтернативный вариант М5, но чаще обращаюсь к М15... по непонятным самому причинам

Обратитесь к H4, D1... сообщите о результатах.


С уважением, Ярослав.

 

Есть еще один интересный аспект: когда не задаешь стоп лосс, работает... но просадки дает - мама не горюй. Так неправильно. А ставишь стоп лосс - "боится" и вообще ничего не делает %)

 
YDzh писал(а) >>

Есть еще один интересный аспект: когда не задаешь стоп лосс, работает... но просадки дает - мама не горюй. Так неправильно. А ставишь стоп лосс - "боится" и вообще ничего не делает %)

Вообще говоря, Вам только Решетов более менее ответил, всё остальное почти хрень.

Когда обучаешь сеть на профит(именно поэтому Вы исполльзуете ГА, потому что там это задаётся за пять сек. и не надо никакого функционала ошибки...)

ТО значимые для fitness функции становяться только те значения которые непосредственно описывают точки входа, а их из всей выборки в 4000 может быть всего пару десятков, отсюда и подгон мало точек для генерализации выборки. Причём подгонка может быть даже если сигналы типа Buy->Close_Buy&&Sell->Close_Sell&&Buy.......

Но тем не менее какая бы сеть ни была(кол-во слоев, нейронов и т.д.(структура)) есть метод поиска асимптоты ошибки обобщения и ошибки обучения, статья В.Г. Царегородцева "ОПТИМИЗАЦИЯ ЭКСПЕРТОВ BOOSTING-КОЛЛЕКТИВА ПО ИХ КРИВЫМ ОБУЧЕНИЯ " - там понятно описано как избежать переподгонки сети, но тоже не совсем в Вашем случае, это просто на будущее.

 
YDzh писал(а) >>

Здрассте всем. Может кто знает, что делать...

"Воспитываю" нейронную сеть (или как ее здесь зовут, перцептрон) на 4.000 барах данных М15 с помощью генетики. Как вариант - 17 входных сигналов, один скрытый слой в два раза больше, два нейрона на выходе (предполагается, что будет две сети, которые работают параллельно. Одна "заточена" на long, вторая на short. Два нейрона, соответственно, чтоб открыть/держать позицию и закрыть).

"Воспитывается" %) Собирает где-то 7000 пунктов на EURUSD (spread 18), процент попадания по сделкам где-то 85%. Только почему-то во время тестирования на новых данных ничего приличного не выходит. Что я не так делаю-то? Эффект "перетренировки" наступает или "кормлю" чем-то не тем?

Cуществует оптимальная длина обучающей ваборки Р, при которой достигается минимум суммы ошибки аппроксимации и обобщения. Этот оптимум однозначно определяется числом синапсов w в сети и размерностью входа d (чмслом входов сети):

Popt=k*w*w/d, где k - безразмерная константа порядка 1 и учитывает факт изменчивости рынка.

Критерием оптимума является соизмеримость ошибки сети на тестовой выборке и на обучающей, т.е. нормально обученная сетка если и угадывает правильно 55%, то и в тесте на новых данных покажет примерно такой же результат. Причём, для такой НС не существует проблемы переобучения связанного с увеличением числа итераций в методе ОРО - нет локального минимума ошибки - функция момнотонна и асимтотически стремится к константе.

Очевидно, что в вашем случае P>Popt, этим и обусловлено переобучение НС и её низкая прогностическая способность на новых данных.

 

учите матчасть..................

 
m_a_sim писал(а) >>

учите матчасть..................

Молодец! Вот я, например, винодел по образованию. Ты вино любишь? Захочешь ты вино сделать, а оно у тебя завоняется. Ты в форум - люди, почему вино скисло. А тебе: матчасть учи. Той матчасти три с половиной года, несколько разделов химии, технологии и т.п., о чем ты, как человек без образования в этой сфере, без понятия. Ощущаешь ситуацию?

 
YDzh >>:

Молодец! Вот я, например, винодел по образованию. Ты вино любишь? Захочешь ты вино сделать, а оно у тебя завоняется. Ты в форум - люди, почему вино скисло. А тебе: матчасть учи. Той матчасти три с половиной года, несколько разделов химии, технологии и т.п., о чем ты, как человек без образования в этой сфере, без понятия. Ощущаешь ситуацию?

Это у нас шутка на работе такая, если человек плывет по теме или что-то не понимают, ему один ответ: "Учи матчасть", или "наберут по объявлениям" :))

 
StatBars писал(а) >>

Вообще говоря, Вам только Решетов более менее ответил, всё остальное почти хрень.

Когда обучаешь сеть на профит(именно поэтому Вы исполльзуете ГА, потому что там это задаётся за пять сек. и не надо никакого функционала ошибки...)

ТО значимые для fitness функции становяться только те значения которые непосредственно описывают точки входа, а их из всей выборки в 4000 может быть всего пару десятков, отсюда и подгон мало точек для генерализации выборки. Причём подгонка может быть даже если сигналы типа Buy->Close_Buy&&Sell->Close_Sell&&Buy.......

Но тем не менее какая бы сеть ни была(кол-во слоев, нейронов и т.д.(структура)) есть метод поиска асимптоты ошибки обобщения и ошибки обучения, статья В.Г. Царегородцева "ОПТИМИЗАЦИЯ ЭКСПЕРТОВ BOOSTING-КОЛЛЕКТИВА ПО ИХ КРИВЫМ ОБУЧЕНИЯ " - там понятно описано как избежать переподгонки сети, но тоже не совсем в Вашем случае, это просто на будущее.

Ну да, первоначально на выходе было три сигнала - в разных вариантах

  • open/hold long (close short)
  • off market (второй вариант просто ничего не делать)
  • то же самое по short

Ушел на две сети, потому что не видел ни одного результата, чтоб сеть использовала оба движения. Или (почти) только покупает или только продает. На самом деле сеть обучается не только на профит. Это тоже было, потом пришлось добавить еще критериев. Одним словом, ГА потому, что в принципе понимаешь, чего хочешь... :)

Сигналов порядка 80 на 4.000 баров получается

 
YDzh писал(а) >>

Ну да, первоначально на выходе было три сигнала - в разных вариантах

  • open/hold long (close short)
  • off market (второй вариант просто ничего не делать)
  • то же самое по short

Ушел на две сети, потому что не видел ни одного результата, чтоб сеть использовала оба движения. Или (почти) только покупает или только продает. На самом деле сеть обучается не только на профит. Это тоже было, потом пришлось добавить еще критериев. Одним словом, ГА потому, что в принципе понимаешь, чего хочешь... :)

Сигналов порядка 80 на 4.000 баров получается

ну вот на 80 сигналов около 160 реально значимых точек(которые влияют на все Ваши критерии оценки) все остальные точки могут быть где угодно, главное чтоб они на позиции не влияли... Я веду к тому что реальная выборка около 160 примеров а не 4000...

Если сеть оптимизируется на более чем 1 критерий, то как Вы эту задачу решили? - просто интересен метод.

Причина обращения: