Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1139

 
Aleksey Vyazmikin:

Про подгонку, вот и я думаю, что с ней делать, с одной стороны использование ограниченного числа комбинаций, полученных на истории в виде листьев, должно снижать эффект подгонки, а с другой стороны вижу, что процентов 60% листьев работающих на выборке обучения перестают работать на тестовой выборке. Вопрос в том, что бы понять как изменилась история, что именно произошло, что то что работало перестало работать.

Большое число предикторов, это как большое число звезд на небе, и из-за их скопления можно напридумывать кучу разных созвездий, которые уже не увидеть с планет других солнечных систем, так и тут количество комбинаций больше чем число входов в рынок - вот от этого и подгонка.

Это вопрос на миллиард$  ИМХО любая индукция(обобщение) - подгонка, МО это всего лишь статистика, вышедшая из под контроля теории, инженерная статистика, которая не брезгует эвристиками и костылями, а статистика это те или иные усреднения(ожидания), средние, средние отклонений от средних и тп., ну а все мы помним притчу про "цыплёнка Рассела", хозяин покормит цыплёнка пару сотен раз(статистически значимое количество), но только специально чтобы один раз потом зарезать((( Возможно что и Кукл поступает аналогично.

 

Вопрос для размышления:

Есть множество стратегий подогнанных под историю, есть множество стратегий, которые дают на новых данных хороший результат. Чем эти два множества стратегий отличаются между собой при прогоне их на истории?

 
Aliaksandr Hryshyn:

Вопрос для размышления:

Есть множество стратегий подогнанных под историю, есть множество стратегий, которые дают на новых данных хороший результат. Чем эти два множества стратегий отличаются между собой при прогоне их на истории?

Ни в чем. Оба класса стратегий подогнаны под историю.

Возможно, различны цели и средства такой подгонки, но мы, не являясь авторами, это выяснить не сможем.)

 
Aliaksandr Hryshyn:

Вопрос для размышления:

Есть множество стратегий подогнанных под историю, есть множество стратегий, которые дают на новых данных хороший результат. Чем эти два множества стратегий отличаются между собой при прогоне их на истории?

))))))))))))))))))))))))))))))))))))))).............

 
mytarmailS:

))))))))))))))))))))))))))))))))))))))).............

Если что, это просто вопрос).
 
Aliaksandr Hryshyn:

Вопрос для размышления:

Есть множество стратегий подогнанных под историю, есть множество стратегий, которые дают на новых данных хороший результат. Чем эти два множества стратегий отличаются между собой при прогоне их на истории?

Вопрос правильный.

При условии что мы учим модель ОДНОМУ И ТОМУ ЖЕ, на обучении и контроле, кривая ошибки будет примерно такая 


Переобучение это когда начинается расхождение,(на картинке примерно с 19-го n) отсюда ответ на ваш вопрос, на истории переподогнанная модель будет НА МНОГО ЛУЧШЕ, той которая хороша на контроле. В идеале график эквити на истории и контроле(OOS) должен быть не различим. То есть утверждения местных "гуру" про "ровный трамплин" - полнейшая глупость, всё ровно наоборот, не должно быть видно где закончилась история и где начался контроль.

 

Господа специалисты по МО.

Кто может поделиться ссылкой, как создать нейронку по обучению в построении графика функции?

 
pantural:

Вопрос правильный.

При условии что мы учим модель ОДНОМУ И ТОМУ ЖЕ, на обучении и контроле, кривая ошибки будет примерно такая 


Переобучение это когда начинается расхождение,(на картинке примерно с 19-го n) отсюда ответ на ваш вопрос, на истории переподогнанная модель будет НА МНОГО ЛУЧШЕ, той которая хороша на контроле. В идеале график эквити на истории и контроле(OOS) должен быть не различим. То есть утверждения местных "гуру" про "ровный трамплин" - полнейшая глупость, всё ровно наоборот, не должно быть видно где закончилась история и где начался контроль.

балансировка 2 выборок, да и все. Не спасет от провала на 3-й, тем не менее подход правильный

 

Привет около научным кругам по вопросам ИИ в трейдинге)))

Я надеюсь вы объединили свои усилия для реализации проекта "Даёшь 100% годовых с вероятностью 10 к 1 !!! " ???

Прототип советника есть уже? Или как такая машина правильно называется...))

 
pantural:

Ну что вам сказать уважаемые господа...

Это побочные эффекты использования черных ящиков,  чужих библиотек и тд.

Могу только предложить опубликовать эквити в CSV ваших изысканий и я вам сообщу каков верный Sharp Ratio ваших моделей, можете сами вычислить код прилагается(python)


Если скините эквити или PnL то разберусь в чем проблема, могу догадываться что если PnL используется "разряженный" то есть с пропусками меду сделками(что разумеется не правильно) от сюда и масштабирование, поставил бы 100$ что в этом проблема.

Во-первых, формулы оценки можно найти в статье Математика в трейдинге. Оценка результатов торговых сделок.

Во-вторых, в этой статье показано, что Шарп рассчитывается на основании результатов сделок (трейдов), а не на колебаниях эквити.

Причина обращения: