Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 81

 
mytarmailS:
есть сер :)

)))

А торгуете случайно не в wealthlab? 

 
Alexey Burnakov:

)))

А торгуете случайно не в wealthlab? 

нет, ето был тслаб, я в него данные с R выгружаю и уже в тслаб симулируеться торговля по сигналам модели с R, так просто быстрей, удобней и наглядней, чем имитировать торговлю в Р-ке , а еще стоп лосы , тейки, комисы.. кароч головная боль ето все писать
 
Dr.Trader:

4) если делаете кроссвалидацию в процессе обучения - то повторяйте её несколько раз на одних и техже данных, смотрите насколько большой будет разброс результатов, выбирайте модели и предикторы с небольшим разбросом

Это то что пришло сейчас на ум, но это не предел возможных проблем. 

Вы будете удивлены и точно не согласитесь со мной(да и не только вы :) ) но я не верю что кросвалидацыя ефективна по применению к  рынку, по крайней мере в ее классическом применении

 
mytarmailS:

Вы будете удевлены и точно не согласитесь со мной(да и не только вы :) ) но я не верю что кросвалидацыя ефективна по применению к  рынку, по крайней мере в ее классическом применении

Почему так мало деревьев?
 
mytarmailS:

Вы будете удевлены и точно не согласитесь со мной(да и не только вы :) ) но я не верю что кросвалидацыя ефективна по применению к  рынку, по крайней мере в ее классическом применении

 начнем с того, как вы понимаете само значение кроссвалидации. можете сказать?
 
СанСаныч Фоменко:
Почему так мало деревьев?

ну у меня так получается что чем больше деревьев тем меньше система делает сделок и их качество при этом совсем не растет

например если моя модель делает 500 сделок с параметром 10/5 то с параметром 5/200  (5 разделение, 200 деревьев)  она сделает одну сделку, либо вообще ни одной,  те падает обобщение, модель начинает искать какие то очень четкие ситуации которые были когда то но их уже никогда не будет в будущем 

 
Alexey Burnakov:
 начнем с того, как вы понимаете само значение кроссвалидации. можете сказать?

Уверен то же что и вы

делим участок на 5 частей на 4-ох тренируем на 5-том проверяем и так перебираем все варианты с участками что бы проверка out-of-sample произошла на всех 5-ти частях выборки и считаем среднюю ошибку

  Вроде бы так если я еще не подзабыл 

 
mytarmailS:

ну у меня так получается что чем больше деревьев тем меньше система делает сделок и их качество при этом совсем не растет

например если моя модель делает 500 сделок с параметром 10/5 то с параметром 5/200  (5 разделение, 200 деревьев)  она сделает одну сделку, либо вообще ни одной,  те падает обобщение, модель начинает искать какие то очень четкие ситуации которые были когда то но их уже никогда не будет в будущем 

Интересная мысль. Получается, что количеством деревьев Вы боретесь с переобучением?
 
mytarmailS:

Уверен то же что и вы

делим участок на 5 частей на 4-ох тренируем на 5-том проверяем и так перебираем все варианты с участками что бы проверка out-of-sample произошла на всех 5-ти частях выборки и считаем среднюю ошибку

  Вроде бы так если я еще не подзабыл 

Да. Это нужно для чего? Чтобы найти параметры обучения оптимальные.

А что вам не нравится в этом подходе? Как параметры собираетесь подбирать? 

 
СанСаныч Фоменко:
Интересная мысль. Получается, что количеством деревьев Вы боретесь с переобучением?

не совсем так...

то что я пишу - это применимо только к моему подходу у вас будет по другому 

вы знаете как я делаю целевую,  это развороты

у меня есть три класса разворот "вверх", "вниз" и "не разворот"    ( 1  ,  -1   ,  0) 

 так же вы знаете что перекос по классам колоссальный,  класса "0" в десятки раз больше чем "-1" и "1"

а это значит что модель лучше всего натренируеться на классе "0"  ведь на него приходиться больше всего наблюдений, и вот при тренировке модели , чем больше деревьев тем сильнее обучается класс "0" и по мере того как класс  "0" все лучше и сильнее обучается он начинает как бы ( поглощать - выдавливать ) классы "1"  , " -1"  ,  вот почему чем больше деревьев тем меньше сделок