Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2553

 
mytarmailS #:

Это был риторический вопрос:))

То что вы в теме, я знаю))
Это для новичков МО. Если они сюда зайдут.

 
Vladimir Perervenko #:

Три варианта обработки шумовых примеров: удалить, переразметить(исправить разметку) и выделить шумовые примеры в отдельный класс. Из моего опыта около 25% выборки - "шум". Повышение качества около 5%, зависит от моделей и подготовки данных. Применяю иногда.

Есть еще одна проблема при использовании предикторов - их дрейф. И эту проблему нужно определять и  учитывать и при тестировании и при эксплуатации. В приложении  перевод статьи (поищите и другие в сети) и есть пакет drifter. Он не единственный. Но суть в том, что при выборе предикторов нужно учитывать не только важность но и их дрейф. Сильно дрейфующие выбрасывать или трансформировать, для слабо дрейфующих учитывать(делать поправку) при тестировании и работе. 

Удачи

что значит "применяю иногда?"

либо есть какой-то пайплайн себя зарекомендовавший, либо это просто досужие мысли

Выделение шума в отдельный класс, теоретически, не улучшает модель (шум остаётся внутри модели и никуда не исчезает) 

про дрейф - это же азы, bias-variance tradeoff
 
Maxim Dmitrievsky #:
Ты не пробова прогнозировать распределение будущих котировок?
 
mytarmailS #:
Ты не пробова прогнозировать распределение будущих котировок?

что-то такое делал, но не понял зачем это все

Помнишь, я кластеризовал будущие куски фиксированной длины и предсказывал номер кластера. У каждого кластера своё распределение, под каждый своя стратегия. На трейне работало, на новых данных фэйл, если в лоб делать.
 
Maxim Dmitrievsky #:

что-то такое делал, но не понял зачем это все

Помнишь, я кластеризовал будущие куски фиксированной длины и предсказывал номер кластера. У каждого кластера своё распределение, под каждый своя стратегия. На трейне работало, на новых данных фэйл, если в лоб делать.

Помню..

У меня немного другая идея..

Если можно качественно спрогнозировать распределение будущих котировок скажем на 50 свечей вперед, то из этого распределения можно наМонтекарлить  несколько тыс. рядов и обучить модель, таким образом модель будет адекватно работать на новых 50 свечах в теории..

 
Периодически захожу в тему, лица те же, обсуждение моделей то же, может у кого-то есть что показать?
 
Farkhat Guzairov #:
Периодически захожу в тему, лица те же, обсуждение моделей то же, может у кого-то есть что показать?
Тут решают задачу не для того чтобы её решить
 
Vladimir Baskakov #:
Тут решают задачу не для того чтобы её решить

Я о том же, ставят задачи и потом героически пытаются их не решить ))). Я так понял, чем сложнее сделать постановку задачи, тем больше оправданий по отрицательному результату, возгласы, сочувствие и напутствия на еще более сложные прожекты ))).

 
Farkhat Guzairov #:

Я о том же, ставят задачи и потом героически пытаются их не решить ))). Я так понял, чем сложнее сделать постановку задачи, тем больше оправданий по отрицательному результату, возгласы, сочувствие и напутствия на еще более сложные прожекты ))).

Представляю как они мучают женщин;)
Причина обращения: