Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 803

 

Как лучше сбалансировать классы, кто какие методы применяет?

Да и хотелось бы спросить какие предикторы на Ваш взгляд интересные, можно в личку?)

 
forexman77:
Как лучше сбалансировать классы, кто какие методы применяет?

Есть функции

 caret:: downSample() - обрезает большой класс до меньшего

downSample will randomly sample a data set so that all classes have the same frequency as the

minority class. upSample samples with replacement to make the class distributions equal

 caret:: upSample() - добавляет меньший класс до большего


Вообще рекомендую изучить caret: можно использовать как учебник "чего бывает" - содержит инструменты для полного цикла:

  • подготовки исходных данных,
  • отбора предикторов (очень шикарные инструменты),
  • под 200 моделей (регрессионных и классификационных) и
  • оценки моделей (ничего общего с тестером).

Можно получить вполне промышленные разработки.



ПС.

Не думаю, что предикторы кто-то раскроет - это самое важное, а модели дело техники и усидчивости.

 
СанСаныч Фоменко:


Не думаю, что предикторы кто-то раскроет - это самое важное, а модели дело техники и усидчивости.

Ну, это я так на "дурака" спросил. Ведь создают же глупые ветки, "как увеличить депозит втрое", "подскажите зарабатывающий советник" и т.д.

Но, нужен совет с индикаторами понятно, это первое, что приходит на ум. А вот что-то необычное, где мало кто копал.

 
forexman77:

Ну, это я так на "дурака" спросил. Ведь создают же глупые ветки, "как увеличить депозит втрое", "подскажите зарабатывающий советник" и т.д.

Но, нужен совет с индикаторами понятно, это первое, что приходит на ум. А вот что-то необычное, где мало кто копал.

Возьмите цифровые фильтры с последней части статьи. Полезно будет я думаю прочесть также все предыдущие части.

Удачи

 
СанСаныч Фоменко:

Есть функции

downSample will randomly sample a data set so that all classes have the same frequency as the

minority class. upSample samples with replacement to make the class distributions equal


Вообще рекомендую изучить caret: можно использовать как учебник "чего бывает" - содержит инструменты для полного цикла:

  • подготовки исходных данных,
  • отбора предикторов (очень шикарные инструменты),
  • под 200 моделей (регрессионных и классификационных) и
  • оценки моделей (ничего общего с тестером).

Можно получить вполне промышленные разработки.



ПС.

Не думаю, что предикторы кто-то раскроет - это самое важное, а модели дело техники и усидчивости.

Модели создают из уже готовых наработок, а тут можно из чистого листа.

 
forexman77:

Ну, это я так на "дурака" спросил. Ведь создают же глупые ветки, "как увеличить депозит втрое", "подскажите зарабатывающий советник" и т.д.

Но, нужен совет с индикаторами понятно, это первое, что приходит на ум. А вот что-то необычное, где мало кто копал.

В простейшем варианте, в качестве предикторов использую набор баров - интегральное значение посчитанное по заданной формуле, которая закладывается в виде исходных данных при обучении.


Балансировку делаю при выборке от метки конца обучения вглубь истории, в цикле, пока количество сэмплов достигает заданного и сравнивается.

 
Ivan Negreshniy:
В простейшем варианте, в качестве предикторов использую набор баров - интегральное значение посчитанное по заданной формуле, которая закладывается в виде исходных данных при обучении.

Воще-то, лучший предиктор - сам ценовой ряд. Любая обработка - потеря и задержки информации. А если еще учесть, что мы не особенно знаем какая именно инфа нам нужна, то...

ЗЫ Я работаю на 1м и задержка даже на 30с смерть системе. А даже оч простые индикаторы дают задержку 1-3 м.

Даже если работать на часовом ТФ, то задержка по индикаторам будет 1-3 ч.)) По любому 1-3 свечи, как не крути.

ЗЫ2 Еще один плюс временного ряда - нам не надо подбирать предикторы. Только научиться использовать в этом качестве сам ВР.

 
Yuriy Asaulenko:

Воще-то, лучший предиктор - сам ценовой ряд. Любая обработка - потеря и задержки информации. А если еще учесть, что мы не особенно знаем какая именно инфа нам нужна, то...

ЗЫ Я работаю на 1м и задержка даже на 30с смерть системе. А даже оч простые индикаторы дают задержку 1-3 м.

Даже если работать на часовом ТФ, то задержка по индикаторам будет 1-3 ч.)) По любому 1-3 свечи, как не крути.

ЗЫ2 Еще один плюс временного ряда - нам не надо подбирать предикторы. Только научиться использовать в этом качестве сам ВР.

Как вам не ответить такой фразой. Часовой график можно рассмотреть под лупой 15м, 5м 1м. Грустно господа.

 
Uladzimir Izerski:

Как вам не ответить такой фразой. Часовой график можно рассмотреть под лупой 15м, 5м 1м. Грустно господа.

Не грустите, я в курсе.)) Хотя, если Вам так комфортней, можете продолжить.

 
Скажите пожалуйста, для отбора данных на первоначальном этапе достаточно искать корреляцию с целевыми данными, если да то какой порог корреляции следует использовать?
Причина обращения: