Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3070

 
Aleksey Vyazmikin #:

Идея в том, что отбирается из 16 пара отрезков, у которых есть потенциал. Про кодирование - да, так.

Тогда можно 1 фичу разделить на 16 квантов, пронумеровать и пометить как категориальную. Дерево точно так же проверит на соответствие каждой категории/кванта (==0 или ==1 или ==2 ....). Можно так-же неинтересные кванты отнести в одну категорию.

Результат будет 1 в 1. Или почти, за счет неинтересного кванта, может получиться так, что дерево выберет его при сплите, как лучший.

Из плюсов - всего 1 фича, быстрее расчеты. Размеры файлов и потребление памяти значительно сократятся.

 

15 лет ООС 

подход оказался любопытным, но чувствителен к признакам все-таки. Просто на ретурнах такое не получается.


 
Forester #:

Тогда можно 1 фичу разделить на 16 квантов, пронумеровать и пометить как категориальную. Дерево точно так же проверит на соответствие каждой категории/кванта (==0 или ==1 или ==2 ....). Можно так-же неинтересные кванты отнести в одну категорию.

Результат будет 1 в 1. Или почти, за счет неинтересного кванта, может получиться так, что дерево выберет его при сплите, как лучший.

Из плюсов - всего 1 фича, быстрее расчеты. Размеры файлов и потребление памяти значительно сократятся.

Почти с этого и начинал. Но нет, так не будет работать, так как в методе построения модели своё представление о прекрасном и она таковым сочтет мусор - проходили уже это - знаем.... 

 
Maxim Dmitrievsky #:

классическим образом, набор признаков по ценам закрытия

Maxim Dmitrievsky #:

15 лет ООС

Теперь понял.
 
Maxim Dmitrievsky #:

15 лет ООС 

подход оказался любопытным, но чувствителен к признакам все-таки. Просто на ретурнах такое не получается.


Можете поделиться параметрами catboost? Все те, которые изменяли.

 
Evgeni Gavrilovi #:

Можете поделиться параметрами catboost? Все те, которые изменяли.

Для фильтрации ошибок 15 итераций, 1 глубина, 5 ранний останов. Можно логит регрессию или неглубокое дерево глубиной 2-3. Не хуже буста. K-nn плохо. 
Другие не пробовал.
 
Maxim Dmitrievsky #:
  1 глубина,

Пнями получается))?

А фичи? Говорили, что не ретурны.

Отбор лучших моделей по трейну или по оосу?

 
Forester #:

Пнями получается))?

А фичи? Говорили, что не ретурны.

Отбор лучших моделей по трейну или по оосу?

Да, выкорчевывание закономерностей

Если про финальный отбор - то по общему R2 и чтобы оос от трейнтеста не отличался. Тут на вкус и цвет..

Признаки пока засекретил, потомоу что долго выбирал. Могу дать подсказку, что лучше не использовать двунаправленные признаки, которые четко разделяют на бай и селл (типа ретурнов), потому что приводят к большому bias'у. При смене глобального тренда, например. Нужны признаки со стационарным средним желательно.
 
Женя #:

А то что на СБ с любым распределением не должны находиться никакие закономерности, на рядах длинной более 200к акураси +-0.1% вокруг 50%, кореляция будущего ретурна с прогнозным менее +-0.01

Но если прогнозировать всякие сглаженные и хитро размазанные и вправо и в лево индикаторы(ZZ и тп), то на СБ будет прогноз зашкаливать в неадекват, словно можно прогнозировать СБ с точностью 60 или даже 95% в зависимости от настроек классификатора. Это бред как в прочем и на ценовых рядах ситуация не очень отличается.

Даже правильно подготовленные признаки и цели, дающие как бы честные 1-2% альфы и на это обычно приходится смотреть с подозрением, есть много более тонких моментов(начиная от банальных стойких автокоррекций сделок внутри спреда, переходящие на минутки, до тупо делительных трендов и тп. случайной природы). Делающие даже эти 1-2% не торгуемыми. А что делать, такова реальность, нужно думать в сторону данных а не пакетов в R.

Который год иногда сюда заглядываю и вижу дискуссии про прогнозы с "ошибкой 8%" и СБ на эквити бектеста, "это какой то позор". Сразу видно что перспектив у таких исследователей нет, если сразу не обратили на это внимание, а потом сами, без подсказок не догадались как с этим бороться.

Хотите прогнозировать ZZ, или какую нибудь машку от ретурнов или что угодно, да пожалуйста, но используйте для расчетов таргетов ТОЛЬКО правую часть ряда, точно также как для признаков ТОЛЬКО левую. Это закон, по другому получается только самообман. Иначе будущее смешивается с прошлым и прогнозируется исключительно прошлое по прошлому, от того такие граальные цифры.

Ну мысль понятна. Тоже подбешивает когда начинаешь по человечьи с людьми, а они в тебя пакетами бросают 
 
СанСаныч Фоменко #:

PS. Я не египтянин и никуда не денусь. Кроме этого отношения ценю выше денег.

Саныч, вы как маленький. Все мои боты бесплатные и расписаны в статьях. Полностью, от и до, все исходники. Кто-то не любит бесплатное и захотел платно. Иногда они не залетают. Некоторые алгоритмы залетают. Че орать теперь что ли? Вот и на этот раз, несколько страниц назад, предложил бесплатно опять. Никто не обратился в личном порядке, значит хотят покупать? 

В личку напишите, решим вопрос.

ЗЫ на маркете я зобанен, поэтому глупо думать что что-то рекламирую :) вообще я бы перевел эту схему на донатную основу, но там не было таких опций.