Проверьте на соответствие каждой категории - Общее обсуждение

Forester 2023.05.10 16:32 #30691

Aleksey Vyazmikin #:

Идея в том, что отбирается из 16 пара отрезков, у которых есть потенциал. Про кодирование - да, так.

Тогда можно 1 фичу разделить на 16 квантов, пронумеровать и пометить как категориальную. Дерево точно так же проверит на соответствие каждой категории/кванта (==0 или ==1 или ==2 ....). Можно так-же неинтересные кванты отнести в одну категорию.

Результат будет 1 в 1. Или почти, за счет неинтересного кванта, может получиться так, что дерево выберет его при сплите, как лучший.

Из плюсов - всего 1 фича, быстрее расчеты. Размеры файлов и потребление памяти значительно сократятся.

Есть ли закономерность в Обсуждение статьи "Random Decision Любые вопросы новичков по

Maxim Dmitrievsky 2023.05.10 17:31 #30692

15 лет ООС

подход оказался любопытным, но чувствителен к признакам все-таки. Просто на ретурнах такое не получается.

Aleksey Vyazmikin 2023.05.10 17:52 #30693

Forester #:

Тогда можно 1 фичу разделить на 16 квантов, пронумеровать и пометить как категориальную. Дерево точно так же проверит на соответствие каждой категории/кванта (==0 или ==1 или ==2 ....). Можно так-же неинтересные кванты отнести в одну категорию.

Результат будет 1 в 1. Или почти, за счет неинтересного кванта, может получиться так, что дерево выберет его при сплите, как лучший.

Из плюсов - всего 1 фича, быстрее расчеты. Размеры файлов и потребление памяти значительно сократятся.

Почти с этого и начинал. Но нет, так не будет работать, так как в методе построения модели своё представление о прекрасном и она таковым сочтет мусор - проходили уже это - знаем....

fxsaber 2023.05.10 17:53 #30694

Maxim Dmitrievsky #:

классическим образом, набор признаков по ценам закрытия

Maxim Dmitrievsky #:

15 лет ООС

Теперь понял.

Evgeni Gavrilovi 2023.05.10 20:37 #30695

Maxim Dmitrievsky #:

15 лет ООС

подход оказался любопытным, но чувствителен к признакам все-таки. Просто на ретурнах такое не получается.

Можете поделиться параметрами catboost? Все те, которые изменяли.

Maxim Dmitrievsky 2023.05.10 20:54 #30696

Evgeni Gavrilovi #:

Можете поделиться параметрами catboost? Все те, которые изменяли.

Для фильтрации ошибок 15 итераций, 1 глубина, 5 ранний останов. Можно логит регрессию или неглубокое дерево глубиной 2-3. Не хуже буста. K-nn плохо.

Другие не пробовал.

Forester 2023.05.11 06:00 #30697

Maxim Dmitrievsky #:
1 глубина,

Пнями получается))?

А фичи? Говорили, что не ретурны.

Отбор лучших моделей по трейну или по оосу?

Maxim Dmitrievsky 2023.05.11 09:21 #30698

Forester #:

Пнями получается))?

А фичи? Говорили, что не ретурны.

Отбор лучших моделей по трейну или по оосу?

Да, выкорчевывание закономерностей

Если про финальный отбор - то по общему R2 и чтобы оос от трейнтеста не отличался. Тут на вкус и цвет..

Признаки пока засекретил, потомоу что долго выбирал. Могу дать подсказку, что лучше не использовать двунаправленные признаки, которые четко разделяют на бай и селл (типа ретурнов), потому что приводят к большому bias'у. При смене глобального тренда, например. Нужны признаки со стационарным средним желательно.

Первая священная корова: "Если [Архив]учитесь зарабатывать селяне![Архив] Предложение по генетическому алгоритму

Maxim Dmitrievsky 2023.05.11 12:11 #30699

Женя #:

А то что на СБ с любым распределением не должны находиться никакие закономерности, на рядах длинной более 200к акураси +-0.1% вокруг 50%, кореляция будущего ретурна с прогнозным менее +-0.01

Но если прогнозировать всякие сглаженные и хитро размазанные и вправо и в лево индикаторы(ZZ и тп), то на СБ будет прогноз зашкаливать в неадекват, словно можно прогнозировать СБ с точностью 60 или даже 95% в зависимости от настроек классификатора. Это бред как в прочем и на ценовых рядах ситуация не очень отличается.

Даже правильно подготовленные признаки и цели, дающие как бы честные 1-2% альфы и на это обычно приходится смотреть с подозрением, есть много более тонких моментов(начиная от банальных стойких автокоррекций сделок внутри спреда, переходящие на минутки, до тупо делительных трендов и тп. случайной природы). Делающие даже эти 1-2% не торгуемыми. А что делать, такова реальность, нужно думать в сторону данных а не пакетов в R.

Который год иногда сюда заглядываю и вижу дискуссии про прогнозы с "ошибкой 8%" и СБ на эквити бектеста, "это какой то позор". Сразу видно что перспектив у таких исследователей нет, если сразу не обратили на это внимание, а потом сами, без подсказок не догадались как с этим бороться.

Хотите прогнозировать ZZ, или какую нибудь машку от ретурнов или что угодно, да пожалуйста, но используйте для расчетов таргетов ТОЛЬКО правую часть ряда, точно также как для признаков ТОЛЬКО левую. Это закон, по другому получается только самообман. Иначе будущее смешивается с прошлым и прогнозируется исключительно прошлое по прошлому, от того такие граальные цифры.

Ну мысль понятна. Тоже подбешивает когда начинаешь по человечьи с людьми, а они в тебя пакетами бросают

Maxim Dmitrievsky 2023.05.11 14:45 #30700

СанСаныч Фоменко #:

PS. Я не египтянин и никуда не денусь. Кроме этого отношения ценю выше денег.

Саныч, вы как маленький. Все мои боты бесплатные и расписаны в статьях. Полностью, от и до, все исходники. Кто-то не любит бесплатное и захотел платно. Иногда они не залетают. Некоторые алгоритмы залетают. Че орать теперь что ли? Вот и на этот раз, несколько страниц назад, предложил бесплатно опять. Никто не обратился в личном порядке, значит хотят покупать?

В личку напишите, решим вопрос.

ЗЫ на маркете я зобанен, поэтому глупо думать что что-то рекламирую :) вообще я бы перевел эту схему на донатную основу, но там не было таких опций.

Когда оживет форум? :) Пошли третьи сутки, как Спамеры, спам в личных

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3070