Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3163

 
СанСаныч Фоменко #:

Какое точное название? Или самопальная?

Использую много лет разные "деревянные" модели и ничего подобного  не наблюдал.

Самопальная. Возможности для экспериментов не ограничены...
 
Maxim Dmitrievsky #:
Нужно найти корсет (coreset), который имеет закономерности, и только на нем обучаться. Он может быть на любом куске графика, ищется через перебор. Иначе шум не позволяет модели сосредоточиться. Сейчас в тренде корсеты - небольшие репрезентативные подвыборки. Это довольно просто и дает результаты.

Как искать? Перебирать все куски (например 100 по 5000 стр) и смотреть, как успешно остальные 500 000 строк на этой модели предсказывают?

 
Forester #:

Как искать? Перебирать все куски (например 100 по 5000 стр) и смотреть, как успешно остальные 500 000 строк на этой модели предсказывают?

ага, можно случайно семплы выдергивать, а не куски подряд, это более правильно

 
mytarmailS #:

Я аж прослезился, так ржал)))

попросил БАРДА писать на русском , написал с ошибкой , бывает.. русский не мой родной , я пользуюсь им только тут по сути..

и что он мне отвечает ))


Вы поняли?

Он меня тролить начал ))) 

Это просто жесть))))

Он тебя не троллит.

Ты написал руСкий - это "русский" по сербски.

Поэтому он тебе пишет на сербском

 
Dmytryi Nazarchuk #:

Он тебя не троллит.

Ты написал руСкий - это "русский" по сербски.

Поэтому он тебе пишет на сербском

Ааа)))

 
mytarmailS #:

интересная статья про деревья и обучение с  подкреплением в них..

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4760114/

потетстил алгоритм на рыночных данных..

Алгоритм работает устойчиво на новых данных по сравнению с форестом..

алгоритм не переобучаеться, на всех валидационных выборках результат либо лучше чем на тестовой либо намного лучше , хуже не видел..

акураси в среднем лучше фореста на 2-4 %    те если на форесте 0,58 то у RLT ~ 0,62


кароч. по первым тестам алгоритм стоющий, правда обучаеться долго зараза..

 
Forester #:
Самопальная. Возможности для экспериментов не ограничены...

М-да... самопальные не имеет смысла обсуждать.

Зачем тратить время на самопальные? Имеются дестяки НЕ самопальных с обсосанными алгоритмами, практически используемые миллионами пользователей.... 

 
mytarmailS #:

потетстил алгоритм на рыночных данных..

Алгоритм работает устойчиво на новых данных по сравнению с форестом..

алгоритм не переобучаеться, на всех валидационных выборках результат либо лучше чем на тестовой либо намного лучше , хуже не видел..

акураси в среднем лучше фореста на 2-4 %    те если на форесте 0,58 то у RLT ~ 0,62


кароч. по первым тестам алгоритм стоющий, правда обучаеться долго зараза..

По их теории предполагается наличие части "сильных" признаков, которые хорошо работают и проблема лишь в том, чтобы отделить их от остальных "слабых". В их области, генетике, всё так и есть, наверно. Но у нас явно другая ситуация - признаки примерно одинаковы по силе, часто коллинеарны, да ещё рейтинг их силы может меняться со временем.

В общем, если бы дело было лишь в отборе информативных признаков, то Сан Саныч, со своей секретной методой, давно бы стал трильонером)

 
Aleksey Nikolayev #:

По их теории предполагается наличие части "сильных" признаков, которые хорошо работают и проблема лишь в том, чтобы отделить их от остальных "слабых". В их области, генетике, всё так и есть, наверно. Но у нас явно другая ситуация - признаки примерно одинаковы по силе, часто коллинеарны, да ещё рейтинг их силы может меняться со временем.

В общем, если бы дело было лишь в отборе информативных признаков, то Сан Саныч, со своей секретной методой, давно бы стал трильонером)

Ну алгоритм реально работает и стабильнее и акураси лучше и каппа лучше..  кароче лучше работает ..

причем работает и спустя 1000 новых наблюдений и спустя 20 000 .. а ошибка либо такая же либо лучше

Aleksey Nikolayev #:

 признаки примерно одинаковы по силе

Ну и тут я не могу согласиться

важности от этого алгоритма


 
СанСаныч Фоменко #:

М-да... самопальные не имеет смысла обсуждать.

Зачем тратить время на самопальные? Имеются дестяки НЕ самопальных с обсосанными алгоритмами, практически используемые миллионами пользователей.... 

Потому, что могу экспериментировать и делать то, что не заложено в этих алгоритмах - черных ящиках.
Я не обсуждаю пакеты, предлагаю обсуждать только идеи.
Причина обращения: