Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3605

 
Maxim Dmitrievsky #:
Это сведение к общему виду, которое ничего не гарантирует. Для этого там добавлены настройки, сколько и чего исправлять.

Не гарантирует, но, если на новых данных смещение вероятности не подтвердится, то агрегировали случайный мусор в кластер, а значит обучение гарантированно будет хуже, чем если бы там был не мусор.

Поэтому и думаю, что если сразу проверить, то это сократит время на весь этот цикл.

 

Придумываю стратегии, чисто из наблюдений за рынком - для разметки и обучения.

Стратегии простые - в основном пару параметров значимых.

Прогоняешь вот это в тестере и находятся результаты, которые прибыльные на трейне и тесте - как форвард так и бэкворд истории. Понимаю, что всё это статистически ошибки... но это в паре параметров, а что же в модели творится...

 
Aleksey Vyazmikin #:

Не гарантирует, но, если на новых данных смещение вероятности не подтвердится, то агрегировали случайный мусор в кластер, а значит обучение гарантированно будет хуже, чем если бы там был не мусор.

Поэтому и думаю, что если сразу проверить, то это сократит время на весь этот цикл.

No

Совсем другой принцип, совсем другие цели.
Целое больше, чем сумма его частей. Не надо вырывать из контекста. Так вы не увидите слона.
 
Maxim Dmitrievsky #:

No

Совсем другой принцип, совсем другие цели.
Целое больше, чем сумма его частей. Не надо вырывать из контекста. Так вы не увидите слона.

Значит мы видим суть по разному. Ладно.

 
Aleksey Vyazmikin #:

Значит мы видим суть по разному. Ладно.

Суть изначально написана: уменьшить переобученность классификаторов, что как бы автоматически подразумевает улучшение на новых данных. С учётом того, что хоть какие-то закономерности имеются, но из-за переобученности их не видно.

Случайная разметка сделок создаёт много шума и противоречий. Метод избавления от противоречий указан Буддой.
Через настройки можно регулировать и смотреть что получилось.

Если метод вообще ничего не показывает в плане выравнивания результатов на трейн/тест даже при исправлении всех кластеров, значит в данных нет альфы.

Примерно такой смысл подразумевается.