Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3324

 
Andrey Dik #:

1. Да, конечно.

2. Может быть я как то не так выразился. Не, это и был как раз положительный эффект - торговля постепенно сходила на нет на новых данных. Как только количество сделок снижалось ниже заданного уровня в единицу времени нужно снова обучать. Т.е. не снижение эффективности торговли на OOS как сигнал на переобучение, а снижение количества сделок.

Т.е., вместо того, что бы нести чушь принося убытки торговли на OOS, НС выдаёт в ответ тишину на незнакомые данные.

Я так и понял. Просто спросил, не удалось ли установить причину этого. Не про то, что сломалось, а почему пропали сигналы.

 
Aleksey Vyazmikin #:

Я из видео узнал об этом алгоритме, там на слейде есть какие то формулы - сложно назвать это кодом.

А где Вы видели пример кода?

Это тролинг?

 
mytarmailS #:

Это тролинг?

В чём тролинг?

Вот видео


 
Aleksey Vyazmikin #:

В чём тролинг?

Вот видео

как бы вот

 
mytarmailS #:

как бы вот

С моей стороны речь шла о месте в интернете, т.е. о ссылке.

 
Aleksey Vyazmikin #:

С моей стороны речь шла о месте в интернете, т.е. о ссылке.

в какой именно статье не помню,

но их же не миллион, поищите

 
mytarmailS #:

в какой именно статье не помню,

но их же не миллион, поищите

Вот и поискал - ничего пока не нашлось.

 
Aleksey Vyazmikin #:

Я так и понял. Просто спросил, не удалось ли установить причину этого. Не про то, что сломалось, а почему пропали сигналы.

Причина простая, как и задумывалось - сигналы пропадают, потому что на новых данных сигналы выходят за узкий допустимый диапазон.

Ну, это можно сравнить с классификацией, есть понятные известные паттерны и есть непонятные неизвестные. Со временем неизвестных всё больше и больше и в классе "известные" не остаётся ничего.

 
Aleksey Vyazmikin #:

Утверждается, что с этим алгоритмом удавалось завоёвывать первые места на кагле, не думаю, что там простые задачи были...

Может попробуем разобраться? Я формулы не втыкаю - к великому моему сожалению.

Я тоже не по формулам, а по идеям.
А если разобрать идею, то она так себе для рыночных данных.

Там предлагается удалять пары примеров разных классов, которые очень близко друг к другу расположены. Если посмотреть 3-й пример, то в идеале будут удалены все примеры от 0,2 до 0,8 и останутся только участки ниже 0,2 и выше 0,8 с абсолютной чистотой классов. Любая модель дальше легко их классифицирует.
Ранее я уже показал, что такой простой пример и дерево легко разделит, если в работу использовать листья с высокой чистотой классов (и не делить листья до 1 примера в листе).
Но это искусственный пример.

На рыночных данных таких чистых блоков с преобладанием одного класса не будет. Т.е. вычистить придется почти все. Например было 1000 точек, 900 вычистили, остальные как то достигли чистоты листьев например 70% - вроде неплохо, и можно заработать. Но когда вы начнете реально торговать, то туда же будут попадать примеры, от которых мы избавились при чистке (9 мусорных на 1 оставшийся) и показатели с 70% упадут например до 53% и вы проиграете по спреду, проскальзываниям и т.п.

Препочитаю дерево и лист с честными 53% чистоты одного из классов. И не буду его использовать.
 
Aleksey Vyazmikin #:

Вот и поискал - ничего пока не нашлось.

бывает

Причина обращения: