Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3287

 
Forester #:
Просто раз в неделю переобучаю модель. Может и дольше живет, не исследовал... но может и меньше и надо как СанСаныч на каждом баре переобучать (если Н1, то в принципе можно).
Для меня раз в неделю приемлемо по скорости - 5 лет за 260 переобучений примерно проходит.

Тут выяснил одну фундаментальную проблему: заглядывание вперед. Проявляется следующим образом: берем куски одного большого файла, учим, потом тестируем, проверяем - все нормально, ошибка примерно одинакова. Но как только прогоняем вне этих трех файлов, которые куски одного большого файла, то результат принципиально отличается, обычно катастрофический.

Если переобучать на каждом шаге, то исключается проблема "заглядывания вперед", так как предсказывание ведется на тех же значениях предикторов, что и обучение. 

А если учить не на каждом шаге, то на одних значениях учили, а потом ПЕРЕСЧИТАЛИ все предикторы, включая участок обучения, и на них предсказали. И тут вопрос: новые значения предикторов будут совпадать со значениями предикторов на участке обучения или нет?

 
СанСаныч Фоменко #:

Тут выяснил одну фундаментальную проблему: заглядывание вперед. Проявляется следующим образом: берем куски одного большого файла, учим, потом тестируем, проверяем - все нормально, ошибка примерно одинакова. Но как только прогоняем вне этих трех файлов, которые куски одного большого файла, то результат принципиально отличается, обычно катастрофический.

Если переобучать на каждом шаге, то исключается проблема "заглядывания вперед", так как предсказывание ведется на тех же значениях предикторов, что и обучение. 

А если учить не на каждом шаге, то на одних значениях учили, а потом ПЕРЕСЧИТАЛИ все предикторы, включая участок обучения, и на них предсказали. И тут вопрос: новые значения предикторов будут совпадать со значениями предикторов на участке обучения или нет?

Где это у Вас заглядывание?

Прочёл пару раз и не увидел логики за словами.

Придумывают проблемы - потом героически решают - один заглядывает в будущее, другой ищет идеальную разметку...

 
СанСаныч Фоменко #:

То что делает  leksey Vyazmikin не имеет никакого отношения к проблемам МО. Из одной оперы дернул, а ответ пытается получить из другой оперы - все пустая болтовня человека с кашей в голове.

Если не понимаете, что я делаю, спросите. Да, часто мои эксперименты выходят за рамки академических знаний.

 
СанСаныч Фоменко #:

Тут выяснил одну фундаментальную проблему: заглядывание вперед. Проявляется следующим образом: берем куски одного большого файла, учим, потом тестируем, проверяем - все нормально, ошибка примерно одинакова. Но как только прогоняем вне этих трех файлов, которые куски одного большого файла, то результат принципиально отличается, обычно катастрофический.

Если переобучать на каждом шаге, то исключается проблема "заглядывания вперед", так как предсказывание ведется на тех же значениях предикторов, что и обучение. 

А если учить не на каждом шаге, то на одних значениях учили, а потом ПЕРЕСЧИТАЛИ все предикторы, включая участок обучения, и на них предсказали. И тут вопрос: новые значения предикторов будут совпадать со значениями предикторов на участке обучения или нет?

Думаю это у вас какая то реализация кода, в которой вы нашли заглядывание. Я с заглядываниями года 4 назад разобрался. У меня данные снимаются строго до текущего бара (в т.ч. на истории). Дополнительно я в свой Валкинг-форвард добавляю Embargo участок 1-5 дней (как рекомендовал Прадо). Если модель ловит движения 100-300 пт, то 1 дня достаточно, если 1000 - то 5 дней надежнее взять.
 
Aleksey Vyazmikin #:

Судя по картинкам тут так же низкий Recall получается, т.е. мало в чём модель уверена и очень осторожничает в прогнозах.

Есть и неосторожные модели - просто листья менее чистые брать (не 0,9, а 0,7 или 0,5), но они сливают (как та что выше на той картинке, та что ниже использует более чистые листья и удачно пропускает сливные периоды/месяцы и годы). Т.е. модель на графике одна - отличия в чистоте использованных листьев.
В целом ничего достойного, на что я поставил бы деньги я не нашел.

 
Forester #:

Есть и неосторожные модели - просто листья менее чистые брать (не 0,9, а 0,7 или 0,5), но они сливают (как та что выше на той картинке, та что ниже использует более чистые листья и удачно пропускает сливные периоды/месяцы и годы). Т.е. модель на графике одна - отличия в чистоте использованных листьев.
В целом ничего достойного, на что я поставил бы деньги я не нашел.

Я то вижу часто красивые картинки в своих изысканиях, но уверенности не хватает, что и завтра она будет такой... пока так же не очень доволен результатами. Меняю процесс обучения.

Сейчас взялся статью писать, но понял, что не хочу описывать свой метод в деталях, поэтому ищу интересный результаты в экспериментах с CatBoost.

Почему не хотите перейти к разметке выборки не сплошняком, а по паттернам, как это делаю я?

 
Aleksey Vyazmikin #:

Я то вижу часто красивые картинки в своих изысканиях, но уверенности не хватает, что и завтра она будет такой... пока так же не очень доволен результатами. Меняю процесс обучения.

Сейчас взялся статью писать, но понял, что не хочу описывать свой метод в деталях, поэтому ищу интересный результаты в экспериментах с CatBoost.

Почему не хотите перейти к разметке выборки не сплошняком, а по паттернам, как это делаю я?

Да -  в сплошной разочаровался. Тот рост что на графиках - получен при долгом ожидании завершения сделки - до 10 дней. Уменьшил до 3-5 часов и получается только рандом на ООС. Пришел к выводу, что эта прибыль с ночных входов получена и для завершения сделки надо более 3х часов (т.е. завершаются они в основном днем). Дневные входы 300-500 пт обычно за 1-3 часа проходит и сделки завершаются - вот они и показывают рандом.

Все лето МО не занимался, только тут что-то пообсуждать мог. Зимой делать будет нечего, - может еще поэкспериментирую.

Завидую всем вам, вашему энтузиазму и безостановочному тестированию и экспериментированию...
 
Forester #:
Да -  в сплошной разочаровался. Тот рост что на графиках - получен при долгом ожидании завершения сделки - до 10 дней. Уменьшил до 3-5 часов и получается только рандом на ООС. Пришел к выводу, что эта прибыль с ночных входов получена и для завершения сделки надо более 3х часов (т.е. завершаются они в основном днем). Дневные входы 300-500 пт обычно за 1-3 часа проходит и сделки завершаются - вот они и показывают рандом.

Я как то так сделал, давно уже, торговую систему с хорошим профитом на Московской бирже, но только в тестере - увы оказалось, что я не учёл утренний бросок цены - который за минуту мог и на 1000 пунктов улетать по Si и терминал в эти моменты любил подвисать... теперь делаю закрытие на ночь при обучении. Идею закрытия через заданное время я не очень поддерживаю, мне всё же кажется, что правильней закрываться либо по рыночному событию, либо по таймингу начала нового бара (к примеру открылись на минутке и закрылись при новом часовике). Сам больше использую трал или уровни от ATR.

Forester #:
Все лето МО не занимался, только тут что-то пообсуждать мог. Зимой делать будет нечего, - может еще поэкспериментирую.

Завидую всем вам, вашему энтузиазму и безостановочному тестированию и экспериментированию...

Напротив, Ваше поведение более свойственно нормальному человеку. Я вот хочу порой всё бросить, но постоянно появляются идеи, которые хочется проверить... это чрезмерная вязкость.

Правильно - это заниматься всем этим делом за зарплату или, как хобби. Получать удовольствие от процесса.

 
Andrey Dik #:

я не администрация и не модератор, но беру ветку под свой контроль. не обижайтесь, если будете забанеными. если есть вопросы - пишите в личку

А можно узнать как брать ветку под свой контроль? 
 
Aleksey Vyazmikin #:
Идею закрытия через заданное время я не очень поддерживаю, мне всё же кажется, что правильней закрываться либо по рыночному событию, либо по таймингу начала нового бара (к примеру открылись на минутке и закрылись при новом часовике). Сам больше использую трал или уровни от ATR.

Я не по времени закрываюсь. Просто проверяю достигнут ТП или СЛ, заглядывая вперед на 1-3-10-100 часов. В основе - этот индикатор https://www.mql5.com/ru/code/903 - параметр bars_future = 10 (я его делал 10000, чтобы наверняка все бары разметились)
Для случая 3 часов, если ТП/СЛ большие, то 300-500 пт за ночь не всегда проходит, поэтому такие сделки остались как "не знаю". Когда было заглядывание на 10000 баров, то они размечались и участвовали в обучении и думаю, что именно за счет этих ночных входов и получалась прибыль.

Трал пробовал - не понравилось. Тренды ловит, но редко с паузами в 1-2 года.

Sampler
Sampler
  • www.mql5.com
Индикатор i_Sampler рассчитывает идеальные входы, предназначен для обучения нейросети.
Причина обращения: