Есть ли закономерность в хаосе? Попробуем поискать! Машинное обучение на примере конкретной выборки. - страница 10

 

train

Так модель выглядит на выборке обучения - видно хороший запас дельты между зеленой и красной кривой - это прибыль.

А вот ниже уже видим как дельта сжалась на выборке exam

По сравнению с тестером расчетный баланс оказался чуть более оптимистичным, но по структуре идентичен - думаю и дальше использовать его для первичной оценки.


 
Aleksey Vyazmikin #:

Так модель выглядит на выборке обучения - видно хороший запас дельты между зеленой и красной кривой - это прибыль.

А вот ниже уже видим как дельта сжалась на выборке exam

По сравнению с тестером расчетный баланс оказался чуть более оптимистичным, но по структуре идентичен - думаю и дальше использовать его для первичной оценки.


 0,10500 лучший вариант. Примерно как у вас. Но линия баланса другая. А ошибка около 0,5. Рискованно, чуть чуть ухудшится и может начать сливать. 4200 сделок и выигрыш всего 0,10500 /4200 ~= 0.00002 на сделку. Очень рискованно. Спредом, проскальзываниями и т.п. весь выигрыш съестся.


 
elibrarius #:
 0,01050 лучший вариант. Примерно как у вас. Но линия баланса другая. А ошибка около 0,5. Рискованно, чуть чуть ухудшится и может начать сливать. 4200 сделок и выигрыш всего 0,01050 /4200 ~= 0.00002 на сделку. Очень рискованно. Спредом, проскальзываниями и т.п. весь выигрыш съестся.


За счет модели процент прибыльных сделок увеличился на 4%, плюс ММ даст ещё столько же - и вот уже можно подумать об эксплуатации.

А так, я считаю, что такая разметка не правильная, так как она не опирается на структуру рынка - нет попытки сравнивать для обучения похожие состояния рынка, поэтому модели приходится все делать самой.

 
Ещё, думаю, что баланс надо определять в итоге по двум моделям (на покупку и продажу) - ведь они могут самокомпенсироваться.
 
Aleksey Vyazmikin #:
Ещё, думаю, что баланс надо определять в итоге по двум моделям (на покупку и продажу) - ведь они могут самокомпенсироваться.
Согласен, так и делаю для своих экспериментов, разные классы не должны мешать друг другу при обучении. 1 модель будет искать общий лучший результат. 2 лучшие модели должны быть в сумме лучше одной. Но с др. стороны могут быстрее переобучаться, т.е. надо сильнее блокировать переобучение.
 
Aleksey Vyazmikin #:
Ещё, думаю, что баланс надо определять в итоге по двум моделям (на покупку и продажу) - ведь они могут самокомпенсироваться.
Обучитесь на первых 2-х столбцах) На последней выборке по Н1.
 
elibrarius #:
Обучитесь на первых 2-х столбцах) На последней выборке по Н1.

Временную закономерность улавливает?

 
Aleksey Vyazmikin #:

Временную закономерность улавливает?

У меня да. Посмотрите, что у вас будет
 
elibrarius #:
У меня да. Посмотрите, что у вас будет

Я сейчас немного с другим подходом развлекаюсь - пока нет возможности проверить. Но, думаю, что так же найдет, коли там все очевидно.

 
Aleksey Vyazmikin #:

Я сейчас немного с другим подходом развлекаюсь - пока нет возможности проверить. Но, думаю, что так же найдет, коли там все очевидно.

В том и дело, что лучше раза в 2, чем на 5000+ фичах.
Получается, что все остальные 5000+ фичей только ухудшают результат. Хотя если отбирать, то наверняка найдутся улучшающие.
Интересно сравнить, что ваша модель покажет на этих 2х.