Лучшая ошибка на форексе - Общее обсуждение

Yuriy Asaulenko 2019.01.09 16:06 #12541

Maxim Dmitrievsky:

монтекарлю и ищу лучшую ошибку на тест. выборке, собсно всё

Куда-ж без Монте-Карло.)) А с лучшей ошибкой не все так просто. Оптимальность - штука многофакторная и неоднозначная, и, что есть оптимум - далеко не очевидно.

Maxim Dmitrievsky 2019.01.09 16:08 #12542

Yuriy Asaulenko:

Куда-ж без Монте-Карло.)) А с лучшей ошибкой не все так просто. Оптимальность - штука многофакторная и неоднозначная, и, что есть оптимум - далеко не очевидно.

ну понятно, беру любую ф-ю периодическую, там очевидно что есть оптимум и система на ней будет зарабатывать хоть вечно )

на рынке оптимума вообще нет, локальные только

Maxim Dmitrievsky 2019.01.11 09:57 #12543

Forester 2019.01.12 20:33 #12544

Читаю теорию по деревьям.
Задумался о целесообразности пруннинга (обрезки).

Возможно использовать следующее простое правило:построить дерево, отсечь или заменить поддеревом те ветви, которые не приведут к возрастанию ошибки.

Может проще и быстрее при построении дерева не делить лист, если не найдено его разделение, которое уменьшает ошибку минимум на какое-то значение, например на 0,1-0,5%?
Результат должен быть одинаковым, но быстрее.

Или возможна ситуация, что после пары ветвлений с улучшенем модели на 0,0001% найдется то, которое улучшит ее сразу на 1-5%?

Функция ICustom Есть ли закономерность в Обсуждение статьи "Оценка и

Forester 2019.01.13 07:26 #12545

Maxim Dmitrievsky:

куда еще быстрее то? и так очень быстро

а вообще вы там бустинг собрались сами конструировать чель

вот баесовские методы медленные и не для больших выборок, но они и работают по другому и не переобучаются из коробки. У каждой модели свои особенности. Я теперь угораю по байесу, большая мощь для оптимизации ТС без переобучения

Заманчивая перспектива - их можно апдейтить, а не переобучать заново

Ну если миллион строк подать с 200-1000 предикторами, то наверное долго...
С обрезкой - надо построить дерево до конца, потом обрезать.
А с остановкой ветвления по мин. улучшению ошибки, думаю будет значительная экономия при аналогичном результате. В xgboost параметр называется gamma, а обрезки вроде и нет. Видимо разработчики тоже решили, что это взаимозаменяемые вещи.

Ошибки, баги, вопросы Тестер стратегий MetaTrader 5: ArrayCopySeries

Maxim Dmitrievsky 2019.01.13 07:29 #12546

elibrarius:
Ну если миллион минутных строк подать с 200-1000 предикторами, то наверное долго...
А с обрезкой - надо построить дерево до конца, потом обрезать.
А с остановкой ветвления по мин. улучшению ошибки, думаю будет значительная экономия при аналогичном результате. В xgboost параметр называется gamma, а обрезки вроде и нет. Видимо разработчики тоже решили, что это взаимозаменяемые вещи.

ну им виднее как делать, там команды спецов работали над бустингами, тестили

катбуст нормально вроде работает, быстро, там деревья изначально неглубокие

миллионы данных на форексе... сомневаюсь что это необходимо

Forester 2019.01.13 07:36 #12547

Кстати придумал ситуацю, когда первое разделение почти не улучшает ошибку, а второе улучшает на 100%.

4 сектора в каждом по 10 точек. 1 разделение хоть по оси х, хоть по y. Почти не улучшит ошибку, она останется около 50%. Например первый раз разделили по середине по вертикали. Второе разделение по середине по горизонтали приведет к очень сильному улучшению по ошибке (с 50% до нуля).
Но это искуственно созданная ситуация, в жизни такое не бывает.

Выпадающий список имен редактора Вопрос по сигналам к Любые вопросы новичков по

Maxim Dmitrievsky 2019.01.13 07:36 #12548

Sample sizes are never large. If N is too small to get a sufficiently-precise estimate, you need to get more data (or make more assumptions). But once N is "large enough," you can start subdividing the data to learn more (for example, in a public opinion poll, once you have a good estimate for the entire country, you can estimate among men and women, northerners and southerners, different age groups, etc.). N is never enough because if it were "enough" you'd already be on to the next problem for which you need more data.

Интерполяция, аппроксимация и иже Обсуждение статьи "Популяционные алгоритмы Библиотеки: Быстрая сортировка.

Maxim Dmitrievsky 2019.01.13 07:39 #12549

elibrarius:
Кстати придумал ситуацю, когда первое разделение почти не улучшает ошибку, а второе улучшает на 100%.

4 сектора в каждом по 10 точек. 1 разделение хоть по оси х, хоть по y. Почти не улучшит ошибку, она останется около 50%. Например первый раз разделили по середине по вертикали. Второе разделение по середине по горизонтали приведет к очень сильному улучшению по ошибке (с 50% до нуля).
Но это искуственно созданная ситуация, в жизни такое не бывает.

можно заюзать кернел (трансормировтаь данные) и сделать через одно разделение. Какой кернел для такого случая не знаю, но он точно должен быть

временные ряды вообще не так прогнозируются, там выделять циклы нужно, периодические компоненты. А поскольку на рынке при увеличении выборки, таковые исчезают, поэтому ошибка у всех 50 на 50

поэтому работает только прогнозирование на несколько шагов вперед, при хорошей регуляризации получаются более большие циклы и система проживает дольше, но сделок меньше соответственно

Вопросы от начинающих MQL5 Automated Trading Championship 2008: Торговые стратегии на основе

Forester 2019.01.13 07:45 #12550

Maxim Dmitrievsky:
временные ряды вообще не так прогнозируются, там выделять циклы нужно, периодические компоненты. А поскольку на рынке при увеличении выборки, таковые исчезают, поэтому ошибка у всех 50 на 50

Тут не поспоришь)

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1255