Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1555

 
Aleksey Vyazmikin:

Ну не знаю, на мой взгляд как раз нарезать кластеры по ZZ продуктивно, особенно если к ним добавить средние правила построения с рынка. Суть в том, что к одной точке можно прийти разными путями, а в выборке делается акцент только на малое множество таких путей, а так будет сбалансирована выборка. Возможно у нас разные целевые, поэтому и мыслим по разному, что бы лучше сгодилось для конкретного обучения. У Вас же кластера только по правилу одинакового размера, что как раз генерирует СБ, если предикторы берут данные на стыках двух кластеров...

А железо - да, берите, если это ускорит полет фантазии!

а, ну кластеры разных размеров можно сделать тоже, не факт что спасет

думаю, что сама идея с перемешиваниями порочна, но интересно

 
Maxim Dmitrievsky:

а, ну кластеры разных размеров можно сделать тоже, не факт что спасет

думаю, что сама идея с перемешиваниями порочна, но интересно

Случайное разбитие выборки или по Вашему перемешивание (если я вас правильно понял) это один из способов снижения переобученности. Не знаю насколько это уместно в регрессии, но в классификации идет на ура.
Мне кажется сейчас как раз таки идет некое противостояние между алгоритмами которые приближают функцию к целевой и алгоритмами препядствующие этому. Некое сопротивление возникающее в процессе обучения. Чтоб жизнь медом не казалась :-)
Если сопротивления нет, то обучение приближается слишком быстро к целевое в следствии чего перескок через порог переобученности очень вероятен.
Если сопротивление есть, но слабое эффект тот же самый.
Если сопротивление слишком сильное, то происходит недообучение и модель не может добратся до доверительного интервала в котором и лежит зона обобщености, показывая при этом плохие результаты самой учебы. Тоже не годится.
Вывод один, сопротивление обучению. Или методы направленные на снижения переобученности должны быть сбалансированны относительно основного алгоритма что бы фукнция с завидным постоянством приходило в область доверительного интервала, но ни в коем случае не перескакивала челез нее или делала это крайне редко.
 
Mihail Marchukajtes:
Случайное разбитие выборки или по Вашему перемешивание (если я вас правильно понял) это один из способов снижения переобученности. Не знаю насколько это уместно в регрессии, но в классификации идет на ура.
Мне кажется сейчас как раз таки идет некое противостояние между алгоритмами которые приближают функцию к целевой и алгоритмами препядствующие этому. Некое сопротивление возникающее в процессе обучения. Чтоб жизнь медом не казалась :-)
Если сопротивления нет, то обучение приближается слишком быстро к целевое в следствии чего перескок через порог переобученности очень вероятен.
Если сопротивление есть, но слабое эффект тот же самый.
Если сопротивление слишком сильное, то происходит недообучение и модель не может добратся до доверительного интервала в котором и лежит зона обобщености, показывая при этом плохие результаты самой учебы. Тоже не годится.
Вывод один, сопротивление обучению. Или методы направленные на снижения переобученности должны быть сбалансированны относительно основного алгоритма что бы фукнция с завидным постоянством приходило в область доверительного интервала, но ни в коем случае не перескакивала челез нее или делала это крайне редко.

это то да, но когда нет закономерностей в ретурнах, что мертвому припарка )

 
Aleksey Vyazmikin:

Идея с перемешиванием интересна, но мне кажется, что нужно рандомить движение цены от одной ключевой точки до другой. И сами блоки создать при помощи ZZ, вот тогда получиться действительно похоже на рынок.

Не надо использовать ZZ и вообще любые дополнительные индикаторы. Только OHLC с нескольких тф (тф должны отличаться в 4-6 раз. Например, 1-5-30-H3... вплоть до месячного тф. Подобрать самостоятельно.) и, возможно, еще тики для раннего предупреждения.

По ценам максимумов и минимумов  отдельно сверточные структуры. По OHLC -рекуррентную структуру. И так по всем используемым тф. Сигналы всего этого далее поступают, например, на полносвязную сеть.

Также тики пропущенные через рекуррентную сеть завести на один из входов полносвязной сети.

Оптимизировать по скорости увеличения депозита. Совокупная сеть сама в результате должна решать, какой объем лота и выбирать точки открытия и закрытия. Примерно так.

 
Eugeni Neumoin:

Не надо использовать ZZ и вообще любые дополнительные индикаторы. Только OHLC с нескольких тф (тф должны отличаться в 4-6 раз. Например, 1-5-30-H3... вплоть до месячного тф. Подобрать самостоятельно.) и, возможно, еще тики для раннего предупреждения.

По ценам максимумов и минимумов  отдельно сверточные структуры. По OHLC -рекуррентную структуру. И так по всем используемым тф. Сигналы всего этого далее поступают, например, на полносвязную сеть.

Также тики пропущенные через рекуррентную сеть завести на один из входов полносвязной сети.

Оптимизировать по скорости увеличения депозита. Совокупная сеть сама в результате должна решать, какой объем лота и выбирать точки открытия и закрытия. Примерно так.

Что предлагаете  в качестве целевой функции для промежуточных сетей? Т.е. чему их обучать?
 
Eugeni Neumoin:

Не надо использовать ZZ и вообще любые дополнительные индикаторы. Только OHLC с нескольких тф (тф должны отличаться в 4-6 раз. Например, 1-5-30-H3... вплоть до месячного тф. Подобрать самостоятельно.) и, возможно, еще тики для раннего предупреждения.

По ценам максимумов и минимумов  отдельно сверточные структуры. По OHLC -рекуррентную структуру. И так по всем используемым тф. Сигналы всего этого далее поступают, например, на полносвязную сеть.

Также тики пропущенные через рекуррентную сеть завести на один из входов полносвязной сети.

Оптимизировать по скорости увеличения депозита. Совокупная сеть сама в результате должна решать, какой объем лота и выбирать точки открытия и закрытия. Примерно так.

а сверху бантик еще )

 
elibrarius:
Что предлагаете  в качестве целевой функции для промежуточных сетей? Т.е. чему их обучать?

По скорости увеличения депозита. Это целевая функция. Свертка максимумов и свертка минимумов - некоторый аналог ZZ. Это выявляет волновые фракталы. Рекуррентные структуры по OHLC - здесь отлавливаются свечные комбинации - свечные паттерны (фракталы).

Сетки по данным с разных тф выявляют фракталы на разных тф. Целевая функция по скорости увеличения депозита задает, в какой мере учитывать фракталы, возникающие на различных тф. 

Maxim Dmitrievsky:

а сверху бантик еще )

Это на любителя.


 
Eugeni Neumoin:

По скорости увеличения депозита. Это целевая функция.

Депозит из чего складывается? Из команд купить/продать/ждать.

Этим командам будет обучаться конечная НС. И потом предсказывать их.
Чему должны обучаться промежуточные сети? ЗигЗагам? Чтобы чему-то обучить сеть, ей нужно показать ответ. Какой алгоритм зигзага и с какими параметрами предлагаете использовать в качестве обучающего сигнала?

 
elibrarius:

Депозит из чего складывается? Из команд купить/продать/ждать.

Этим командам будет обучаться конечная НС. И потом предсказывать их. Чему должны обучаться промежуточные сети?

Здесь можно просто максимизировать прибыль.

То есть выявляются места открытия и закрытия позиций, которые в результате дают прибыль. Чем потенциально большую прибыль получаем при входе в выявленной точке входа, тем больший уровень сигнала на выходе сетки.

 
Eugeni Neumoin:

Здесь можно просто максимизировать прибыль.

То есть выявляются места открытия и закрытия позиций, которые в результате дают прибыль. Чем потенциально большую прибыль получаем при входе в выявленной точке входа, тем больший уровень сигнала на выходе сетки.

Это делает одна сеть.
Промежуточные нужно чему-то конкретному обучать. Если чего-то конкретного нет, то они бесполезны.