Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1806

 
ipsec:

Привет народ

Я использую Deep Reinforcement Learning (использую Python), и обучение уже происходит (как показано):


Сегодня я использую только скользящие средние в качестве наблюдения за рынком для обучения.

Эта модель выполняет несколько действий (покупка, продажа и ожидание). Таким образом, после обучения модель сходится во многих действиях, чтобы «ждать» только с лучшими действиями.

Однако в этой модели тренировка очень медленная, потому что в ней используются все тики.

Что вы предлагаете в качестве данных наблюдений за рынком для повышения точности и уменьшения потерь?

Извините за мои ошибки перевода

Проредить тики до допустимой ошибки. 

Выделить участки, где при убирании всех тиков ошибка превышает допустимую.

Обучить модель находить такие участки, если получится конечно))))

 
Maxim Dmitrievsky:

ну это state space модели, работают через раз тоже

А можно целевую привязать к смене тренда. Задача не на профит, а на распознавание и прогноз. Понятно что совершенно разные задачи,  НС не умеет распознавать и прогнозировать одновременно)))) Целевая профит, баланс распознают поворотные точки опосредованно, без прямого распознавания. 

Взять зигзагные развороты дневные, 4часа, часовые (или какие нас интересуют), и смотреть например на каждом (на всех) ТФ 120 баров, и 120  тиков вдогонку))) до точки разворота и после. Дневные и 4 часа смотреть только до следующего и предыдущего разворота или не знаю как лучше. Что то нужно вручную тогда писать конечно, для подготовки данных.

Или есть где подобное. 

 
Valeriy Yastremskiy:

А можно целевую привязать к смене тренда. Задача не на профит, а на распознавание и прогноз. Понятно что совершенно разные задачи,  НС не умеет распознавать и прогнозировать одновременно)))) Целевая профит, баланс распознают поворотные точки опосредованно, без прямого распознавания. 

Взять зигзагные развороты дневные, 4часа, часовые (или какие нас интересуют), и смотреть например на каждом (на всех) ТФ 120 баров, и 120  тиков вдогонку))) до точки разворота и после. Дневные и 4 часа смотреть только до следующего и предыдущего разворота или не знаю как лучше. Что то нужно вручную тогда писать конечно, для подготовки данных.

Или есть где подобное. 

Это очень легко проверяется наличием регулярности между переломами зигзага, т.е. понижением энтропии. Если будет отличие от сб, тогда можно смотреть. Но я не находил таких вещей. Есть пакеты специальные, используются в медицине для анализа днк и выведения формул лекарств. Перестановочная энтропия, например, или более сложные случаи с аппроксиматорами, оптимизаторами типа q-learning
 
ipsec:

Привет народ

Я использую Deep Reinforcement Learning (использую Python), и обучение уже происходит (как показано):


Сегодня я использую только скользящие средние в качестве наблюдения за рынком для обучения.

Эта модель выполняет несколько действий (покупка, продажа и ожидание). Таким образом, после обучения модель сходится во многих действиях, чтобы «ждать» только с лучшими действиями.

Однако в этой модели тренировка очень медленная, потому что в ней используются все тики.

Что вы предлагаете в качестве данных наблюдений за рынком для повышения точности и уменьшения потерь?

Извините за мои ошибки перевода.

I think, deep reinforcement just used for a multivariate tasks, not for 1-5 dimensional, like financial markets. So you can try more simple and faster methods like REINFORCE with neural network or linear approximator. 

 
Maxim Dmitrievsky:
Это очень легко проверяется наличием регулярности между переломами зигзага, т.е. понижением энтропии. Если будет отличие от сб, тогда можно смотреть. Но я не находил таких вещей. Есть пакеты специальные, используются в медицине для анализа днк и выведения формул лекарств. Перестановочная энтропия, например, или более сложные случаи с аппроксиматорами, оптимизаторами типа q-learning

Не, регулярность переломов не работает)))) Что то перед переломом нужно ловить, не учитывая регулярность) В общем шанс есть отловить те переломы, в которых есть одинаковые отличия от СБ перед переломом. Обычными пакетами этого не сделать. И не думаю, что в середине тренда есть что либо значимое для перелома, кроме как слишком большой длительности тренда))))

 
Valeriy Yastremskiy:

Не, регулярность переломов не работает)))) Что то перед переломом нужно ловить, не учитывая регулярность) В общем шанс есть отловить те переломы, в которых есть одинаковые отличия от СБ перед переломом. Обычными пакетами этого не сделать. И не думаю, что в середине тренда есть что либо значимое для перелома, кроме как слишком большой длительности тренда))))

Ну понял, по аналогии с корреляцией ТФ. Можно попробовать

 
Maxim Dmitrievsky:

I think, deep reinforcement just used for a multivariate tasks, not for 1-5 dimensional, like financial markets. So you can try more simple and faster methods like REINFORCE with neural network or linear approximator. 

Если смотреть разные ТФ то размерность больше станет)))) 

 
Maxim Dmitrievsky:

Ну понял, по аналогии с корреляцией ТФ. Можно попробовать

Да. Только ТФ все бы посмотреть, какие нужны сразу не определить. Может соседний, а может через один или 2 значения ТФ будет лучше, или может все нужны))) Сложно продумать.)))

 
Valeriy Yastremskiy:

Если смотреть разные ТФ то размерность больше станет)))) 

После препроцессинга остается всегда штук 5, остальные сильно коррелируют. Если больше 5 это почти всегда переобучение, если все признаки из того же ряда

не вижу смысла гонять глубокие НС на куче коррелированных признаков
 
Maxim Dmitrievsky:

После препроцессинга остается всегда штук 5, остальные сильно коррелируют. Если больше 5 это почти всегда переобучение, если все признаки из того же ряда

не вижу смысла гонять глубокие НС на куче коррелированных признаков

Ну это значит всего 5 рядов признаков) Тогда да, смысла, если другие не найдены, нет.

Причина обращения: