Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2811
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Там нужно какие-нибудь веселые вознаграждения придумывать, чтобы захватить закономерности. Иначе будет молотить до псевдооптимума любой ф-ии
Это все про q функцию и критиков, интересная тема...
обсуждалось здесь больше года назад, когда я RL алгоритмы пилил
возвращаться пока нет желания и у меня и так некая смесь RL + supervised, давно на авторские схемы хитровыдуманные перешелобсуждалось здесь больше года назад, когда я RL алгоритмы пилил
возвращаться пока нет желания и у меняЭто когда состояний агента много, например в играх. У тебя всего 2-3 состояния бай/селл и т.д.
Да не, так все примитивно, иначе не было бы этого направления вообще..
состояние это не бай\сел , бай\сел это действие action , а состояние state это грубо говоря номер кластера текущей среды , и на каждый кластер state есть свои действия action ...
Но action не обезательно должен быть примитивный типа бай\сел , это может быть разсуждения агента о будущем например...
Типа что если я сейчас куплю на [i] , а на сдел свече[i+1] цена упадет , но не ниже какой то цены , я подожду след свечи [i+2], но если цена уйдет еще ниже я перевернуть, если нет то буду держать бай[i...20]
Те это нетривиальные разсуждения о будущем и ведут к открытию осознаной позиии...
Но таких комбинаций вариантов разсуждений хулиард , чтобы их всех не перебирать мы обучаем Q функцию , те агент берет для разсуждений только те варианты у которых хорошее Q значение ,
Q нейронка или матрица тренируеться предварительно...
Я так это все вижу..
Схема решения простая
))) ага,канешн..
боюсь тех кто говорит "все просто"
Да не, так все примитивно, иначе не было бы этого направления вообще..
состояние это не бай\сел , бай\сел это действие action , а состояние state это грубо говоря номер кластера текущей среды , и на каждый кластер state есть свои действия action ...
Но action не обезательно должен быть примитивный типа бай\сел , это может быть разсуждения агента о будущем например...
Типа что если я сейчас куплю на [i] , а на сдел свече[i+1] цена упадет , но не ниже какой то цены , я подожду след свечи [i+2], но если цена уйдет еще ниже я перевернуть, если нет то буду держать бай[i...20]
Те это нетривиальные разсуждения о будущем и ведут к открытию осознаной позиии...
Но таких комбинаций вариантов разсуждений хулиард , чтобы их всех не перебирать мы обучаем Q функцию , те агент берет для разсуждений только те варианты у которых хорошее Q значение ,
Q нейронка или матрица тренируеться предварительно...
Я так это все вижу..
Согласен, бай селл не торговать это не состояния. Состояний ряда хулиард.)))
Согласен, бай селл не торговать это не состояния. Состояний ряда хулиард.)))
стостояний не много (если это кластера)
вариантов разсуждений о будущих действиях хулиард
но разсуждать нужно чтобы найти максимально правильные действия в каждом состоянии, более того их нужно пересматривать на каждой свеча
Да не, так все примитивно, иначе не было бы этого направления вообще..
состояние это не бай\сел , бай\сел это действие action , а состояние state это грубо говоря номер кластера текущей среды , и на каждый кластер state есть свои действия action ...
Но action не обезательно должен быть примитивный типа бай\сел , это может быть разсуждения агента о будущем например...
Типа что если я сейчас куплю на [i] , а на сдел свече[i+1] цена упадет , но не ниже какой то цены , я подожду след свечи [i+2], но если цена уйдет еще ниже я перевернуть, если нет то буду держать бай[i...20]
Те это нетривиальные разсуждения о будущем и ведут к открытию осознаной позиии...
Но таких комбинаций вариантов разсуждений хулиард , чтобы их всех не перебирать мы обучаем Q функцию , те агент берет для разсуждений только те варианты у которых хорошее Q значение ,
Q нейронка или матрица тренируеться предварительно...
Я так это все вижу..
когда правильно начнешь видеть, тогда вау-эффет пропадет
Ты описал политику агента, многоходовочку. Я все написал об этом. Пишу нубским языком чтобы понятно было, да и забыл уже
Вот именно, что все так примитивно
Тут одна с пеной у рта уже изливалась про Агентов, до очередного бана )