Привет, Хабр! Предлагаю вашему вниманию ещё один перевод моей новой статьи с медиума. В прошлый раз (первая статья) (Habr) мы создали агента на технологии Q-Learning, который совершает сделки на имитированных и реальных биржевых временных рядах и пытались проверить, подходит ли эта область задач для обучения с подкреплением. В этот раз мы...
:)))孫のケシャとポシェカンアリオシャに、最後の審判のように、ここですべてを考え、語らせてください。そして、彼らの戒律を通貨に換算してみる。美しい!
インターネットは口コミが広がる大きな村なので、頻繁に累積を参照することで
(累積の言及は口コミで何でもすぐに広がる大きな村です。 だから累積の頻繁な言及はヒンズーによる七面鳥の作成につながり、RLによる魂の救済についての我々の救世主の愚痴はこのスレッドの作者を無関心にしませんでした))
medium.com/@alexeybnk/improving-q-learning-agent-trading-stock-by-adding-recurrency-and-reward-shaping-b9e0ee095c8b
medium.com/@alexeybnk/improving-q-learning-agent-trading-stock-by-adding-recurrency-and-reward-shaping-b9e0ee095c8b
好き
アレクセイ・ヴャジミキン
アレシャ、グリッドとパラメータではなく、グリッドによるハイパーパラメータ、ランダム、などです。でも、どうやって検証するかは考えないといけない。
でも、適当に何を使って検証するのではなく、(必要なら)どう検証するかを考えないと、このゲームは意味がないんですよね...。
先生、このテラリウムのパラメータとハイパーパラメータの違いは何でしょうか?図書館の名前は、報告するのが適切だろう...。
私は、小さなモデルサイズ(10~30本のcatbustツリー)で、pythonとコマンドラインでGPUのパフォーマンスをテストすることを目標としています。
はい。そして、それをDFSplitRで複製し、回帰の足場も同じ機能を持つようにします。
値を変える
qcnt=15です。
qmin=1です。
qmax=5とした。
など、ファイルサイズが 変わらないので、エラーもあまり影響がないようです。
時間がないからよくわからないのかもしれません。RLにきちんとノイズを入れることで、OOSでトレース上の結果を均一化する、もちろんトレース部にもノイズを入れる。そのDQN記事の例に倣うが、さらに早くから実装している
https://habr.com/ru/post/436628/
もちろん、正弦波で行き過ぎた、学習には簡単すぎるフレーズですが、ロジックのエラーを検索する分には問題ないでしょう。
LSTMのセルを "自分の手で "追加する方法は面白いですね、ちょっと考えてみます。
値を変える
qcnt=15です。
qmin=1です。
qmax=5とした。
など、ファイルサイズに変化がない場合は、エラーの影響はあまりないようです。
時間がないので、よく理解できていなかったかもしれません。データを書き込む前に 、倍精度が必要でなければ、Floatに変換することができます(私はそうしないと思います)。
いざとなったら、自分でやるかもしれない。
RNNとLSTMを使うのがいいと思うのですが、Metatraderで試された方いらっしゃいますか?通常の回帰は、ガウス分布の点群に対してのみ有効であり、「計量経済学の 実用馬」である。
R.mqh ライブラリとkeras/tensorflow ライブラリを、RまたはPythonから使用します。すべての好みに合うように、完全な機能とたくさんのサンプルが用意されているので、問題ありません。
グッドラック
R.mqh ライブラリとkeras/tensorflow ライブラリはRからPythonに欲しいです。問題なく、全機能を使用できます。
グッドラック
ウラジミール、もしモニタリングがあれば、個人的なメッセージでリンクを送ってください。
自分のはモニターしない、他人のは知らない。上に引用した記事は、再現できるほどの情報がなく、コードも複雑すぎる。R6を使わなくても、パッケージの標準的なレイヤーですべて実装できると思うのですが。
グッドラック