トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1272

 
マキシム・ドミトリエフスキー

当たり前のことを議論するのは疲れる、全部記事に書いてあるんだから。みんなに好きなように理解してもらいましょう。

もう少し抽象度を上げれば、なぜマーケットと対戦することが同じなのかが明らかになるはずです。

そして、少なくとも、巧妙に考案された用語ではなく、彼ら自身が使う用語で議論することを提案します。そうでなければ、議論は何の意味もない。

ここでは、取引とゲームに類似性を見出そうとする。たとえ、その確率のバランスという同じ力学を考慮に入れても、プロセスの両側から影響を受ける。専門用語ではなく、問題を細かく検証してみよう。

 
アレクセイ・ヴャジミキン

取引とギャンブル、その確率のバランスという同じ力学でも、両者の影響を受けるようなアナロジーを探してみてください。用語の後ろに隠れるのではなく、客観的に問題を見よう。

最後に、これ以上は書きません。

RLエージェントは、市場やSC内の別の相手など、相手が何であろうと関係なく、プログラムなので理解できないのです。あとは、純粋にあなたの "ノウハウ "です。

相手が静的か動的かは関係なく、いずれにせよエージェントは最適なポリシーを学習することになる

きっとうまくいくよ、きっと。ある日のこと。

 
マキシム・ドミトリエフスキー

を最後に、これ以上は言いません。

RLエージェントは、市場やSC内の別の相手など、相手が何であろうと関係なく、プログラムなので理解できないのです。あとは、純粋にあなたの "ノウハウ "です。

相手が静的か動的かは関係なく、いずれにせよエージェントは最適なポリシーを学習することになる

きっとうまくいくよ、きっと。いつかは

トレーニング方法の名称は二の次です。私はずっとプレディクターについて話をしようと思っていました。

そして、NSは状況に影響を与えることを学び、その効果次第で、事象の結果の確率に影響を与えることができることを、どうして理解できないのでしょうか。そして、それこそが、こうしたネットワークの利点であり、状況に影響を与えることができる能力なのです。フレームごとに目標のパフォーマンスを上げるために何をすべきかを判断する(まさにそのグラフ)、活動のプロセスが多段階である、最終的な勝敗の確率はゲーム開始時に決定されておらず、プレイヤーの行動によるものも含めて常に変化している、ここがトレードとの最大の違いであろう。

PL手法をトレードの指導に使ってはいけないということではなく、相手の動き(価格の行方)を受動的に推測するだけでなく、状況を左右して目標に到達するネットワークの有効性を話しているのです。

 
マキシム・ドミトリエフスキー

なぜ感情を表に出すのか、私の主張に対して理路整然とした反論を書けよ。

 
アレクセイ・ヴャジミキン

これはOPTIMAL POLICYまたはSTRATEGYと呼ばれ、すべての可能な敵の行動を考慮したものである。

本を読め、自分を貶めるな。もう100回は書いたよ、表現したいことは2、3文字に収まるんだ。

そんなふざけたこと言わないでください。

 
マキシム・ドミトリエフスキー

これはOPTIMAL POLICYまたはSTRATEGYと呼ばれ、考えられるすべての敵の行動を考慮したものである。

本でも読んで、恥をかかないように。もう100回は書いたよ、表現したいことは2、3文字に収まるんだ。

そんなふうにからかわないでください。

私はこの言葉をよく知らない。インターネットも同じように、何か言うのを嫌がる。リンクを張ってくれ、本当にそう呼ばれているのかどうか見せてくれ。

そして、私の説明がある用語に当てはまるのであれば、あなたの実質的な反論は理解できません。条件ではなく、長期的な目標である「敵の行動によって変化する行動の連鎖による勝利」を達成するために、状況に影響を与えることが重要なのです。

意思決定が行われる環境が違うということです。一方は環境と対話でき、もう一方は対話できず、ただガラス越しに観察するだけです。
 
アレクセイ・ヴャジミキン

http://incompleteideas.net/book/bookdraft2018jan1.pdf

幸運

 
マキシム・ドミトリエフスキー

http://incompleteideas.net/book/bookdraft2018jan1.pdf

幸運

私が洋書を読まないことを知らないのか...一応目を通しましたが、たしかにロシア語のインターネットにあるものよりも高度な内容ですね。

 
マキシム・ドミトリエフスキー

余分な言葉の半分以上を取り除いて、確率的遷移を持つ行動の連鎖(マルコフ連鎖)が残っていれば、より良い

戯言は寝て待て

エージェントと環境の分裂は常に存在し、ガラス越しの観察はできない。繰り返しになりますが、誰もが使えるわけではない抽象的なレベルです。そして、ここでもまた、あなたは勉強せずに作っているので、壁に額をぶつけているのです。

最後に、私は書いて、このバッカンを停止する:影響力は ありません、遷移の確率とポリシーの近似値があります。

あなたがどのように考えているかは知りませんが、用語は、長い間確立されてきた公理でなければ、検証することができず、思考の本質を歪めるだけです。

あなたは例えを出すことができません、用語に言及することは非生産的です。

 
Aleksey Vyazmikin:

私が洋書を読まないことを知らないから...目を通しましたが、たしかにロシア語のインターネットより高度なものがありますね。

まあ、他に読むところがないんですけどね。サットン、バルトは、インターネット上で"強化のトレーニング"翻訳、古い本がありますが、また有用である。