トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1269

 

AlphaGo Zero freshのクリエイターから、楽しんで見てください :)


 
マキシム・ドミトリエフスキー

AlphaGo Zeroのクリエイターによる、フレッシュな映像です。)


スタークラフトのモデルの作成/育成/接続方法について、詳しい説明書はありますか?

 
マキシム・ドミトリエフスキー

プレイはせず、試合を見るだけかな。

リプレイから判断すると、アルファトレーダーが作られれば、どんなサイコロの袋よりも良い取引ができるだろう。

そういうロボットをやることで、MOの新しいスキルが得られるようで、とにかく面白いんです。私自身、「StarCraft 2」は新章が出てから何度かプレイしました(そこではストーリーはいくつかのパートに分かれています)。AIとの対戦では、行動の論理ではなく、ユニットのコントロールで勝つことが多いです。

 
ウラジミール・ペレヴェンコ

自分のはモニターしない、他人のは知らない。上に引用した記事は、再現できるほどの情報がなく、コードも複雑すぎる。R6を使わなくても、パッケージの標準的なレイヤーですべて実装できると思うのですが。

グッドラック

どんな幸運を祈るのか理解できない。

最低でもデモを作成してください

MOの要素を取り入れた専門家の結果に納得がいけば、枝葉の部分を最初から最後まで読み直します。

 
マキシム・ドミトリエフスキー

つまり、スピードではなく、知性の戦い、つまり戦略なのです(もちろん、マシンは常に勝ちます)。

SCの内蔵AIはスクランブルの面白くない相手ばかりだし。こちらは逆に、人間味のある演奏ができる。私はこのAIとプロプレイヤーを区別しません、つまりチューリングテストに合格しているのです )))

電子頭脳の活性ニューロンの雲まで可視化した


画面からは、一義的な結論は出せません。はい、おそらく画面に収まるものだけをコントロールするために、問題なく、これらの目的のために、ユニット/構造体またはユニットのグループでホットキーを使用し、この時点でそれらを視覚的に観察する必要はありませんし、また、常に画面上に表示されているマップ上で調整することができます。マイクロコントロールのチシャは、個人的にいくつかの動画を見て、戦略の面でそこに巧妙な何かを見ていませんでしたが、そこに個々のユニットの潜在能力の使用は、フルに開示されています。つまり、そこに重点が潜在的な脅威とそれに対抗するためのオプションを評価することです - 敵の開発の枝に応じてブランチが開発され、さらに経済上の別のモジュール - 異なる方法が見てきた、と制御、私は最初の二つのモジュール(開発と経済の枝)は、プログラムまたは適用ファジーロジック、何か比較的不器用安定性が、制御は状況に基づいているとここだけで完全に仕事のAIと思う。ところで、モノの情報がどのように伝わっているのか、どのようにまとめて判断し、動きを考慮しているのか、チップやターゲットは明確ではありません。

 
ちなみに、私はBlizardのネットワークでWarcraft IIIをプレイすることがあり、そこではよくAIを非難されるのですが、そこにも適用できるのでしょうか。そして、もし使われているとしたら、そんなAIと何回遊んだのだろう。
 
マキシム・ドミトリエフスキー

ちなみにそこでは、もともとマップ全体がボットの画面に配置されていて、それをプレイヤーのようにしたところ、ボットが失速し始め、男性が勝利しました(映像の最後)。このような状況で、よく撮影された悪いmb。一方、その効果をどのように評価するかですが、ある層が成功に至れば、ボットはそれを選択します。

人に見合った制御の制約を作れば、群衆の行動が似ているので、ボットが一般ユーザーに勝つと思います。ところで、私はボットおもちゃのWarcraft 3に対して1つの一族のためのネットワーク上で息子と遊ぶことを試みたとき、最初はそれだけで困難だった(そしてその前に私は人間に対してbattletで一族のゲームの豊富な経験を持っていた)、しかしその後ボットの動作に慣れると徐々に標準外のソリューション(例えば、鉱山に木を通してカット、それによって地面からの攻撃からユニットを保護)を使用して彼を打ち負かすことができます。つまり、標準的な行動と非標準的な行動を分けて考え、同時に互いに干渉し合わないようにする必要があります。トレンドとフラットのようなもので、1つのモデルで両方を同時にトレーニングするのは非常に難しく、少なくとも私はその方法を知らないのです。

 
マキシム・ドミトリエフスキー

重みはないと思います。稀な状況であれば、ボットはそのようなオプションを単に無視します。人がボットの戦略に合わせるのであれば、ボットも人の層に合わせて常に訓練しておかないと、平等な状況とは言えません)。

もしサンプルが違えば、ボット同士の戦いも違ってくるでしょうし。

つまり、結果を比較するための有効なサンプルがないため、トレーニングの結果が常に見える(正しく推定できる)わけではないのです。

 
マキシム・ドミトリエフスキー

そうですね、敵対的なネットワークを通じて、学習が行われるわけです。AIは何千回と対戦し、さまざまな戦略を再現しています。最終的には、ネットワークが最適な戦略を導き出してくれるのです。ゲーム数がプロ棋士の対局数(200年分と言われている)を上回れば、より多くの組み合わせを考えてきたボット側に統計的優位性がある可能性が高い。しかし、ユニークな地層を見つけることができる確率は、もちろんまだ残っています。

話題は面白いが、謎に包まれている :)トレーディングは、自分の行動でマーケットに影響を与えることができないという点で異なりますし、間違いを修正する可能性もありません、もしかしたらポジションの平均化で...。

 
マキシム・ドミトリエフスキー

グラフを何千何万という塊に分割して、ロボットにその塊と何度も対戦させれば、もしかしたら常に勝てるようになるかもしれない、これも小説によりますが。

私は少し違った見方をしていて、このゲームは従来、ボットの数とその潜在能力、資産、資金といった多くの要素からなる各陣営の数学的スコアがあり、相手はこのスコアを減らして自分のスコアを相手より高く保つ、つまり結果にかけるエネルギーを少なくすることを目標としています。その結果、ユニットを犠牲にすることで相手の推定資産価値をユニットの推定値よりも多く減らせることが明らかであれば、これは正しい判断であり、そうでなければ正しくないという、相互に影響しあうシステムになります。トレーディングには保証がなく、確率しかありませんが、おもちゃには計算できる数学的な保証があります。

私たちは状況を変えることはできませんが、ゲームでは利益を生む状況を自ら作り出すことも可能です。
理由: