トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2623

 
JeeyCi #:

そして、その答えは、あなたに向けたものではありませんでした - あなたはまだ読むことができない...

無意味な内容を含む記事を薦めると、それを貪るように(自分の有能さを示す)、他人にも薦める...。

質問:その回答が私宛でなかった場合、もはや妄想ではないのでしょうか?この質問は、レトリックではありません。
 
JeeyCi #:

ここは2ndモデルも必要ないのでは? - モデル選択のためのクロス バリデーションと グリッドサーチ ...

が、もしかしたら、混乱マトリックスだけで2番目の質問(あなたのアイデアの2番目のモデルの目的)に答えられるかもしれない...。

ないし

...ただ、2ndモデルが必要なのかどうかは疑問です・・・。イムホ

それこそプラドなどを読むと、2つ目のモデルを使ったときの混同行列の改善が謳われていますね。しかし、最初のモデルの例をオーバーサンプリングして、「真陽性」の数を増やしたりしているのです。もう忘れてしまいました、残念です。
1つのモデルを使えば、あるものを犠牲にして別のものを改善することができ、2つのモデルを使えば、すべてを改善できる、はずなのです。コンフュージョンマトリックスプラドやメタライブリングプラドを探す。携帯電話からです。
また、クロスバリュエーションは、そのような操作の後、「良い」と表示されます、あなたは、TCの株式残高の新しいデータを見れば、すべてを一度に見ることができます )
 
Maxim Dmitrievsky #:
ここでは、混乱マトリックスの改善は、例えばプラドを読めば、第二のモデルで主張されているだけです。しかし、最初のモデルにはオーバーサンプリングの 例を使って、真陽性か何かの数を増やすこともしています。もう忘れました、残念。
1つのモデルを使えば、あるものを犠牲にして別のものを改善することができ、2つのモデルを使えば、すべてを改善することができる、とも言われています。コンフュージョンマトリックス・プラド、またはメタ・ライベル・プラドを調べてください。携帯電話からです。

アップサンプリングとダウンサンプリングは、アンバランスなデータセットや小さなトレーニングセットのためのものです - そういう意味であれば - つまり、小さなクラスに高い重みを与えたり、その逆をしたりすることですそうですね、おそらく増やすために(トゥルーポジティブ)・・・。

***

2つのモデルについてですが、おそらく2回フィルタリングすることが可能です。最初にシグナルで重みを設定し、次にその重みに応じて取引します(2回目の計量で入力が開始されます)。しかし、コンテキストを扱う場合の実装は、通常、まだ少し異なっています。タスクは「トランザクションとそのコンテキスト」のコーディングを使用し、2番目のRNNが1番目の処理結果を受け取って出力でデコードします。しかし、実際には「トランザクションとコンテキスト」(ペアとして!!)を通して処理・通過するので、2種類のタスク(例えば、コンテキストとトランザクション)で2つのネットワークを扱うことはあまり関係ありません。- は、スピードの問題を 解決するだけで、出力の妥当性については解決しない(あるいは程度が低い)のです......。イミフ

しかし、もし本当にコンテキストとトランザクション処理を分けたいのなら(コンテキストは別、トランザクションは別)、今のところそのような構造は、サンドイッチ(あるいはオイルとバター、現象の相互関係や依存関係を潤滑にする、2層構造)を思い起こさせますね...。私はあなたのTechSuiteを解釈するふりはしませんが、モデリングプロセスにおいてまだ保存する価値があるかもしれないという懸念と提案を表明しました - すなわちリレーションシップ!...。美しい(現実を反映した!バターオイルではない)ネットワーク・アーキテクチャが実現することを祈っています。

p.s.)「文脈広告」の永遠の問題として、「主なものは、現実から脱却することではない」(唯一の彼らのスケールの設定は時々曲がっている - 私は誰で指を指すことはありません- または小さなサンプルで間違った方向に働いて いました)。

 
JeeyCi #:

アップサンプリングとダウンサンプリングは、アンバランスなデータセットや小さなトレーニングセットのためのものです。そうですね、おそらく増やすために(トゥルーポジティブ)・・・。

***

2つのモデルについてですが、おそらく2回フィルタリングすることが可能です。最初にシグナルで重みを設定し、次にその重みに従ってトレードします(2回目の重みの時に入力で起動します)。しかし、コンテキストを扱う場合の実装は、通常、まだ少し異なっています。タスクは「トランザクションとそのコンテキスト」のコーディングを使用し、2番目のRNNが1番目の処理結果を受け取って出力でデコードします。しかし、実際には「トランザクションとコンテキスト」(ペアとして!!)を通して処理・通過するので、2種類のタスク(例えば、コンテキストとトランザクション)で2つのネットワークを扱うことはあまり関係ありません。- は、スピードの問題を 解決するだけで、出力の妥当性については解決しない(あるいは程度が低い)のです......。イミフ

しかし、もし本当にコンテキストとトランザクションの処理を分けたいのなら(コンテキストは別、トランザクションは別)、今のところそのような構造は、サンドイッチ(あるいはオイルとバター、現象の相互関係や依存関係を潤滑にする、2層構造)を思い起こさせます......」。私はあなたのTechSuiteを解釈するふりはしませんが、モデリングプロセスにおいてまだ保存する価値があるかもしれないという懸念と提案を表明しました - すなわちリレーションシップ!...。美しい(現実を反映した!バターオイルではない)ネットワーク・アーキテクチャが実現することを祈っています。

p.s.)「コンテクスト広告」の永遠の課題として、「主なものは現実から離れないこと」(ただ、その目盛りの設定が時々曲がっている - 私は誰を指さない- または小さなサンプルで間違った方向に働いて いました)。

時系列の場合、コンテキストの概念はあまり有用ではないかもしれない。そこに明確な区分はなく、どちらのモデルも予測に関与している。ひとつは方向性、もうひとつはタイミングです。同等と言えるでしょう。問題は、モデルの誤差の分析に頼った最適な取引状況の探索をどのように行うか、そしてそれが可能かどうかということである。どちらか一方を順次鍛え直すことができる。再トレーニングのペアごとに、新しいデータに対して結果を改善する必要があります。つまり、学習用サンプルからパターンを抽出し、見たことのない新しいデータに対して徐々に改善していくことができなければならないのです。非自明な課題です。

1つ目のモデルで予測がうまくいかない例を、2つ目のモデルの「取引しない」クラスに放り込むようにしたのです。初号機のフープサンプルは捨てた。それに伴い、最初の1枚の誤差はほぼゼロになった。2つ目は小さいのもあります。しかし、だからといって新しいデータで良いとは限りません。

これはある種の組み合わせ問題で、適切なタイミングで適切な売り買いを見つけるということです。

もしかしたら、ここで解決するのは無理かもしれません
 
Maxim Dmitrievsky #:
規則性という概念は、再現性を意味します、大切なことです

あるクラスタが90%の確率で何かを予測でき、それが200回以上繰り返されれば、それはパターンであると考えることができる。
あるいは、クラスタではなく、ログである。

複雑なモデル(「複雑」という言葉からして複雑)を扱っていると、内部パターンの再現性を修正する能力が失われる、言い換えれば、パターンとフィッティングを区別する能力が失われる......ということです。

これを理解すると、ニューラルネットワークはゴミ箱行きだが、木型はルールに分解でき、ルールはすでに統計を数えることができることがすぐに理解できるだろう
 
mytarmailS #:
規則性という概念は、再現性を意味します、大切なことです

あるクラスタが90%の確率で何かを予測でき、それが200回以上繰り返されれば、それはパターンであると考えることができる。
あるいは、クラスタではなく、ログである。

複雑なモデル("complex "の語源は複雑)を扱うと、内部パターンの再現性を検出する能力が失われる、言い換えれば、パターンとフィッティングを区別する能力が失われる......。

これを理解すると、ニューラルネットワークはゴミ箱行きだが、木型はルールに分解でき、ルールはすでに統計値をカウントできることがすぐにわかるだろう
しかし、解析の可能性がないとはいえ、単純な依存関係がなければ、多くの機能をnsに詰め込むことができます。そうでなければ、機械学習をすべて捨てて、単純なTSの書き方に戻ってしまうでしょう :)そうすれば、簡単なアルゴリズムを書き、テスターでどう動くか(動かないか)を見て、調整して、また見る、といったことができるようになるのです。
 

統計は線形で ある、どう考えても...。ニューラルネットは、重み付けに2層以上のDense nsを使うことで、非線形な 依存性を与える(従来は、依存性はORダム相関なので、まだ非常に大きな問題がある)...。でも、バカな相関関係でもうまくいくなら、それで儲けようと思ってもいいわけで......。- 動作が停止する瞬間は、時間内に検出する必要があります(何らかの異常(ランダムかシステマティックか、それは別の問題です)に気づく必要があります)、そして、いつものように、リスクと収益性の問題を決定してください。

nsの便利なところは、その柔軟性にあります。柔軟性があり、入力からまったく異なる「命名法」を得ることも供給することもできます。つまり、ネットワーク自体の中で必要な変換を行うことができるのです。で、マルチスレッドモードで行う(ライブラリに依存)...。統計だけでなく...

インプットを見つけるのに統計学が必要かどうかは別問題ですが...。

統計処理よりも知識と経験が役立つことが多い - 前者は具体性に、後者は共通分母への還元に焦点を当てるからだ ...

何事にも適材適所がある - 統計も然り...。

***

重要なのは、ロボットにとって、数字から得られる確率以外に説明する方法はない(他の方法では説明しない)ということです...-それが、0と1の数字を使って、世界で経済学が機能してきた方法です...だから、入力をデジタル化して、出力の確率を求め、信頼区間の 条件を設定しなければなりません(これは、必ずしも統計学ではなく、我々が信頼するものです)...。二項対立の論理も、二項対立の論理の加重結果(つまり、潜在的な解の全範囲からの確率)も、何でも信じることができる(主観的だ)。-- それは趣味や習慣の問題であって、聖杯の探求についての議論の対象にはならない......。

(森に入ったり、ニューラルネットワークに入ったりするのは、もうディテールですしね)。

木や森とニューラルネットワークを同じプロジェクトで使うことを禁止している人はいません。- 問題は、いつ、どこで、何を使うか(スピードとメモリが重要)であって、どちらが優れているかではないのです......。- 時間を無駄にしないために - 「タイミングを切り離した取引は時間を無駄にし、タイミングを切り離した取引は未知の取引である」と同等である。

 
こんな長文で、こんな弱気な結論......)たとえ時間を抽象化したとしても、1つのモデル(正則化され、フィットしていない)では、利益を生む取引と利益を生まない取引の比率や、利益を生まない取引の除外をうまく教えることはできません。トレーリングサンプルでもTS取引 結果の人為的な悪化と認識される分類誤差を取り除くことはできない。
 

どんなモデルも確率以上のものは得られない(これはデジタル化のメリットでもありデメリットでもある)、たとえその確率に重みがないとしても...。私はサンドイッチで自分を毒殺しないし、誰にも助言しない - 誰もベイズをキャンセルしていない(あなたがコードにそれを入れていない場合でも、特に - あなたがコードにそれを入れている場合)....

p.s. そして、あなたはマクドナルドのファンなのでしょう・・・。- 仮説、確認しない...。

結論よりアルゴリズムが大事

 
JeeyCi #:

どんなモデルも確率以上のものは得られない(これはデジタル化の利点でもあり欠点でもある)、たとえこれらの確率に重みがないとしても...。私はサンドイッチで自分を毒殺しないし、誰にも助言しない - 誰もベイズをキャンセルしていない(あなたがコードにそれを入れていない場合でも、特に - あなたがコードにそれを入れている場合)....

p.s. そして、あなたはマクドナルドのファンなのでしょう・・・。- 仮説、検証するつもりはない...。

結論よりもアルゴリズムが大事。

サンドイッチは、どんな深さのネットでも広く使われています。作業によって、さまざまな仕掛けがあります。しかし、狭く考えれば、どんなコピー機でもコピー機、どんなハンバーガーでもマクドナルド
何もしなくても、自分の固定観念の人質になってしまうことがある。そして、ステレオタイプはレイヤーから生まれるものではない😀。
私の回答では、暗黙のうちに、一般化された知識から、状況に適した特定の知識を選び出す、第二の明確化モデルを使用しました。