トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1957

 
elibrarius:

そうなんです。すぐに一連の動作を記述するのはいかがなものかと...。
あなたの説明をもう一度考えてみると、次のような順序が想定されます。

1.トレーニング
の全予測子の相関を計算する 2.ツリーを作る
3.最後のスプリットで、例えば過去100回のベストスプリットを思い出してください。100個まで予約できるので、たくさんの中から選ぶことができます。
4.これらの100の中から、最良のスプリットの予測因子と非相関で、かつ互いに非相関の5つを選びます。

さらに、この5種類の分割のうち、どれを選べばいいのかがわからないのですが?
ランダムであれば、ランダムフォレストと類似しており、各木にランダムな予測子を与え、その上で木を構築する。
平均値であれば、ランダムフォレストと同じで、ランダムツリーから算術平均を求める。

今、あなたはそれを正しく理解した!

だからランダムフォレストは ランダムなのです。ゴミだらけで、上記のような条件は必ずしも当てはまりませんが、似たような状況はありえますし、似たような分解から成功モデルが生まれる可能性はありますね。しかし、ここでは、よりコントロールされたプロセスが行われることになります。

シートの各分割の重さはもちろん、もしかしたら同じ係数を出すかもしれない、同じ履歴の係数を拾えるかもしれない。今は、葉っぱから模型を組み立てるときは、だいたいそうしています。

 
Valeriy Yastremskiy:

な、アナログな動作とは、和、差、乗、除、そしておそらくもっと複雑な対数的な依存関係、力関係です。そして、これらは計算ではなく、各セルにあるアナログゲージです。そして、DACやADCは入力出力で、計算には参加せず、デジタルを提供するものです。

ノイマンアーキテクチャでは、手続きとデータの両方がメモリに格納され、手続きとデータへの並列アクセスはありません。データにアクセスしてから手続きを行い、またデータに戻るため、データ処理に制約があります。そして、ここではプロシージャは小さな装置で各セルに格納され、データへのアクセスとともにプロシージャへのアクセスが一度に行われる。

ここで、よくわからないデータがあるのですが、条件的に言うと、各命令はコンベアなしでメモリと計算結果に直接アクセスできるのでしょうか?

 
Aleksey Vyazmikin:

これでバッチリです!

ランダムフォレストはゴミだらけなのでランダムであり、記載されている条件が必ずしも満たされるわけではないが、似たような状況があるかもしれないし、似たような破綻があっても成功するモデルが得られる可能性はある。しかし、ここでは、よりコントロールされたプロセスが行われることになります。

シートの各分割の重さはもちろん、もしかしたら同じ係数を出すかもしれない、同じ履歴の係数を拾えるかもしれない。今は、葉っぱから模型を組み立てるときは、だいたいそうしています。

最後のステップ、「5分割のうち、どれを選ぶか」がわからないのですが?
 
elibrarius:
最後のステップがよくわからなかったのですが、5つの分割のうちどれを選べばいいのでしょうか?

5分割の読み取り値をすべて考慮する必要があるため、安定性が増します。

最も良い分割に0.6の重みを与え、他の4つにそれぞれ0.1を与えたとすると、合計が0.8またはサンプリングによって決定された他のスコアを与える場合、答えは真の「1」またはシートで予想される他のクラスである。

また、Recall 、すなわち、分割がこの部分標本に対してどれだけのリコールを持つかを確認する必要があります。
 
Aleksey Vyazmikin:

データについて理解できないのは、観念的で、各命令がメモリに直接アクセスし、計算結果がコンベアなしで?

データ」は存在せず、トランジスタなどで電流を制御された電子だけが存在する。NSのアーキテクチャそのものは、デジタルではなく基板に印刷されています。iPhoneなどに搭載されているコプロセッサという形で、以前からこのようなアナログのニューラルネットワークを作っていたのだ。

記事に目新しさはない。
 
マキシム・ドミトリエフスキー

データ」は存在せず、トランジスタなどで電流を制御された電子があるだけです。NSのアーキテクチャそのものは、デジタルではなく基板に印刷されています。iPhoneなどに搭載されているコプロセッサという形で、以前からこのようなアナログのニューラルネットワークを作っていた。

記事に目新しさはない。

そして、静的な、決められた計算ではなく、動的な計算の話だと理解しました。

 
Aleksey Vyazmikin:

そして、静的で決められた計算ではなく、動的な計算という意味だと理解しました。

例えば、iPhoneのカメラマトリクスからの信号は、デジタル化をバイパスして直接アナログNSに供給されます。NSは、画質を向上させるための前処理(ノイズの除去など)を行います。

これをデジタル写真に変換する

 
Aleksey Vyazmikin:

私の理解では、静的な決められた計算ではなく、動的な計算の話をしているのだと思います。

大まかに例えると、電子ゲートバルブとコンプレッサーです。もちろん、セル内のデバイスは静的ですが、数が多く、並列にアクセスできます)また、計算はダイナミックに行うことができ、入力信号を変えれば、ダイナミックな出力が得られます。

 
Aleksey Vyazmikin:

5分割の読み取りをすべて考慮することで、安定性が増します。

例えば、最も良い分割に0.6、他の4つに0.1の重みを与え、合計が0.8またはサンプリングによって決定された他の値を与える場合、答えは真の「1」またはワークシートに期待される他のクラスであると仮定します。

また、Recall、つまり、分割がそのサブサンプルに対してどれだけのリコールを持つかを確認する必要があります。
最もクリーンなスプリットが、クリーンでないものと混在することになります。つまり、トレイの上で結果を悪化させるのであって、原理的には問題ないのです。しかし、それがテストでの結果、すなわち一般性を向上させるかどうかはわからない。誰かやってくれないかな...。個人的には、足場の場合よりも一般化は進まないと思っています。

深さを制限して、最後の分割を行わず、前の分割で止めておくと、かなり楽になります。余計な分割をした場合よりも、同じようにクリアなシートが少なくなってしまうのです。あなたのオプションは、スプリットをするかしないかの中間を与えるものです。I.e.例えば、あなたのメソッドで深さ7レベルのシートを平均化します。第6深度レベルシートより若干きれいになります。一般化してもあまり変わらないと思いますし、検証するのも大変ですからね。また、深度レベル6と7の木を複数本平均化しても、あなたの方法論とほぼ同じ結果が得られるでしょう。
 
Aleksey Vyazmikin:

要するに波に対して何らかのアクションを起こす?受信データは多項式に変換され、多項式は波に変換され、波は何らかの方法で「衝突/合体」されるのでしょうか?

まあ、そうなんですけどね。

これまでにもアナログコンピュータを作る試みはありましたが、非常に時間がかかったり、エネルギーを消費したりすることがありました。