トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2602

 
mytarmailS#:
具体的な例です。
訓練とテストの両方で80%の確率で何かを予測する論理法則、クロスバリデーションなど...。しかし、検証データ(全く未知の新しいデータ)では、ルールはランダムなレベルで機能する......。

もう一つ、最初のルールと同じような動作をするルールがあり、電車でテストしたところ、これも問題なく検証を通過しました。つまり、これは本物のパターンなのですが...。

Question : 学習、テスト、クロスバリデーションの各段階において、あるルールを別のルールと区別するにはどうしたらよいでしょうか。

ランダムか決定論かの統計的なテストなど、どちらか一方と他方を区別できるような兆候はないのでしょうか...。

ランダム性/連続性の問題は、アルゴ全体、そしてアルゴにおけるMLの礎となるものである。

いろいろな仕掛けがいっぱい。


一番簡単なのは、どうしてその結果になったかを見ることです。もし、あなたが得た最高の結果が...もちろん、適合する確率は非常に高い(特に、他の結果のほとんどが無意味である場合)。テストでの結果です。どのようにして手に入れたのですか?- もちろん、お盆に上位5%のベストをとって、全部テストで走らせて、テストでベストを選んだとしたら--もちろん、それでも合う確率は小さくない(特に他の人の平均結果が大したことがない場合)。この「やってはいけない方法」は、きっと、オーバーフィッティングの確率をとてもきちんと減らしてくれるでしょう。だからこそ、他の人のロボットやモデルが公平に評価されることは、まったくありえないと思います。


さらに、言われてみれば、いろいろな仕掛けがありますね。

 
Replikant_mih#:

ランダム性/法則性の問題は、すべてのアルゴ、そしてアルゴにおけるMLの根幹をなす問題である。

いろいろな仕掛けがあるんですよ。

一番簡単なのは、どうしてその結果になったかを見ることです。もし、あなたが得た最高の結果が...もちろん、適合する確率は非常に高い(特に、他の結果のほとんどが無意味である場合)。テストでの結果です。どのようにして手に入れたのですか?- もちろん、トレイで上位5%のベストを取り、それらをすべてテストで実行し、テストでベストのものを選択した場合 - もちろん、それでも適合する確率は小さくありません(特に、他の人の平均結果が大したことがない場合)。この「やってはいけない方法」は、きっと、オーバーフィッティングの確率をとてもきちんと減らしてくれるでしょう。だからこそ、他の人のロボットやモデルが公平に評価されることは、まったくありえないことだと思います。

さらに、言われてみれば、いろいろな仕掛けがありますね。

当たり前のことを当たり前に、油断なく・・・。特定のトリックに興味がある

==============================

例えば、TC、ルール、AMOなどの最適化面(RP)の分析など。

例えば、2つのワゴンのOD TCの交差点を目標「回収率」で表示する。

もちろん、このTSは機能しないし、これまでも、これからもしない。


=======================================

そして、これはPPワーキングTSで、非常に安定しており、これまでのところ利益を上げています(Valeryは知っている:)。


いわば、違いを体感する。

 

だから、TCの外径を見れば、それが何であるか、新しいデータで動くかどうかがわかるという強迫観念があるんです...。

しかし、ODを数えるのは長くて複雑です。もしかしたら、計算機資源の観点から、もっとエレガントで時間のかからない方法でバイパスできるかもしれません。

 
mytarmailS#:

だから、TCの外径を見れば、それが何であるか、新しいデータで動くかどうかがわかるという強迫観念があるんです...。

しかし、OPの計算が長くて複雑なので、もしかしたらもっとエレガントに、計算資源に手間をかけずにバイパスすることができるかもしれませんね。

アルゴトレーダーがどのようにやっているか、なんとなくわかる。データサイエンティストがどうやっているのか、まったくわかりません。そして、私はその方法をよく知っています))。


私の理解では、最適化面は(この場合)3次元空間で、2軸はパラメータ(モデル、戦略)の軸、1軸はターゲットメトリックスです。はい、もちろんそこから入ることができます。いくつかの方法がありますが、必要であれば他の方法を考えることもできます。今は反対側から見ていますけどね。もちろん「当たり前のことばかりだよ、蝶々さん」と突っ込んでくる人に有益な情報を共有しようという気持ちもない

 
mytarmailS#:
因果関係をたどることは必ずしも可能ではない。

そうすると、原因やパターンの有無について推測するしかない。原因は一次的なもので、行動は二次的なものです。TAでは、原因の優先順位を忘れてしまい、ランダムに繰り返される行動をパターンとして捉えてしまうことがあるのですが、これは違います。

 
Replikant_mih#:

アルゴトレーダーのやり方は何となくわかるのですが。データサイエンティストがどうやっているのか、まったくわかりません。そして、どうすればいいのかもよく分かっています)。


私の理解では、最適化面は(この場合)3次元空間であり、2軸はパラメータ(モデル、戦略)の軸、1軸はターゲットメトリックスである。はい、もちろんそこから入ることができます。いくつかの方法がありますが、必要であれば他の方法を考えることもできます。今は反対側から見ていますけどね。もちろん、「当たり前のことばかりだよ、蝶々さん」と突っ込んでくる人に、有益な情報を共有しようという気持ちもありませんしね(笑)

いいですか、もしあなたの答えが : たくさんの仕掛け があるんです。そしてさらに、言われた 通り、様々な仕掛けが施されています。

間違いなく「バターオイル」ではない、深い知識をありがとうございました。

SAやCVのような特別なサイトで回答してみると、面白いように多くのプラスが得られます ...

そんなに気になるなら、いつでも泣けばいいじゃない ))

 
mytarmailS#:

いいですか、もしあなたの答えが トリックやトリックがたくさんあるんです。そしてさらに、おっしゃるとおり、さまざまな仕掛けやテクニックが あります。

間違いなく「バターフィンガー」ではない、この深い知識をありがとうございます。

SAやCVのような特別なサイトで回答してみると、面白いように多くのプラスが得られます ...

そんなに気になるなら、いつでも泣けばいいじゃない ))

気に入っていただけて嬉しいです)。

 
Valeriy Yastremskiy#:

そうすると、原因やパターンの有無についての仮説しか出てきません。原因は一次的なもので、行動は二次的なものです。TAでは、原因の優先順位を忘れてしまい、ランダムに繰り返される行動をパターンとして捉えてしまうことがあるのですが、これは違います。

そうですね、複雑な問題ですね...。

だからこそ、「いろいろな仕掛けがある」のではなく、「答えがある」ために数学に踏み込むことが必要なのです。

 

1) 歴史の中で確立されたパターンが、将来も必ず通用するということを証明する方法はないし、ありえないことは明らかだと思います。

2)過去のデータから未来の決定論的(非ランダム)なパターンを確立する方法が存在すれば、(1)を否定することになる。

クロスバリデーションしかないので、履歴上のパターンの均質性しか立証できない。私たちができるのはパターンを補間することであって、外挿することではありません。うまく補間されたパターンはうまく外挿される、という非常に弱い仮説しかないのです。これは演繹的推論ではなく、単なる帰納的推論であり、類推による推論の一種である。

 
Aleksey Nikolayev#:

1) 歴史の中で確立されたパターンが、将来も必ず通用するということを証明する方法はないし、ありえないことは明らかだと思います。

2)過去のデータから未来のパターンの決定性(非ランダム性)を確立する方法が存在すれば、(1)の否定になる。


では、(1)の自明性とその有効性の論拠は何でしょうか。
理由: