トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 111

 
ミハイル・マルキュカイツ
そして、5年後の分相場を抑制しようとし続けるのか?この71回の観察、何なら5分足で2週間も取引している......。そして買うだけ。だから、頑張れ...。それとも脱力系?
何言ってんだこいつというのはおかしい。
 
Dr.Trader(ドクタートレーダー

先ほども言ったように、この指標は役に立たない。

データをランダムに2等分し、最初の部分だけでモデルを学習させ、一度に両方でテストする。汎化率75%とは、ファイル内の全例に対して、最終的に75%を正しく予測するモデルであることを意味します。
モデルが75%に達するにはいくつかの方法があります。
1) モデルはトレーニングデータで100%の精度でトレーニングされ、ファイルの2番目の部分で新しいデータに失敗し、そこで50%を得る(コインをはじくのと同じです)。平均するとちょうど75%になる。これは非常にまずい展開で、トレードでもまずいことになりそうです。
2) 学習データで75%の精度に学習させたモデルは、テストデータでも同じ75%を示し、やはり平均75%であった。その中で、これは最高のケースですが、何かを得るチャンスがあります。
3) この2つの間の任意の中間的な選択肢

あなたの選択肢は、おそらく最初の方に近いと思います。このような結果で取引するには、非常に幸運である必要があります。私は、あなたがメインシグナルとして機能するインジケータ(シーケント、または何か)のおかげで、あなたの預金を失っていないと仮定します。この1つの指標をベースにしたExpert Advisorは、指標+jPredictionと同じくらい良い結果を出すと思います。

汎化力の計算方法は?レシェトフも知っている。 前に言っていたように、テストデータだけで計算しているのだと思うのだが......。クラシックシーケンサが使えるなら、プレディクターを使わないのですが、残念ながら......。というのは、何にもまして消耗が激しい。一方、クラシファイアを追加すると、かなり改善されます。もう一度書きますが、71回の観測は、5分間に2週間分のTSの仕事です。この時間軸では、かなり許容範囲の広い間隔です。半年以上の間、グリッドをいじるのは慣れていない。私は2週間トレーニングして、1日稼いだらおしまい。そうそう、毎日モデルのトレーニングをしているんですよ。午前中良い点は、最適化時間がVERYリーズナブルになったこと......でしょうか。
 
mytarmailS:
何を言っているんだ...。そんなのくだらないよ。
さて、何がわからないのでしょうか?それとも、あなたの理解を超えているのでしょうか?
 
ミハイル・マルキュカイツ
さて、何がわからないのでしょうか?それとも、あなたの理解を超えているのでしょうか?

総容量の測り方を聞いているのに、長年の歴史がどうのこうのとか、意味不明なことを言い出す...。

一般的な能力は一方的に測れないのに、どうやって測ればいいのか、jPredictionの 数字を調べることしかできず、それがどこからどう来たのか微塵もわからないから、具体的な質問をされると、何年間の歴史などというくだらないことを言い始める、もうやめてくれ...。お願い...

 
mytarmailS:

総容量はどうやって測るのかって聞いたら、長年の歴史がどうのこうのとか、意味不明なことを言うんだもん...。

一般的な能力は一方的に測れないのに、どうやって測ればいいのか、jPredictionの 数字を調べることしかできず、それがどこからどう来たのか微塵もわからないから、具体的な質問をされると、何年間の歴史などというくだらないことを言い始める、もうやめてくれ...。をお願いします。

私がレシェトフの予測因子を使っていること、彼が一般化可能性をどのように測定しているかは、すでに説明したかもしれませんが、これらはユーリーへの質問です。彼に聞いてみてください。数式は教えてくれたし、大まかには覚えているのですが、なぜ私に聞くのかが理解できません。私は彼のプログラムのユーザーであり、それ以上ではないのですが......。
 
ミハイル・マルキュカイツ
テストデータのみでの計算だと思います

だとしたら、うれしいですね、ずっといいんです。

いずれにせよ、fronttestの方がはるかに良い結果を示しています。ファイルを2つに分割し(シャッフルせず、順番に)、最初の部分は50行、2番目の部分は19行としました。

結局、2つ目のファイルでは、JPredictionは9件しか答えを出せませんでした。5件正解、4件不正解で、精度は50%程度と、良いところはありません。

ファイル:
 
Dr.トレーダー

だとしたら、うれしいですね、ずっといいんです。

いずれにせよ、fronttestの方がはるかに良い結果を示しています。私はあなたのファイルを2つのパートに分けました(シャッフルはせず、順番に)。

結局、2つ目のファイルでは、JPredictionは9件しか答えを出せませんでした。5件が正解、4件が不正解で、精度は50%程度と、まずまずの結果でした。

同意見です。入力データの工夫が必要......。
 
Dr.Trader(ドクタートレーダー

だとしたら、うれしいですね、ずっといいんです。

いずれにせよ、fronttestの方がはるかに良い結果を示しています。ファイルを2つのパートに分割し(シャッフルせず、順番に)、最初のパートは50行、2番目のパートは19行です。したがって、jPredictionは2番目のファイルの例にアクセスできず、それはモデルにとって本当に新しいデータとなります。

その結果、2つ目のファイルでは、JPredictionは9件しか回答していません。5件正解、4件不正解で、精度は50%程度、良いところなしです。

19歳、50歳、どっちが多いかな。少なくとも数百行のデータセット・データベースから、任意の例を挙げてみよう。

私自身は、パラメータを拾って データを分解したいので、このソフトは向いていない。でも、エントリーレベルとしては面白いと思うんです。

 

レシェトフ!

私の申し出はまだ有効です。

 
mytarmailS:

こんにちは、Yuri !

逐次探索に関する質問)があります.

例えば、10個の予測変数があるとします。

1, 2, 3,4, 5, 6, 7, 8, 9, 10

緑色の グループは,最高の一般化能力を示した予測変数のグループであり,このグループに他の予測変数N+1 が追加される.

赤の グループは、緑のグループより 少し悪いグループであり テストに参加することはありません。

質問:他のN+1個の予測因子で1つずつ試行した後、最終的に赤のグループがより大きな一般化能力を持つことが判明した場合、これもかなり現実的ですか、それとも私は何かを誤解していますか?明確にしてください。

データやアルゴリズムを見ずに曖昧さのない答えを得たいなら、サンサンチ・フォメンコの ところに行った方がいい。賢い顔をした彼は、曖昧さに関係なく、どんなテーマでも「的確で価値のある」指示を出して諭してくれるからだ。

もし、より正確な答えが欲しいのであれば、A/Bテストをしてみてください。つまり、一方では緑に赤と黒をくっつけ、もう一方では黒だけをくっつけてみてください。実験結果から最も一般化しやすいのは、どの選択肢であっても、あなたの課題にとって最も正しいものです。

要は、体験の結果が常に真実の基準であるということです。

例えば、今日はjPredictionのデータセンタリングをテストしていました。結果は、サンプルによって、散々な結果になったり、少し良くなったりしました。バックプロパゲーショングリッドの場合は、センタリングすることで顕著な改善が見られますが。リニア正規化から離れなければならなかった。

そして、A/Bテストをせずに、経験ではなく、機械学習のちょっとした本や講義から「すぐに使える知識」を取り入れたり、知ったかぶりをしたりすると、センタリングは線形正規化よりも「良い」はずだという答えが返ってきます。ただし、経験上、すべてのアルゴリズムに一義的に当てはまるわけではありません。

そういうパイなんです。