トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 82

 
mytarmailS:

モデルを学習する際、木の数が多ければ多いほど、「0」クラスの学習量が増え、「0」クラスが学習すればするほど、「1」「-1」クラスを吸収し始める(絞り出す)。だから、木が多ければ多いほどお得なのです

何かがおかしい。フォレストは、どんなスキューでもほぼ100%の精度で学習されます。このようなデータでの検証では問題があるかもしれないが、学習データでの結果予測は常に正確である。分類ではなく、回帰を使っていると推測できます。モデルをテストすると、-1;0;1という鮮明なクラスではなく、-1~1という範囲の実際の数値が得られます。そんな歪な回帰では、いいことは何もない。

より良い方法は、trainingDataテーブルがあり、最後の列がターゲット変数で、他の列はすべて予測変数であると言うことです。

trainingData <- data.frame(trainingData) #на  всякий случай сконвертировать таблицу из матрицы в датафрейм, если не было сделано раньше
trainingData[,ncol(trainingData)] <- factor(trainingData[,ncol(trainingData)]) #тип  последней колонки сменить на фактор. Модели в R обычно сразу по этому типу понимают что нужна классификация, и работают чуть иначе чем при регрессии
 
mytarmailS:

然程

書いていることは、あくまで私のやり方に当てはまることです。

私のターゲットは、リバーサルです。

ピボット(1 , -1 , 0)の3つのクラスがあります。

また、クラスの歪度が非常に大きく、"0 "クラスは"-1 "や "1 "の何十倍も大きいこともご存じでしょう。

そして、これはモデルがクラス "0 "で最もよく訓練されることを意味します。なぜなら、クラス "0 "には最も多くの観測値があるからです。そして、モデルの訓練中に、より多くの木が "0 "クラスを訓練します。"0" クラスが良く、強くなると、クラス "1" や "-1" に(吸収 - 圧出)しはじめます。だから、木が多ければ多いほどお得なのです

私にとっては、あなたはすごいことを書いていますよ。

アンバランスなクラスに対して、非常に独創的なアプローチです。

そうすると、この予測変数のリストにはノイズが含まれていないだけでなく、非常に高い予測力があると理解できます。

その場合、どのように実現したのでしょうか。

 
Dr.トレーダー

何かが間違っている。フォレストはほとんど、どんなバイアスでも100%の精度で学習される。検証の際には、そのようなデータに問題があるかもしれないが、フォレストは常にトレーニングデータの結果を正確に予測することができる。分類ではなく、回帰を使っていると推測できます。モデルをテストすると、-1;0;1という鮮明なクラスではなく、-1~1という範囲の実際の数値が得られます。そんな歪な回帰では、いいことは何もない。

例えば、最後の列がターゲット変数で、他の列が予測変数であるtrainingDataテーブルがあるとします。

木に100%なんて、まったくもってナンセンス

すべての予測変数がノイズである場合、この結果を達成することは非常に難しく、3%~5%の誤差が発生します。ノイズは、クロスバリデーションなどのトリックを駆使して、いつも非常に良い結果を出してくれます。

100%の精度が意味するのは、予測変数の中にターゲット変数の複製(それの何らかの修正)があることだけです。つまり、未来を見据えたモデルです。

 
サンサニッチ・フォメンコ


100%の精度が意味するのは、予測変数の中にターゲット変数の複製(それの何らかの修正)があることです。つまり、未来を見据えたモデルです。

これはデータ流出です。もう一度、データを確認する必要があります。
 
アレクセイ・ブルナコフ

この方法のどこが気に入らないのでしょうか?パラメータの調整はどのように行うのですか?

そう、アプローチは素晴らしい、これ以上のものは考えられない、問題は市場そのものにある...。

私が行った実験、相関関係、歴史の中のパターンの探索(SSAではなく、それ以前)、について話したことを思い出してください。

私は現在の状況を取り、過去にそのアナログを検索し、彼らがどのように終わったかを見て、私は状況 "X "を見つけた場合、私は17の秋と3で終わった20のアナログを見つけたとき、だから統計的優位性は明白です(我々は販売しなければならない)、ところで、なぜクロス検証ではありません? ちょうど単一のパターンで、あなたは同意しないのでしょうか。このパターンはうまくいかないことがわかりました。巨大な統計的確率で市場は上昇し、自らの統計に逆 行することがわかりました。

もっと簡単に言うと、昨日イベント「x」があって、その後に落下があり、一昨日もイベント「x」があって、その後に全てが落下して、昨日もイベント「x」の後に落下が あったとすると、今日 イベント「x」があれば全てが成長する、ここでどんなクロス検証が役に立つのでしょう何もない、決して

一番大切なのは、そのプロセスを理解することです。

市場は残酷なビジネスであり、このビジネスを構築した一部の人々は合法的に他の人からお金を取る。 群衆、大多数は常に失うことを義務付けられている、誰もがそれを知っている、誰もがそれについて書いて、誰もそれを隠さない、要するに、それは公理です - お金を失うトレーダーの95%のパターン -市場は、その95%の確率でトレーダーのお金を失うことを大多数と逆に移動 します。

また、群衆はトレードの際に何を使っているのでしょうか?実は、群衆には、取引をさせるものが一つしかないのです。

チャートの目視観察から始まり、ブレイクダウンのパターンを探し、ニューラルネットワークのトレーニングで 終わるような行為は、統計によるトレードに他ならず、まさにマーケットで通用しない統計なのです、私の言っていることがわかりますか?

市場は群衆の取引に逆らって動く ------ 群衆は統計に基づいて行動する ------ あなたがすべきことは、群衆の行動を将来予測し、その逆を行うことだ、予測する唯一の方法は統計だ

))))で始まり、3で終わる :)まあ、それはそれとして、少なくとも私はそれを理解した)

p.s. ここで述べたことはすべて私の個人的な意見であり、誰かに何かを押し付けるつもりはありませんし、議論して証明することもできますが、そんな気分ではありません。

 
Dr.トレーダー

何かが間違っている。フォレストはほとんど、どんなバイアスでも100%の精度で学習される。検証の際には、そのようなデータに問題があるかもしれないが、フォレストは常にトレーニングデータの結果を正確に予測することができる。分類ではなく、回帰を使っていると推測できます。モデルをテストすると、-1;0;1という鮮明なクラスではなく、-1~1という範囲の実際の数値が得られます。このような偏った回帰では、何も良いことはないでしょう。

最後の列がターゲット変数で、他の列が予測変数であるtrainingDataテーブルを持つことが望ましいです。

いや、分類、何か間違ってる...。

qqq

私はこのように、2つのモデル、別々に購入と販売のクラス(1、0)と(-1、0)を持っていました。

醜く見える )諾う

 
mytarmailS:

そう、アプローチは素晴らしい、これ以上のものは考えられない、問題は市場そのものにある...。

私が行った実験、相関関係、歴史の中のパターンの探索(SSAではなく、それ以前)、について話したのを覚えていますか。

私は現在の状況を取り、過去にそのアナログを検索し、彼らがどのように終わったかを見て、私は状況 "X "を見つけた場合、私は17の秋と3で終わった20のアナログを見つけたとき、だから統計的優位性は明白です(我々は販売しなければならない)、ところで、なぜクロス検証ではありません? ちょうど単一のパターンで、あなたは同意しないのでしょうか。このパターンはうまくいかないことがわかりました。巨大な統計的確率で市場は上昇し、自らの統計に逆 行することがわかったのです。

もっと簡単に言うと、昨日イベント「x」があって、その後に落下があり、一昨日もイベント「x」があって、その後に全てが落下して、昨日もイベント「x」の後に落下が あったとすると、今日 イベント「x」があれば全てが成長する、ここでどんなクロス検証が役に立つのでしょう何もない、決して

一番大切なのは、そのプロセスを理解することです。

市場は残酷なビジネスであり、このビジネスを構築した一部の人々は合法的に他の人からお金を取る。 群衆、大多数は常に失うことを義務付けられている、誰もがそれを知っている、誰もがそれについて書いて、誰もそれを隠さない、要するに、それは公理です - お金を失うトレーダーの95%のパターン -市場は、その95%の確率でトレーダーのお金を失うことを大多数と逆に移動 します。

また、群衆はトレードの際に何を使っているのでしょうか?実は、群衆には、取引をさせるものが一つしかないのです。

チャートの目視観察から始まり、ブレイクダウンのパターンを探し、ニューラルネットワークのトレーニングで 終わるような行為は、統計によるトレードに他ならず、まさにマーケットで通用しない統計なのです。

市場は群衆の取引に逆らって動く ------ 群衆は統計に基づいて行動する ------ あなたがすべきことは、群衆の行動を将来予測し、その逆を行うことだ、予測する唯一の方法は統計だ

))))で始まり、3で終わる :)まあそれはそれとして、少なくとも私はそれを理解した)

p.s. 私がここで言ったことはすべて私の意見です、誰も何も押し付けていません、私は議論して証明することができますが、気分ではありません

OK

私にとっては、FXはノイズを含んだ単純な信号です。依存症になったらお金を取る、再教育したらブローカーに取られる。また、人ごみなどについては、私は情報を持っていません。どうしたら満足できるのかわからない。

この実験が終わったら、株価の取り扱いを始めたいですね。そこでリアルなボリュームが出るので、それもプラスになりますね。

 
アレクセイ・ブルナコフ

OKです。

私にとってFXはノイズの入ったバカ信号です。中毒を見つけたら金を取る、再教育したらブローカーに金を取られる。また、人ごみなどについては、私は情報を持っていません。どうしたら満足できるのかわからない。

この実験が終わったら、株価の取り扱いを始めたいですね。本物の引用符を使いたい。

FXでユーロドルを取引する場合、何があなたのFXを動かすのかを理解する必要があります。あなたはCMEのEURUSDで取引する場合、実際の群衆は、実際の取引を移動し、あなたが端末の放送で持っているものは、実際のEURUSDとそれ以上の動きを繰り返すだけの画像です、MT4であなたのトランザクションは、市場に何の影響もありません、誰もインターバンクにあなたの10ドル(比喩的に) 取る、あなたはあなたの証券会社と取引して、それは、むしろそれは、あなたの損失はその純利益なので、あなたに対してトレードしています。
 
アレクセイ・ブルナコフ

この実験を終えたら、今度は証券取引所の相場を取り上げてみたいと思っています。そこには本物のボリュームがあるはずで、それもプラスに働く。

ほとんどリアルマーケットで取引してきた俺にはわかる。
 
mytarmailS:
ボリュームはあまり役に立ちません。ボリュームは通常のボラティリティで置き換えることができます。

OK

ボリュームからインプットフィーチャを作るようにして、あとは様子見です。

理由: