トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2018.05.24 14:01 #9511

Dr.トレーダー：

最後のファイルでは、ツリーでこのようにしました。

2016年、トレーニング

	y_pred
y_true	-1	0	1
-1	13392	38844	4472
0	10803	76714	6029
1	7413	37678	7415

2015年、テスト。

	y_pred
y_true	-1	0	1
-1	9552	39262	5429
0	11495	72131	7509
1	8581	40377	6835

を予測する場合：-1が1よりわずかに多く発生することになる。しかし、0が一番多いでしょうし、おそらくすべて赤字に終わるでしょう。クラス "1 "の場合も同様です。

トラブルは、ツリーで出てきた。Geneticsはツリーパラメータcp = 0を選択し、これによりツリーに大量の枝を許可した。残念なことに、このパラメータをゼロ以外の小さな値に制限すべきでした。

従来通り、図を確率で表すことは可能でしょうか？もしかして、テストデータにはもっと大きな分岐があるのでは？

Dr.トレーダー：

0」に分類できるほどの予測因子がデータにはないと思うのですが。例えば、平面度などの指標が必要です。

一般的にはツリーとの相性が悪い。SanSanychの木材の方がずっといい。

モデル設定が悪いと、結果的にオーバートレーニングになる。

2016年は1ファイルだけ取ったそうで（ちなみに2015年は予測値が1少なかったので修正しました、再ダウンロードできます）、今年2016年は上昇傾向だったそうですよ。

このツリーは上位TFのデータにしがみついていて、基本的に統計が少ないので、世界的な動きのベクトルが変わったり（2015年アップ、2016年ダウン）、トータルフラット（2017年）になったりすると、歴史にカベができるんですよ。

フラットについては、フラットからのエントリーとリバーサルのターゲットがありますが、何らかの方法で分けてみることは可能でしょうか。

平坦部はLevlタイプの予測因子によってよく識別されるが、唯一の問題は、少なくとも1つのTFでは、ツリーがそれらを結びつけることができないことである。

Dr. Trader 2018.05.24 14:09 #9512

儲かるロボットを作りましたね :)

ロングに入る - "1 "を予測したときのみ（青色）、そのうちの90％以上が利益（緑色）となる。
ショートする - "-1"（赤）と予測したときのみ、そのうちの90％以上が利益（緑）になる。
0」の予測は、新しいポジションを持たず、より良いタイミングを待つという意味なので、このクラスの予測の前に実際の精度がどうであるかは全く問題ではありません。

しかし、例えば2015年のファイルでforestを学習させ、2016年のファイルで確認する方が良い。2015年では1列だけ欠けていますが、2016年からも外すべきで、ガラケーが混同されることはありません。

Dr. Trader 2018.05.24 14:14 #9513

アレクセイ・ヴャジミキン

この図は、これまでと同じように確率で表すことができるのでしょうか？

いいえ、これは別のツリー学習モードで、2クラスのみに適しています。あるいは回帰のために。

Aleksey Vyazmikin 2018.05.24 14:17 #9514

SanSanych Fomenko：

再教育も何も、彼は目標とする変数に関連する予測因子を一つも持っていない、すべてノイズだ。そして、ガラガラに座り込んで、ノイズをチェックするどころか、ここにゴミの入ったファイルを投稿しているのです。

そう、ターゲットは予測因子との明確な関連性はなく、特定の時点で市場に参入した場合の経済的な結果を示しているに過ぎないのです。

例えば、МА交差点でエントリーする場合、結果（1または-1）を定義し、MA交差の事実に関する情報を予測変数に与えるなど、エントリーの論理を予測変数のいくつかの指標に関連付けると、より良い結果になると思いますか？

Dr. Trader 2018.05.24 14:37 #9515

Aleksey Vyazmikin：

ツリーは上位TFのデータにしがみついていますが、それに関する統計が十分ではなく、そのため、グローバルな動きのベクトルが変わるとき（2015年上向き、2016年下向き）や、トータルフラット（2017年）になると、履歴にカズミが入ることがあります。

フラットについては、フラットからのエントリーとリバーサルのターゲットがありますが、何らかの方法で分けてみることは可能でしょうか。

Levlのような予測因子によってフラットはよく識別されますが、唯一の問題は、少なくとも1つのTFで、ツリーがそれらを結びつけることができないことです。

すでにさまざまなフラットな指標があるのに、ツリーではそれらをつなげることができないのは明らかです。それならそれで、木の可能性の限界なのでしょう。

昨日は、ほぼ正確な結果が得られましたが、案件への応募数は少なかったです。今日届いたものは、あまり良くはない。何かが間違っていたようで、どのような設定が修正される可能性があるか、よく考えてみます。

СанСаныч Фоменко 2018.05.24 14:41 #9516

Aleksey Vyazmikin：

そうですね、ターゲットは予測因子と明確にリンクしているわけではなく、ある時点で市場に参入した場合の金銭的な結果を示しているに過ぎません。

入力のロジックが、いくつかの予測変数の指標と連動している場合、つまり、MAクロスで入力すると、結果（1または-1）を決定し、MAクロスの事実に関する情報を予測変数に与える場合、結果はより良くなると思いますか？

そして、これが私の意見です。「インプットのゴミはアウトプットのゴミ！」です。統計学の教科書の最初の行にある言葉だ。

СанСаныч Фоменко 2018.05.24 14:42 #9517

ドクタートレーダー

儲かるロボットを作りましたね :)

ロングをするのは「1」を予測したときだけで、そのうちの90％以上が利益になる（緑色）。
ショートする - 「-1」（赤色）を予測したときのみ、そのうちの90％以上が利益（緑色）となる。
予測「0」は、新規ポジションを建てず、より良いタイミングを待つという意味なので、このクラスの予測で実際の精度がどうであるかはあまり重要ではありません。

しかし、例えば2015年のファイルでforestを学習させ、2016年のファイルで確認する方が良い。2015年では1列だけ抜けていますが、2016年からも抜くべきで、そうすればガラケーも混乱しないでしょう。

私は何も構築していません。用意されたファイルからrandomForestを構築したのですが、2つのファイルに分けるのが面倒くさかったのです。アレクセイは私のためにそれを行い、私の「成果」を完全にカバーするキラー結果を示してくれました。

Aleksey Vyazmikin 2018.05.24 16:30 #9518

Dr.トレーダー

なるほど、すでにいろいろなフラットな指標があるのですが、ツリーではそれらをどうつなげればいいのかがわからないのです。それならそれで、このツリーの能力の限界なのでしょう。

昨日は、精度の面ではほぼ同じ結果でしたが、案件への参入数は少なかったです。今日届いたものは、あまり良くはない。何かが間違っている、どのような設定が修正される可能性があるか検討します。

そうですね、助けられる木、つまり予測因子間の確率的な関係を示し、意思決定のための確率的な比較のための条件を設定することが必要だと思います。

ここで、世界的なトレンドがアップダウンしていることをツリーに説明すると？もちろん、同じツールを使って、チャネルを描いたり、パーセンテージを作ったり、つまりトレンドのベクトルがどこに向いているかを明確に示すことはできますが、ツリーはこの予測因子を単に無視するだけかもしれませんし、私の考えでは、全体のトレンドベクトルに従ってグループ全体を少なくとも2つに分割すべきです。

どうでしょう、シチュエーションのサンプルを調整（分割）してトレーニングし、Expert Advisorで同じグローバルトレンドを強制的に識別し、ベクトルによってどちらかのツリーに耳を傾けるのがいいのかもしれませんね。

Aleksey Vyazmikin 2018.05.24 16:34 #9519

サンサニッチ・フォメンコ

このことと、私の意見「ゴミを入れ、ゴミを出す！」はどう関係があるのでしょうか？統計学の教科書の最初の一行である。

入力は実際にはイベントの結果確率のセットであり、これらの確率は予測因子によって影響を受けます。クリア入力と、入力に信号のないバリアントをすべて削除することを考えよう。参加者からのフィードバックはまだありませんが、異なる入力ストラテジーを使用する場合、予測変数の中で入力を明示的にマークすべきでしょうか？

Aleksey Vyazmikin 2018.05.24 16:37 #9520

エントリーポイントを探すのは当然ですが、フラットなところを探すようにしたほうがいいのでは？

もしかしたら、ヒストリーのフラットを検出するためのインジケーターやスクリプトをお持ちの方がいらっしゃるかもしれませんね。

100の範囲で回帰チャネルをとり、バーごとにずらし、傾きがXより大きい/小さい場合、チャネルで記述される領域はフラットとみなしてもよいのではないかと思います。いかがでしょうか？

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 952