トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2380

 
Aleksey Vyazmikin:

コラムのことだと勘違いしていました。

それにしても、学習はすべてサンプルファイルで行い、チェックは別のファイルで行うことはできないのでしょうか?

アレクセイ、君ならできる!!!!

でも、興味がないんです。

Rを学ぼう!魅力的な言語であり、特にトレーニ...
 
mytarmailS:

アレクセイ、何でもできるんだ!」。

でも、興味がないんです。

Rを学ぼう!魅力的な言語であり、特にトレーニ...

ありがとうございました。

精度(Precision)と完全性(Recall)は、CatBoostよりも 大幅に向上することが判明した。

全サンプルを1つのファイルに統合してみました。

では、まだこの方向で考えてもいいのでしょうか?

 
Aleksey Vyazmikin:

よろしくお願いします。

精度(Precision)と完全性(Recall)はCatBoostより 大幅に向上している。

すべてのサンプルを1つのファイルに統合しました。

では、まだこの方向で考えてもいいのでしょうか?

新しいデータとトレーニングデータのどちらが良いのか?

あそこもあそこも、どんな数字があるのでしょうか?

 
elibrarius:

新しいデータとトレーニングデータのどちらが良いのか?

両者の数値は?

残念なことに、私は間違っていました。精度は良くなるどころか、悪くなっています。



明日、CatBoost'aの良いモデルが出たところで、別のサンプルに挑戦してみます。まあ、そして、モデルのパラメータで私は理解していないので、多分比較は非常に、公正ではありません。

このモデルから大きなRecallを犠牲にして、一般に別の予測器を作ることが可能である。しかし、それをファイルにアップロードする方法がわからない :)

 
マキシム・ドミトリエフスキー

偶然うまくいっても、誰も評価してくれないという、そんな逆説的な状況です

評価基準がないため )

いや、感謝や謝意はまったく必要ない--そうすると、確かに降りないから)。

むしろ、フォーラムのアイデアに常識を見出そうとするとき、ある種の運動やパズルのように受け止めています)

この場合、分類にロジスティック 回帰を用いれば、かなり応用が利きそうです。

 

別のサンプルで試してみました - 添付ファイル


X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))
    Reference
Prediction    0    1
         0 1063  860
         1  567 1019
問題は、モデルの取得方法と、そもそも分類をファイルに保存する方法です。
ファイル:
xxx.zip  482 kb
 
Aleksey Vyazmikin:

別のサンプルで試してみました - こちら


問題は、モデルの取得方法と、そもそも分類をファイルに保存する方法です。

catbustはかなり強い正則化を持っており、さらに特徴がカテゴリカルである場合は、boostでそのように宣言する必要があります。

 
マキシム・ドミトリエフスキー

catbust はかなり強い正則化を持ちます。特に、特徴量がカテゴリカルである場合は、boost でそのように宣言する必要があります。

二値的なものについては、カテゴリカルかどうかは関係ない。

正則化を減らしてみるのもいいかもしれませんね。いいアイデアです。ありがとうございます。

これまでのところ、Lassoはサンプルの試験的な部分でより良い結果を示しています。

 
マキシム・ドミトリエフスキー

I.e.周期5 または価格差のある波形で トレードをマークアウトし、何が起こるか見る。

また、トレーニングの際にはサインも滑らかになります。


を同じように試してみてください。カスタムテスターではうまくいったのですが、モデルをエクスポートするときに問題が発生しましたので、後でエラーを探します。

 
Aleksey Vyazmikin:

二値的なものについては、カテゴリカルであるかどうかは問題ではない。

正則化を減らしてみるのもいいかもしれませんね。いいアイデアです。ありがとうございます。

これまでのところ、 サンプルの試験 部分では、Lassoの方が良い結果を出しています。

もしかしたら、試験サンプルのラッキーな塊かもしれません。そして、それに最適なパラメータを持つモデルを選んで、フィットを行うのです。

今は必ずクロスバリデーション(またはvalving-forwardで検証)をしています。小さな部分へのフィッティングはなく、全データを一度にフィッティングする、これがベストな学習方法だと思っています。
ドクも、フォーラムから消える前に使うようにとアドバイスしていました。

理由: