トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

mytarmailS 2021.03.31 17:11 #23791

Aleksey Vyazmikin：

コラムのことだと勘違いしていました。

それにしても、学習はすべてサンプルファイルで行い、チェックは別のファイルで行うことはできないのでしょうか？

アレクセイ、君ならできる!!!!

でも、興味がないんです。

Rを学ぼう！魅力的な言語であり、特にトレーニ...

Aleksey Vyazmikin 2021.03.31 19:56 #23792

mytarmailS:

アレクセイ、何でもできるんだ！」。

でも、興味がないんです。

Rを学ぼう！魅力的な言語であり、特にトレーニ...

ありがとうございました。

精度（Precision）と完全性（Recall）は、CatBoostよりも大幅に向上することが判明した。

全サンプルを1つのファイルに統合してみました。

では、まだこの方向で考えてもいいのでしょうか？

Forester 2021.03.31 20:17 #23793

Aleksey Vyazmikin：

よろしくお願いします。

精度（Precision）と完全性（Recall）はCatBoostより大幅に向上している。

すべてのサンプルを1つのファイルに統合しました。

では、まだこの方向で考えてもいいのでしょうか？

新しいデータとトレーニングデータのどちらが良いのか？

あそこもあそこも、どんな数字があるのでしょうか？

Aleksey Vyazmikin 2021.03.31 21:28 #23794

elibrarius:

新しいデータとトレーニングデータのどちらが良いのか？

両者の数値は？

残念なことに、私は間違っていました。精度は良くなるどころか、悪くなっています。

明日、CatBoost'aの良いモデルが出たところで、別のサンプルに挑戦してみます。まあ、そして、モデルのパラメータで私は理解していないので、多分比較は非常に、公正ではありません。

このモデルから大きなRecallを犠牲にして、一般に別の予測器を作ることが可能である。しかし、それをファイルにアップロードする方法がわからない :)

Aleksey Nikolayev 2021.04.01 05:22 #23795

マキシム・ドミトリエフスキー：

偶然うまくいっても、誰も評価してくれないという、そんな逆説的な状況です

評価基準がないため )

いや、感謝や謝意はまったく必要ない--そうすると、確かに降りないから）。

むしろ、フォーラムのアイデアに常識を見出そうとするとき、ある種の運動やパズルのように受け止めています)

この場合、分類にロジスティック回帰を用いれば、かなり応用が利きそうです。

Aleksey Vyazmikin 2021.04.01 21:07 #23796

別のサンプルで試してみました - 添付ファイル

X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))

    Reference
Prediction    0    1
         0 1063  860
         1  567 1019

問題は、モデルの取得方法と、そもそも分類をファイルに保存する方法です。

ファイル:

xxx.zip 482 kb

Maxim Dmitrievsky 2021.04.02 00:42 #23797

Aleksey Vyazmikin：

別のサンプルで試してみました - こちら

問題は、モデルの取得方法と、そもそも分類をファイルに保存する方法です。

catbustはかなり強い正則化を持っており、さらに特徴がカテゴリカルである場合は、boostでそのように宣言する必要があります。

Aleksey Vyazmikin 2021.04.02 01:58 #23798

マキシム・ドミトリエフスキー：

catbust はかなり強い正則化を持ちます。特に、特徴量がカテゴリカルである場合は、boost でそのように宣言する必要があります。

二値的なものについては、カテゴリカルかどうかは関係ない。

正則化を減らしてみるのもいいかもしれませんね。いいアイデアです。ありがとうございます。

これまでのところ、Lassoはサンプルの試験的な部分でより良い結果を示しています。

Maxim Dmitrievsky 2021.04.02 02:13 #23799

マキシム・ドミトリエフスキー：

I.e.周期5 または価格差のある波形でトレードをマークアウトし、何が起こるか見る。

また、トレーニングの際にはサインも滑らかになります。

を同じように試してみてください。カスタムテスターではうまくいったのですが、モデルをエクスポートするときに問題が発生しましたので、後でエラーを探します。

Forester 2021.04.02 08:48 #23800

Aleksey Vyazmikin：

二値的なものについては、カテゴリカルであるかどうかは問題ではない。

正則化を減らしてみるのもいいかもしれませんね。いいアイデアです。ありがとうございます。

これまでのところ、サンプルの試験部分では、Lassoの方が良い結果を出しています。

もしかしたら、試験サンプルのラッキーな塊かもしれません。そして、それに最適なパラメータを持つモデルを選んで、フィットを行うのです。

今は必ずクロスバリデーション（またはvalving-forwardで検証）をしています。小さな部分へのフィッティングはなく、全データを一度にフィッティングする、これがベストな学習方法だと思っています。
ドクも、フォーラムから消える前に使うようにとアドバイスしていました。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2380