交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2021.03.31 19:11 #23791

Aleksey Vyazmikin:

我误以为是关于专栏的。

但是，我们不能在样本文件上做所有的训练，而在另一个文件上做检查吗？

阿列克谢，你可以做到这一切！！！。

但我不感兴趣。

学习R！这是一门迷人的语言，尤其是对盘子里的东西。

Aleksey Vyazmikin 2021.03.31 21:56 #23792

mytarmailS:

阿列克谢，一切皆有可能!

但我不感兴趣。

学习R！这是一门迷人的语言，尤其是对盘子里的东西。

谢谢你的帮助。

准确性（Precision）和完整性（Recall）都明显优于CatBoost。

我把所有的样本合并成一个文件。

那么，我们还能朝这个方向思考吗？

Aleksei Kuznetsov 2021.03.31 22:17 #23793

Aleksey Vyazmikin:

谢谢你的帮助。

准确性（Precision）和完整性（Recall）都明显优于CatBoost。

我把所有的样本合并成一个文件。

那么，我们还能朝这个方向思考吗？

是在新数据上还是在训练数据上更好？

哪些数字既在那里又在那里？

Aleksey Vyazmikin 2021.03.31 23:28 #23794

elibrarius:

是在新数据上还是在训练数据上更好？

这两方面的数据是什么？

唉，我错了，准确性更差，而不是更好。

然而，这是一个困难的样本--我不能正确地训练它--明天我将尝试另一个，从CatBoost'a转出的好模型。好吧，在模型的参数中，我不明白，所以也许比较不是很公平。

以这个模型的大召回率为代价，有可能使单独的预测器一般。但我不知道如何把它上传到一个文件里 :)

Aleksey Nikolayev 2021.04.01 07:22 #23795

Maxim Dmitrievsky:

这是一个如此矛盾的情况，即使你不小心做对了，也没有人欣赏它。

因为没有评价标准 )

不，我根本不需要赞赏和承认--因为那样他们肯定不会下车）。

相反，我把它当作某种练习或难题，当试图在任何论坛的想法中找到常识时)

在这种特殊情况下，如果使用逻辑回归进行分类，似乎相当适用。

Aleksey Vyazmikin 2021.04.01 23:07 #23796

在一个不同的样本上试了一下--附后

X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))

    Reference
Prediction    0    1
         0 1063  860
         1  567 1019

问题是如何获得该模型，以及如何将分类保存到文件中开始。

附加的文件：

xxx.zip 482 kb

[删除] 2021.04.02 02:42 #23797

Aleksey Vyazmikin:

我在另一个样本上试了一下 - 这里

问题是如何获得该模型，以及如何将分类保存到文件中开始。

catbust有相当强的正则化，此外，如果特征是分类的，它们应该在boost中被声明为分类的。

Aleksey Vyazmikin 2021.04.02 03:58 #23798

Maxim Dmitrievsky:

catbust有一个相当强的正则化，特别是如果特征是分类的，你应该在提升中声明它们是分类的。

对于二进制的，是否是分类的并不重要。

你可以尝试减少正则化 - 好主意 - 谢谢。

到目前为止，Lasso在样本的考试部分显示出更好的结果。

[删除] 2021.04.02 04:13 #23799

Maxim Dmitrievsky:

即在一些周期为5 或价格差异的波形上标记出交易，看看会发生什么。

训练期间，标志也将被抹平

试着用同样的方法。我在自定义测试器中得到了很好的效果，我在导出模型时遇到了一个问题，我稍后会寻找错误的原因。

Aleksei Kuznetsov 2021.04.02 10:48 #23800

Aleksey Vyazmikin:

对于二元的来说，它们是否是分类的并不重要。

你可以尝试减少正则化 - 好主意 - 谢谢。

到目前为止，Lasso在样本的考试部分表现更好。

也许这只是考试样本中的一个幸运块。然后你对它进行拟合，挑选出具有最佳参数的模型。

我现在总是交叉验证（或用valving-forward验证），没有对一小部分进行拟合，而是一次性对所有数据进行拟合，我想这是最好的训练选择。
医生也建议在从论坛上消失之前使用。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2380