交易中的机器学习:理论、模型、实践和算法交易 - 页 2380

 
Aleksey Vyazmikin:

我误以为是关于专栏的。

但是,我们不能在样本文件上做所有的训练,而在另一个文件上做检查吗?

阿列克谢,你可以做到这一切!!!。

但我不感兴趣。

学习R!这是一门迷人的语言,尤其是对盘子里的东西。
 
mytarmailS:

阿列克谢,一切皆有可能!

但我不感兴趣。

学习R!这是一门迷人的语言,尤其是对盘子里的东西。

谢谢你的帮助。

准确性(Precision)和完整性(Recall)都明显优于CatBoost

我把所有的样本合并成一个文件。

那么,我们还能朝这个方向思考吗?

 
Aleksey Vyazmikin:

谢谢你的帮助。

准确性(Precision)和完整性(Recall)都明显优于CatBoost

我把所有的样本合并成一个文件。

那么,我们还能朝这个方向思考吗?

是在新数据上还是在训练数据上更好?

哪些数字既在那里又在那里?

 
elibrarius:

是在新数据上还是在训练数据上更好?

这两方面的数据是什么?

唉,我错了,准确性更差,而不是更好。



然而,这是一个困难的样本--我不能正确地训练它--明天我将尝试另一个,从CatBoost'a转出的好模型。好吧,在模型的参数中,我不明白,所以也许比较不是很公平。

以这个模型的大召回率为代价,有可能使单独的预测器一般。但我不知道如何把它上传到一个文件里 :)

 
Maxim Dmitrievsky:

这是一个如此矛盾的情况,即使你不小心做对了,也没有人欣赏它。

因为没有评价标准 )

不,我根本不需要赞赏和承认--因为那样他们肯定不会下车)。

相反,我把它当作某种练习或难题,当试图在任何论坛的想法中找到常识时)

在这种特殊情况下,如果使用逻辑 回归进行分类,似乎相当适用。

 

在一个不同的样本上试了一下--附后


X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))
    Reference
Prediction    0    1
         0 1063  860
         1  567 1019
问题是如何获得该模型,以及如何将分类保存到文件中开始。
附加的文件:
xxx.zip  482 kb
 
Aleksey Vyazmikin:

我在另一个样本上试了一下 - 这里


问题是如何获得该模型,以及如何将分类保存到文件中开始。

catbust有相当强的正则化,此外,如果特征是分类的,它们应该在boost中被声明为分类的。

 
Maxim Dmitrievsky:

catbust有一个相当强的正则化,特别是如果特征是分类的,你应该在提升中声明它们是分类的。

对于二进制的,是否是分类的并不重要。

你可以尝试减少正则化 - 好主意 - 谢谢。

到目前为止,Lasso在样本的考试部分显示出更好的结果。

 
Maxim Dmitrievsky:

即在一些周期为5 或价格差异的波形 上标记出交易,看看会发生什么。

训练期间,标志也将被抹平


试着用同样的方法。我在自定义测试器中得到了很好的效果,我在导出模型时遇到了一个问题,我稍后会寻找错误的原因。

 
Aleksey Vyazmikin:

对于二元的来说,它们是否是分类的并不重要。

你可以尝试减少正则化 - 好主意 - 谢谢。

到目前为止,Lasso在 样本的考试部分 表现更好。

也许这只是考试样本中的一个幸运块。然后你对它进行拟合,挑选出具有最佳参数的模型。

我现在总是交叉验证(或用valving-forward验证),没有对一小部分进行拟合,而是一次性对所有数据进行拟合,我想这是最好的训练选择。
医生也建议在从论坛上消失之前使用。