forexFeatures<-forexFeatures1[i:n_rw,1:n_enter+1]
set.seed(1234)
#designTreatmentsC подходит только для классификации с двумя классами
treatmentsC <- designTreatmentsC(dframe = forexFeatures,
varlist=colnames(forexFeatures)[-ncol(forexFeatures)], #названия колонок с предикторами (тут - все кроме последней колонки)
outcomename = colnames(forexFeatures)[ncol(forexFeatures)], #названия колонок с таргетом (тут - последняя колонка)
outcometarget = "1") #текст или цифра одного из классов
#обработка, сортировка результата
treatmensC_scores <- treatmentsC$scoreFrame[order(treatmentsC$scoreFrame$sig),]
treatmensC_scores <- treatmensC_scores[!duplicated(treatmensC_scores$origName),]
treatmensC_scores <- treatmensC_scores[,c("origName","sig")]
treatmensC_scores$is_good <- treatmensC_scores$sig <= 1/nrow(forexFeatures)
treatmensC_scores
Summary of the Random Forest Model
==================================
Number of observations used to build the model: 282752
Missing value imputation is active.
Call:
randomForest(formula = as.factor(arr_Sell) ~ .,
data = crs$dataset[crs$sample, c(crs$input, crs$target)],
ntree = 500, mtry = 5, importance = TRUE, replace = FALSE, na.action = randomForest::na.roughfix)
Type of random forest: classification
Number of trees: 500
No. of variables tried at each split: 5
OOB estimate of error rate: 0.85%
Confusion matrix:
-10class.error
-12143818250.07845075905842589050.002250577
Analysis of the Area Under the Curve (AUC)
==========================================
Call:
roc.default(response = crs$rf$y, predictor = as.numeric(crs$rf$predicted))
Data: as.numeric(crs$rf$predicted) in 23263 controls (crs$rf$y -1) < 259489 cases (crs$rf$y 0).
Area under the curve: 0.959695% CI: 0.9579-0.9614 (DeLong)
Variable Importance
===================
-10 MeanDecreaseAccuracy
arr_iDelta_MN1 138.27133.11140.22
arr_iDelta_H6 125.08121.39133.93
arr_iDelta_H12 123.70122.14133.35
arr_Regresor 128.66115.53127.84
arr_iDelta_W1 139.04113.42127.63
arr_iDelta_Min_D1 116.08109.00118.71
arr_LastBarPeresekD_Up_M15 104.77115.87118.67
arr_LastBarPeresekD_Down_M15 101.57111.98114.99
arr_TimeH 109.29110.21111.94
arr_iDelta_Max_H1 106.04102.77109.00
arr_DonProcVisota 95.92109.61106.40
arr_iDelta_D1 116.6590.42103.11
arr_iDelta_Max_D1 96.3394.41101.86
arr_iDelta_H4 78.4790.8690.15
arr_DonProc_M15 78.2584.5685.65
arr_Den_Nedeli 83.4981.8883.28
arr_DonProc 58.3084.2276.08
arr_iDelta_H3 55.6464.1862.44
arr_RSI_Open_H1 70.0747.2158.58
arr_LastBarPeresekD_Up 49.1659.1956.28
arr_iDelta_Min_H1 47.1260.1955.55
arr_Vektor_Week 53.2352.1254.44
arr_iDelta_H1 41.2048.6346.96
arr_Vektor_Don_M15 46.7940.6445.61
arr_LastBarPeresekD_Down 33.4642.7939.32
arr_Vektor_Day 31.9432.0532.78
arr_Vektor_Don 18.9422.5121.50
arr_BB_Center 19.9121.4621.07
arr_RSI_Open_M1 24.1415.2118.13
arr_BB_Down 18.2213.5415.41
arr_BB_Up 11.7412.8213.13
MeanDecreaseGini
arr_iDelta_MN1 1786.84
arr_iDelta_H6 1257.97
arr_iDelta_H12 1286.82
arr_Regresor 1162.09
arr_iDelta_W1 1611.97
arr_iDelta_Min_D1 1009.56
arr_LastBarPeresekD_Up_M15 990.33
arr_LastBarPeresekD_Down_M15 1051.66
arr_TimeH 1718.65
arr_iDelta_Max_H1 945.35
arr_DonProcVisota 1146.33
arr_iDelta_D1 1179.92
arr_iDelta_Max_D1 1036.35
arr_iDelta_H4 1182.16
arr_DonProc_M15 1102.40
arr_Den_Nedeli 1185.70
arr_DonProc 699.24
arr_iDelta_H3 1163.34
arr_RSI_Open_H1 228.25
arr_LastBarPeresekD_Up 839.31
arr_iDelta_Min_H1 760.00
arr_Vektor_Week 278.21
arr_iDelta_H1 778.78
arr_Vektor_Don_M15 220.85
arr_LastBarPeresekD_Down 731.15
arr_Vektor_Day 155.12
arr_Vektor_Don 215.34
arr_BB_Center 155.38
arr_RSI_Open_M1 99.55
arr_BB_Down 82.22
arr_BB_Up 56.65Time taken: 1.26 hours
Rattle timestamp: 2018-05-1404:12:32 S_V_A
======================================================================
关于测试数据(15%)。
Error matrix for the Random Forest model on Pred_023.csv [test] (counts):
Predicted
Actual -10 Error
-145024098.30125555550.2
Error matrix for the Random Forest model on Pred_023.csv [test] (proportions):
Predicted
Actual -10 Error
-17.40.78.300.291.70.2
Overall error: 0.9%, Averaged class error: 4.25%
Rattle timestamp: 2018-05-1412:48:08 S_V_A
Vtreat.R.
谢谢你。
是R中的东西吗?
在Rattle中尝试了我的装备--我选择了在所有网络上学习,但在思考了很久之后终于出现了错误
在周期中))。
但所有的组合和个人电脑将被计算在二十四小时内......
10个预测器,组合2^10=1024。
20个预测因子,=2^20=1048576
这就是你需要训练一个森林/nS的次数。
我不着急...我可以把它扔在一个单独的电脑上,让它自己去算。
但你有什么值得的软件呢?
Vtreat.R
我怎样才能运行它呢?我调用vtrear(),它却皱起眉头。
有照片吗? 不要再说什么了,你也不需要什么好的照片,笑一笑 :)
我甚至不知道...医生还给出了MKUL的所有代码,因此该模型可以立即在MT中使用。我唯一不喜欢elmnn的地方是,无论我训练多少次,它在OOS上总是给出同样的结果。因此,无论我训练多少次,它总是给出同样的结果:-)但工作才刚刚开始,我需要更多的测试来得到一个有信心的判决......
我怎样才能运行它呢?我调用vtrear(),它却皱起眉头。
总之,事情是这样的。但这是对只有0和1的目标分类的评估。对于回归来说,这是很不同的...
如何正确解释随机森林 模型的结果--它是好是坏?
关于测试数据(15%)。
这就是我为什么不能把它分成两个文件的原因,没有人能够解释清楚 :(
我怎样才能运行它呢?我调用vtrear(),它却皱起眉头。
该包被称为不同的,它需要。
library(vtreat)
包里有几个函数,是不是懒得打开文档了?
就这些了。但这是对目标分类的估计,其中只有0和1。对于回归来说,这是不同的...
所以它没有一个图形化的外壳?你如何调用它?
包的叫法不同,应该是这样的。
library(vtreat)
包里有几个函数,是不是懒得打开文档了?
在哪里可以得到这些文件?
所以它没有图形化的外壳?你如何调用shell?
不,但我写了一个脚本,把所有的东西都上传到excel,然后我在那里施展我的魔法。我不能给你剧本,因为这是我的心血结晶....。嗯,我在那里做了一件很酷的原创事情。我不知道你是如何估计预测因素的,但结果是一个非常可读的表格,供进一步分析...像这样...