forexFeatures<-forexFeatures1[i:n_rw,1:n_enter+1]
set.seed(1234)
#designTreatmentsC подходит только для классификации с двумя классами
treatmentsC <- designTreatmentsC(dframe = forexFeatures,
varlist=colnames(forexFeatures)[-ncol(forexFeatures)], #названия колонок с предикторами (тут - все кроме последней колонки)
outcomename = colnames(forexFeatures)[ncol(forexFeatures)], #названия колонок с таргетом (тут - последняя колонка)
outcometarget = "1") #текст или цифра одного из классов
#обработка, сортировка результата
treatmensC_scores <- treatmentsC$scoreFrame[order(treatmentsC$scoreFrame$sig),]
treatmensC_scores <- treatmensC_scores[!duplicated(treatmensC_scores$origName),]
treatmensC_scores <- treatmensC_scores[,c("origName","sig")]
treatmensC_scores$is_good <- treatmensC_scores$sig <= 1/nrow(forexFeatures)
treatmensC_scores
Summary of the Random Forest Model
==================================
Number of observations used to build the model: 282752
Missing value imputation is active.
Call:
randomForest(formula = as.factor(arr_Sell) ~ .,
data = crs$dataset[crs$sample, c(crs$input, crs$target)],
ntree = 500, mtry = 5, importance = TRUE, replace = FALSE, na.action = randomForest::na.roughfix)
Type of random forest: classification
Number of trees: 500
No. of variables tried at each split: 5
OOB estimate of error rate: 0.85%
Confusion matrix:
-10class.error
-12143818250.07845075905842589050.002250577
Analysis of the Area Under the Curve (AUC)
==========================================
Call:
roc.default(response = crs$rf$y, predictor = as.numeric(crs$rf$predicted))
Data: as.numeric(crs$rf$predicted) in 23263 controls (crs$rf$y -1) < 259489 cases (crs$rf$y 0).
Area under the curve: 0.959695% CI: 0.9579-0.9614 (DeLong)
Variable Importance
===================
-10 MeanDecreaseAccuracy
arr_iDelta_MN1 138.27133.11140.22
arr_iDelta_H6 125.08121.39133.93
arr_iDelta_H12 123.70122.14133.35
arr_Regresor 128.66115.53127.84
arr_iDelta_W1 139.04113.42127.63
arr_iDelta_Min_D1 116.08109.00118.71
arr_LastBarPeresekD_Up_M15 104.77115.87118.67
arr_LastBarPeresekD_Down_M15 101.57111.98114.99
arr_TimeH 109.29110.21111.94
arr_iDelta_Max_H1 106.04102.77109.00
arr_DonProcVisota 95.92109.61106.40
arr_iDelta_D1 116.6590.42103.11
arr_iDelta_Max_D1 96.3394.41101.86
arr_iDelta_H4 78.4790.8690.15
arr_DonProc_M15 78.2584.5685.65
arr_Den_Nedeli 83.4981.8883.28
arr_DonProc 58.3084.2276.08
arr_iDelta_H3 55.6464.1862.44
arr_RSI_Open_H1 70.0747.2158.58
arr_LastBarPeresekD_Up 49.1659.1956.28
arr_iDelta_Min_H1 47.1260.1955.55
arr_Vektor_Week 53.2352.1254.44
arr_iDelta_H1 41.2048.6346.96
arr_Vektor_Don_M15 46.7940.6445.61
arr_LastBarPeresekD_Down 33.4642.7939.32
arr_Vektor_Day 31.9432.0532.78
arr_Vektor_Don 18.9422.5121.50
arr_BB_Center 19.9121.4621.07
arr_RSI_Open_M1 24.1415.2118.13
arr_BB_Down 18.2213.5415.41
arr_BB_Up 11.7412.8213.13
MeanDecreaseGini
arr_iDelta_MN1 1786.84
arr_iDelta_H6 1257.97
arr_iDelta_H12 1286.82
arr_Regresor 1162.09
arr_iDelta_W1 1611.97
arr_iDelta_Min_D1 1009.56
arr_LastBarPeresekD_Up_M15 990.33
arr_LastBarPeresekD_Down_M15 1051.66
arr_TimeH 1718.65
arr_iDelta_Max_H1 945.35
arr_DonProcVisota 1146.33
arr_iDelta_D1 1179.92
arr_iDelta_Max_D1 1036.35
arr_iDelta_H4 1182.16
arr_DonProc_M15 1102.40
arr_Den_Nedeli 1185.70
arr_DonProc 699.24
arr_iDelta_H3 1163.34
arr_RSI_Open_H1 228.25
arr_LastBarPeresekD_Up 839.31
arr_iDelta_Min_H1 760.00
arr_Vektor_Week 278.21
arr_iDelta_H1 778.78
arr_Vektor_Don_M15 220.85
arr_LastBarPeresekD_Down 731.15
arr_Vektor_Day 155.12
arr_Vektor_Don 215.34
arr_BB_Center 155.38
arr_RSI_Open_M1 99.55
arr_BB_Down 82.22
arr_BB_Up 56.65Time taken: 1.26 hours
Rattle timestamp: 2018-05-1404:12:32 S_V_A
======================================================================
テストデータについて (15%)
Error matrix for the Random Forest model on Pred_023.csv [test] (counts):
Predicted
Actual -10 Error
-145024098.30125555550.2
Error matrix for the Random Forest model on Pred_023.csv [test] (proportions):
Predicted
Actual -10 Error
-17.40.78.300.291.70.2
Overall error: 0.9%, Averaged class error: 4.25%
Rattle timestamp: 2018-05-1412:48:08 S_V_A
Vtreat.R.
ありがとうございます。
Rに何かあるのでしょうか?
Rattleで自分のキットを試してみた - すべてのネットワークで学習を選択したが、熟考の末にようやくエラーが発生した
サイクル中))。
しかし、すべての組み合わせとPCは24時間カウントされる...。
10個の予測因子、組み合わせ2^10=1024。
20個の予測因子、= 2^20 = 1048576
それだけ、森・nsを鍛える必要があるのです。
急がないから...。別のパソコンに放り込んで、勝手にカウントさせることもできる。
しかし、どんな価値あるソフトがあるのでしょうか?
Vtreat.R
どうすれば実行できますか?vtrear() を呼び出すと、しかめっ面に なる。
写真も?無駄なことを言うな、お前もいい加減にしろ(笑)
知らないわ...また、DocはMKULの全コードを与えたので、このモデルはすぐにMTで使用することができます。elmnnで嫌だったのは、何度訓練してもOOSで同じ結果になってしまうことです。だから、何度訓練しても同じ結果になるんです :-)でも、まだ始まったばかりで、もっとテストしないと確信が持てない...。
どうすれば実行できますか?vtrear() を呼び出すと、しかめっ面に なる。
とにかく、こんな感じです。しかし、0と1しかないようなターゲット分類では、評価することになります。回帰の場合はかなり違いますが...。
ランダムフォレストモデルの 結果を正しく解釈する方法 - それは良いのか悪いのか?
テストデータについて (15%)
そんなわけで、2つのファイルに分割することができなかったのですが、誰も明確に説明してくれません :(
どうすれば実行できますか?vtrear() を呼び出すと、しかめっ面に なる。
パッケージの呼び方が違うので、必要です。
ライブラリ(vtreat)
パッケージにはいくつかの関数が含まれていますが、ドキュメントを開くのが面倒なのでしょうか?
そんな感じです。しかし、これは0と1しかない対象分類に対する推定値である。回帰の場合はまた別ですが...。
では、グラフィカルなシェルは搭載していないのですか?どのように呼び出すのですか?
パッケージの呼び名が違うので、そうすべきです。
ライブラリ(vtreat)
パッケージにはいくつかの関数が含まれていますが、ドキュメントを開くのが面倒なのでしょうか?
ドキュメントはどこで入手できますか?
では、グラフィカルなシェルは搭載していないのですか?シェルを呼び出すには?
でも、スクリプトを書いて、すべてをエクセルにアップロードして、そこで魔法をかけるんです。私の発案なので、脚本はお渡しできませんが......。まあ、そこはカッコよくオリジナルでやりましたよ。予測因子をどのように推定しているのかわかりませんが、その結果は、さらなる分析のために非常に読みやすい表になっていますね...。そうして...