Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [validate] (counts):
Predicted
Actual - 101 Error
- 1240231523706.204733970619645.811058581761525.0
Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [validate] (proportions):
Predicted
Actual - 101 Error
- 126.31.70.16.200.543.52.25.810.06.419.325.0
Overall error: 10.9 %, Averaged class error: 12.33333 %
Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [test] (counts):
Predicted
Actual - 101 Error
- 1238471502736.204553967719845.81760241767325.4
Error matrix for the Random Forest model on Pred_027_2016_H2_T.csv [test] (proportions):
Predicted
Actual - 101 Error
- 126.11.60.16.200.543.52.25.810.06.619.425.4
Overall error: 11 %, Averaged class error: 12.46667 %
일반적으로 3등급의 목표는 그다지 좋지 않습니다. (-1.0)과 (0.1)의 두 가지 목표로 분할하고 위치를 결정할 때 결합하는 것이 좋습니다.
제가 3급을 요구한 내용입니다. 몇 페이지 전에는 대상이 두 개뿐인 동일한 파일이 있었습니다. 나는 두 가지 목표를 마스터하지 못했습니다. (한 수업은 양적으로 매우 편향되어 있고 또한 어렵습니다), 지금 세 가지를 시도하고 있습니다.
나는 randomForest를 기다렸지만 훈련 파일의 경우 원본 파일의 10%를 가져갔습니다.
결과는 다음과 같습니다.
흥미로운 차트가 있습니다.
그에 따르면 트리의 수를 약 50개로 늘리면 오차가 줄어들지만 트리의 수를 100개 이상으로 늘린 후에는 완전히 비어있는 연습임을 알 수 있습니다.
다음은 검증 및 테스트의 결과입니다. 나는 그것들을 크게 가지고 있다. 원본의 45%
앞이 보이지 않는다면 꽤 괜찮은 편입니다.
M1의 TS는 명확하지 않습니다. 스프레드 내에서 예측할 것입니다.
나는 randomForest를 기다렸지만 훈련 파일의 경우 원본 파일의 10%를 가져갔습니다.
결과는 다음과 같습니다.
덕분에 결과를 보니 나쁘지 않은 것 같은데요?
그런데 예측변수 중요도 테이블로 볼 때 예측변수로 arr_Sell을 사용한 것 같나요? 그렇다면 이것은 사실이 아닙니다.
흥미로운 차트가 있습니다.
그에 따르면 트리 수를 약 50개로 늘리면 오류가 줄어들지만 트리 수를 100개 이상으로 늘리면 완전히 공허한 연습임을 알 수 있습니다.
그래서 그것은 아마도 논리적일 것입니다. 예측자가 많을수록 더 많은 결정을 내릴 수 있습니까, 아니면 문제의 본질을 올바르게 이해하지 못하는 것입니까?
앞이 보이지 않는다면 꽤 괜찮은 편입니다.
M1의 TS는 명확하지 않습니다. 스프레드 내에서 예측할 것입니다.
추세 전략이 있으며 Si의 MOEX 거래소에서 작동합니다. 확산은 중요하지 않습니다.
최종 결정을 내리려면:
추세 전략이 있으며 Si의 MOEX 거래소에서 작동합니다. 확산은 중요하지 않습니다.
분류의 추세는 무엇입니까? 클래스 예측 오류는 추세를 깨고 추세에 아무것도 남지 않습니다.
그런데 예측변수 중요도 테이블로 볼 때 예측변수로 arr_Sell을 사용한 것 같나요? 그렇다면 이것은 사실이 아닙니다.
물론, 전나무!
다른 무엇?
이제 계산하겠습니다.