트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 967

 
이반 네그레쉬니 :

IMHO, python에서 먼저 해결해야 합니다. 어느 정도 디버깅됩니다. 그렇지 않으면 많은 불확실성이 있습니다.

예 캠페인 dll 32비트 및 mt5 64

그러면 나는 파이썬이 될 때까지 돌아올 것이다.

 
막심 드미트리예프스키 :

캠페인을 직접 마스터하지 않고 결국 파이썬을 사용해야 합니다. D

당신은 "자신을 위한 어려움을 만드는 탁월한 전문가"라는 칭호를 받아야 합니다! 영화에서만 볼 수 있는 일반적인 캐릭터는 항상 돌아다닙니다.


다음은 귀하가 언급한 xgboost 모델에 대해 몇 번의 클릭만으로 악명 높은 딸랑이입니다.

훈련 샘플에 대해 다음을 얻습니다.

Error matrix for the Extreme Boost model on Df1.num [**train**] (counts):

      Predicted
Actual     0      1 Error
     0 1930    90    4.5
     1    42 2152    1.9

Error matrix for the Extreme Boost model on Df1.num [**train**] (proportions):

      Predicted
Actual     0      1 Error
     0 45.8    2.1    4.5
     1    1.0 51.1    1.9

Overall error: 3.1 %, Averaged class error: 3.2 %

Rattle timestamp: 2018 - 05 - 31 11 : 21 : 20 user

샘플 검증용

Error matrix for the Extreme Boost model on Df1.num [validate] (counts):

      Predicted
Actual   0    1 Error
     0 306 119    28.0
     1 111 367    23.2

Error matrix for the Extreme Boost model on Df1.num [validate] (proportions):

      Predicted
Actual     0      1 Error
     0 33.9 13.2    28.0
     1 12.3 40.6    23.2

Overall error: 25.5 %, Averaged class error: 25.6 %

Rattle timestamp: 2018 - 05 - 31 11 : 22 : 15 user

샘플 테스트용

Error matrix for the Extreme Boost model on Df1.num [test] (counts):

      Predicted
Actual   0    1 Error
     0 314 118    27.3
     1 112 360    23.7

Error matrix for the Extreme Boost model on Df1.num [test] (proportions):

      Predicted
Actual     0      1 Error
     0 34.7 13.1    27.3
     1 12.4 39.8    23.7

Overall error: 25.5 %, Averaged class error: 25.5 %

Rattle timestamp: 2018 - 05 - 31 11 : 22 : 50 user


결과에 만족하면 R에서 코드를 볼 수 있습니다. 호출은 다음과 같습니다.

crs$ada <- xgboost(Long_Short ~ .,
  data              = crs$dataset[crs$train,c(crs$input, crs$target)],
  max_depth         = 6,
  eta               = 0.3, 
  num_parallel_tree = 1, 
  nthread           = 2, 
  nround            = 50,
  metrics           = 'error',
  objective         = 'binary:logistic')


실제로 R 코드 전체를 래틀에서 가져와서 함수로 배열하고 MT4/5 Expert Advisor에서 이 함수를 호출하고 테스터에서 결과를 볼 수 있습니다. 원시적인 dll인데, 오랫동안 꾸준히 해서 쓰시는 분들이 많네요...

이 모든 것이 한 시간 안에! 모델에는 문제가 없습니다!

대상 및 해당 대상 예측 변수에 문제가 있거나 그 반대의 경우도 있습니다. 그러나 이 문제를 해결하려면 테스트 옵션을 위한 노동 집약도가 극히 낮은 도구가 필요합니다.


추신.

글쎄, 만약 당신이 덜렁거리고 있다면, 한 번의 클릭으로 트리(rPart), randomForest, SVM, glm 로지스틱 회귀, 가장 단순한 nnet이지만 가장 좋아하는 신경망을 동시에 구축할 수 있습니다. 그리고 간식의 경우 목표와 예측 변수를 다시 공식화할 수 있다면 생존 모델(하늘 높은 수익 달성 또는 예금 고갈 달성)입니다.


PSPS.

당신은 xgboost에 대한 사랑이 있고 이 사랑에 딸랑이로 수용 가능한 예비 계산을 제공할 수 있으므로 다음은 당신을 위한 문서입니다.

패키지 설명 - https://cran.r-project.org/web/packages/xgboost/xgboost.pdf

Xgboost로 데이터 세트 이해하기 - https://cran.r-project.org/web/packages/xgboost/vignettes/discoverYourData.html

xgboost: 극단적인 그라디언트 부스팅 - https://cran.r-project.org/web/packages/xgboost/vignettes/xgboost.pdf

그리고 간식으로 Xgboost 프레젠테이션 https://cran.r-project.org/web/packages/xgboost/vignettes/xgboostPresentation.html


여기에서 시연하는 수준을 감안할 때 R에는 전혀 문제가 없습니다.


행운을 빕니다.

 
산산이치 포멘코 :

감사합니다, SanSanych .. 이해하지 못했습니다. Ratl에 xgb가 있습니까? 시원한

어쨌든 RL 작업을 위해 alglib 스캐폴딩 대신 이 모델을 추가하면 됩니다.

아무것도 탐색할 필요가 없습니다. 정규화 및 교차 검증을 통해 더 나은 것이 필요합니다.

그런 다음 R에는 RL에 대한 일반 라이브러리가 없으며 모두 파이썬에 있습니다. 나는 파이썬 위에서 R을 다시 엉망으로 만들어야 할 것입니다. 요컨대, 아직 내가 필요한 것을 결정하지 못했습니다. :)

 

나무를 생각하며...

한 막대에 대한 목표가 어떻게 되는지 모르겠지만 목표가 실제로 이벤트일 때 N 막대 이후에 시작됩니다(특히 추세 거래 또는 SL/ TP, N 막대 또는 고정 기간 후), 동시에 결과가 고려되고 분류됩니다. 결과를 평가하기 위해 분할표가 아니라 다음 사항에 주의를 기울이는 것이 매우 중요합니다.

1. N개의 창에서 분류 결과의 변경 빈도

2. 규칙을 N개의 막대로 그룹화(규칙의 밀도)

첫 번째 경우 예측 대상 변경 빈도를 평가하기 위해 지표가 필요합니다. 높으면 모델이 불안정하지만 많은 비율의 올바른 솔루션을 얻을 수 있습니다.

두 번째 경우에는 철근을 평가하고 이 규칙을 모델 전체에 전파하기 위해 하나의 창(N 막대)에 대한 규칙을 적용해야 합니다.

따라서 작업을 변경하기 위해 결과에 대한 내성을 포함하는 숲의 형성 및 기타 모델을 포함하여 모델의 품질을 훈련할 때 추정치를 변경할 필요가 있습니다.

이러한 생각에 대해 어떻게 생각하십니까?

 

다시 한 번, 나는 R이 내 것이 아니라는 것을 확인했습니다. :) 구문이 거의 강조 표시되지 않고 코드를 읽을 수 없으며 오류가 실제로 강조 표시되지 않습니다. 코드 자체와 언어가 미학적으로 유쾌하지 않습니다.

여기에 당신의 반론이있을 수 있습니다

예, 파이썬에서 5줄 대신 3줄로 알고리즘을 훈련할 수 있습니다. 그게 전부입니다. 이 경우 python의 가독성이 향상됩니다. MO가 있는 패키지에는 어떤 이점도 없습니다. 모든 것이 동일합니다.

 
막심 드미트리예프스키 :

다시 한 번, 나는 R이 내 것이 아니라는 것을 확인했습니다. :) 구문이 거의 강조 표시되지 않고 코드를 읽을 수 없으며 오류가 실제로 강조 표시되지 않습니다. 코드 자체와 언어가 미학적으로 만족스럽지 않습니다.

여기에 당신의 반론이있을 수 있습니다

예, 파이썬에서 5줄 대신 3줄로 알고리즘을 훈련할 수 있습니다. 그게 전부입니다. 이 경우 python의 가독성이 향상됩니다. 나는 MO 패키지에서 어떤 이점도 보지 못합니다. 모든 것이 동일합니다.

저는 R 프로그래밍에 대한 러시아어 비디오 과정을 시청하는 중입니다. 물론 언어는 구문 및 가정 측면에서 주석입니다. 예를 들어 함수에서 전역 변수 를 선언하는 기능은 크게 왜곡될 수 있습니다. 코드, 특히 함수가 두 번 이상 호출되는 경우, 그 후에는 어리석고 오류를 찾을 수 있지만 컴파일러를 위한 것은 아닙니다.

R의 메모리 과도는 나를 크게 화나게 합니다. 이제 187MB csv 파일이 메모리에 배치되어 트리 작업을 위해 1.5기가바이트(Rattle에서는 포리스트 구축을 위해 7.5기가바이트)로 배포되지만 멀티스레딩은 작업할 수 없는 별도의 프로세스를 시작하는 것으로 구현됩니다. 결과적으로 공통 메모리는 6개의 프로세서 코어를 로드하는 대신 4개만 로드할 수 있으며 8GB의 사용 가능한 볼륨에 있습니다.

파이썬은 이것을 어떻게 하고 있습니까?

 
알렉세이 비아즈미킨 :

저는 R 프로그래밍에 대한 러시아어 비디오 과정을 시청하는 중입니다. 물론 언어는 구문 및 가정 측면에서 주석입니다. 예를 들어 함수에서 전역 변수 를 선언하는 기능은 크게 왜곡될 수 있습니다. 코드, 특히 함수가 두 번 이상 호출되는 경우 그 후에는 어리석고 오류를 찾을 수 있지만 컴파일러를 위한 것은 아닙니다.

R의 메모리 과도는 나를 크게 화나게 합니다. 이제 187MB csv 파일이 메모리에 배치되어 트리 작업을 위해 1.5기가바이트(Rattle에서는 포리스트 구축을 위해 7.5기가바이트)로 배포되지만 멀티스레딩은 작업할 수 없는 별도의 프로세스를 시작하는 것으로 구현됩니다. 결과적으로 공통 메모리는 6개의 프로세서 코어를 로드하는 대신 4개만 로드할 수 있으며 8GB의 사용 가능한 볼륨에 있습니다.

파이썬은 이것을 어떻게 하고 있습니까?

나는 기억을 보지 않았다. 그런 큰 파일은 사용하지 않았습니다. :) 그러나 초기 버전의 R에는 메모리와 정리가 있는 이음새가 있다고 들었습니다.

파이썬은 당연히 모든 면에서 더 발전된 언어입니다, tk. 다양한 작업에 사용

나는 또한 그들이 R에서 그래프의 시각화를 칭찬한다는 사실로 농담을 이해하지 못했습니다. 파이썬에 비해 비참하고, IDE Rstudio도 숲의 불행입니다. 2018에서 이것을 어떻게 지원할 수 있습니까?

100줄을 작성하고 코드에서 혼란스러워서 모든 것이 강조 표시되지 않은 구문으로 읽을 수 없는 하나의 발보로 병합되었습니다.

Upd 나무와 숲 자체는 세트의 크기와 나무의 수와 깊이에 따라 많은 메모리를 차지합니다. 예를 들어, 50그루의 나무가 있는 20개의 숲으로 구성된 위원회가 있고 약 1000개의 예제 세트는 ~ 40MB가 필요합니다.
 

R에 대해 말도 안되는 말을 쓰세요.

1. 컴파일러가 인터프리터의 장점인 언어에 비해 R 코드 디버깅의 속도와 편의성은 정말 놀랍습니다. 이와 관련하여 강조 표시할 항목이 없기 때문에 강조 표시가 매우 제한적입니다. 코드는 거의 즉시 작동합니다. 매우 방대한 코드. "풋웨어"를 작성하는 것은 R 자체와 패키지의 기능에 대한 지식이 부족하기 때문일 가능성이 큽니다. 그리고 그것이 실제로 일어났다면 좋은 moveton은 기능으로 분할해야하며 OOP가 있습니다.

2. 모든 언어에서 전역 변수 의 사용은 신중하게 이루어져야 합니다. R에서는 함수의 매개변수와 반환값이 "객체"가 될 수 있기 때문에 그 필요성이 매우 의심스럽습니다. 그러나 R에서는 무엇이든 됩니다. 또한 변수 이름이 바인딩되는 공간을 제어할 수 있습니다.

2. 그래픽 - 세계 최고 중 하나 - 가장 단순한 플롯에서 만화, 여러 수준의 그래픽에 이르기까지 모든 것이 있습니다. 원시에서 통계를 위한 특수 공백에 이르기까지.

3. 파이썬과 비교할 수 없습니다. 그들은 유병률이 거의 동일하지만 파이썬에는 많은 "외국"사용자, 주로 사이트 개발자가 있으며 R은 통계 시스템, 우리, 네이티브, 이중 네이티브입니다. 통계에 포함되었습니다. 우리가 패키지에 대해 이야기하면 다른 전문 패키지 (SAS ...)와 비교해야하지만 유료입니다.

4. R은 통계의 알고리즘 표준입니다. 거의 모든 최신 출판물에는 반드시 R 코드가 포함되어 있습니다.


마지막 것. R은 Microsoft의 일부이고 python은 속임수입니다. 프로그래밍에 매우 능숙한 사람들은 배포 소스에 동의할 수 없었습니다. 나에게 이것은 평결이다.


프로그래밍에서 그들은 더 편리하고 기능적인 것을 선택하는 경우가 많지만 극히 모호한 선택을 하기 위해 물을 뿌릴 필요는 없습니다.

 
산산이치 포멘코 :

SanSanych, 배포 소스는 하나뿐입니다. 바로 Python 사이트입니다. :)

통계 및 기계 학습용 IPython 및 anaconda 확장. 러시아어를 구사하는 opendatascience 커뮤니티로 이동하거나 Yandex에서 비디오를 시청하십시오. 그들은 R에 대해 전혀 듣지 못했습니다. 그래서 기준이 뭔가요? 파이썬을 사용하여 자신의 의견을 만들고 비교합니다. 또한 이미 말했듯이 파이썬에 대한 지식은 통계뿐만 아니라 필요한 경우 다른 작업도 수행할 수 있게 해줍니다.

이것은 해석된 언어이기도 하지만 스크립트, + 코드 접기, 메모장 및 다양한 기능을 실행한 후뿐만 아니라 완벽하게 강조 표시되고 즉석에서 구문을 확인합니다.

 
막심 드미트리예프스키 :

나는 기억을 보지 않았다. 그런 큰 파일은 사용하지 않았습니다. :) 그러나 초기 버전의 R에는 메모리와 정리가 있는 이음새가 있다고 들었습니다.

파이썬은 당연히 모든 면에서 더 발전된 언어입니다, tk. 다양한 작업에 사용

나는 또한 그들이 R에서 그래프의 시각화를 칭찬한다는 사실로 농담을 이해하지 못했습니다. 파이썬에 비해 비참하고, IDE Rstudio도 숲의 불행입니다. 2018에서 이것을 어떻게 지원할 수 있습니까?

100줄을 작성하고 코드에서 혼란스러워서 모든 것이 강조 표시되지 않은 구문으로 읽을 수 없는 하나의 발보로 병합되었습니다.

Upd 나무와 숲 자체는 세트의 크기와 나무의 수와 깊이에 따라 많은 메모리를 차지합니다. 예를 들어, 50그루의 나무가 있는 20개의 숲으로 구성된 위원회가 있고 약 1000개의 예제 세트는 ~ 40MB가 필요합니다.

나는 여전히 R이 멋진 계산기라는 느낌을 가지고 있습니다. 기본 기능에 대한 러시아어 지원 부족은 사람을 죽입니다. 글쎄요, 이것은 언어학의 약점 때문에 나에게 매우 중요합니다.

시각화 - 예, 몇 가지 어려움이 있습니다. 큰 크기의 동일한 나무는 저에게 적합하지 않습니다. PDF로 변환하는 것만 도움이 됩니다. 이는 이미 좋습니다.

사유: