트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 77

 
다른 모든 언어가 다양한 용도로 사용되고 R이 데이터 작업에만 사용된다는 점을 감안할 때 R에 대한 매우 좋은 결과입니다.
 
Dr.Trader :
다른 모든 언어가 다양한 용도로 사용되고 R이 데이터 작업에만 사용된다는 점을 감안할 때 R에 대한 매우 좋은 결과입니다.

내 데이터에 대한 교육을 시도했습니까?

5일 동안 실험을 했습니다. EURUSD만 고문!

여기에 게시 한 크기에 대해 99 개의 교육 샘플을 만들었습니다. 시간이 지남에 따라 축소된 관찰이 포함되어 있기 때문에 모두 고유합니다. 나는 그들에 대한 모델을 훈련하고 GBM 숲의 위원회를 만들 것입니다. 하루에 18개 샘플만 통과했지만 이미 검증에 대한 흥미로운 결과가 있습니다. 동시에 유효성 검사를 2.5배 크게 만든 다음 그 이유를 알려 드리겠습니다!

보시다시피, 첫 번째 훈련 샘플에서 모델은 검증에서 400K 관찰에 대해 2.7포인트의 MO를 받는 방식으로 훈련되었습니다(확산 고려).

글쎄, 여전히 1, 1.5 포인트의 결과, 규범이 있습니다. 이 모든 것은 나중에 위원회에 올려질 것이고 어떤 그림이 최종적으로 검증될지 봅시다! 숙제를 위해 4 또는 4+를 예상합니다.

잠시만요, 여러분.

추신: 교육 데이터 - 다양화 및 위원회를 위한 99개 샘플: https://drive.google.com/open?id=0B_Au3ANgcG7CNG5JT3R2UzI0UzQ

 

예, 시도했지만 처음에는 작동하지 않았습니다. 모델을 평가하기 위해 회귀 결과의 정확도를 취했습니다(필요한 결과는 [0; 0.5; 1]에서 얻은 결과를 뺀 값, 모듈로). 유전학은 뉴런이 훈련을 위한 충분한 데이터를 가지고 있지 않은 한 쌍의 예측자를 사용하여 이러한 전역 최대값을 찾았으므로 거의 모든 데이터에 대해 0.5를 반환합니다("거래 금지" 클래스에 해당). 일반적으로 이러한 피트니스 기능은 전혀 적합하지 않으므로 결과적으로 네트워크는 단순히 거래되지 않습니다.

이제 두 번째 실험은 여전히 학습 과정에 있습니다. 나는 여전히 3개의 클래스로 작업하지만 회귀 결과를 즉시 [0, 0.5, 1] 수준으로 반올림합니다. 점수 - 분류 정확도([정답 수] / [총 수]). 유전학에서 가장 좋은 피트니스 값의 그래프에 따르면 결과는 33%에 가깝다고 판단할 수 있으며 실제로는 랜덤과 동일합니다. 운이 좋다면 조금 더 높을 수도 있습니다. 유전학이 최대치에 도달할 때까지 하루나 이틀 더 기다려야 한다. 그러면 내가 전면 테스트를 할 수 있다.

내 예측 변수에서 내 결과가 일반적으로 더 좋습니다. 이 데이터에 더 많은 지표를 추가해야 한다고 생각합니다. 알고리즘이 예측 변수를 평가하고 삭제할 수 있는 경우 초기에 더 많은 지표를 추가할수록 더 좋습니다.

 
Dr.Trader :

예, 시도했지만 처음에는 작동하지 않았습니다. 모델을 평가하기 위해 회귀 결과의 정확도를 취했습니다(필요한 결과는 [0; 0.5; 1]에서 얻은 결과를 뺀 값, 모듈로). 유전학은 뉴런이 훈련을 위한 충분한 데이터를 가지고 있지 않은 한 쌍의 예측자를 사용하여 이러한 전역 최대값을 찾았으므로 거의 모든 데이터에 대해 0.5를 반환합니다("거래 금지" 클래스에 해당). 일반적으로 이러한 피트니스 기능은 전혀 적합하지 않으므로 결과적으로 네트워크는 단순히 거래되지 않습니다.

이제 두 번째 실험은 여전히 학습 과정에 있습니다. 나는 여전히 3개의 클래스로 작업하지만 회귀 결과를 즉시 [0, 0.5, 1] 수준으로 반올림합니다. 점수 - 분류 정확도([정답 수] / [총 수]). 유전학에서 가장 좋은 피트니스 값의 그래프에 따르면 결과는 33%에 가깝다고 판단할 수 있으며 실제로는 랜덤과 동일합니다. 운이 좋다면 조금 더 높을 수도 있습니다. 유전학이 최대치에 도달할 때까지 하루나 이틀 더 기다려야 한다. 그러면 내가 전면 테스트를 할 수 있다.

내 예측 변수에서 내 결과가 일반적으로 더 좋습니다. 이 데이터에 더 많은 지표를 추가해야 한다고 생각합니다. 알고리즘이 예측 변수를 평가하고 삭제할 수 있는 경우 초기에 더 많은 지표를 추가할수록 더 좋습니다.

고맙습니다. 결과를 보고합니다.

당신과 우리에 대해. 여기에는 꽤 많은 예측 변수가 있습니다. 제 입맛에는 충분합니다. 나는 단지 5 쌍과 각각 10 년을 가지고 있습니다. 여기서 모델이 1쌍 및 2년보다 더 길고 느리게 학습한다는 것이 분명합니다. 하지만 더 나쁜 의미는 아닙니다.
 
아직도 성배 를 만들려고 하시나요???? 음......
 
마이클 마르쿠카이테스 :
아직도 성배를 만들려고 하시나요???? 음......
주말에 그의 성배 를 설명하기로 약속한 누군가
 
마이클 마르쿠카이테스 :
아직도 성배를 만들려고 하시나요???? 음......
트롤, 여기서 나가.
 
아니, 아니, 시스템이 병합되었습니다. 표시하는 것도 의미가 없습니다. 죄송합니다 ..... 분류에 관한 논문과 관련하여 예 ... 할 수 있습니다 .. 그러나 아직 시간이 없습니다. 더 자유로워지고 창의력이 넘쳐 날 것이므로 확실히 구독을 취소하겠습니다 ..... 그리고 그래서 .....
 
마이클 마르쿠카이테스 :
아니, 아니, 시스템이 병합되었습니다. 표시하는 것조차 의미가 없습니다. 죄송합니다 ..... 분류에 관한 논문과 관련하여 네 ... 할 수 있습니다 .. 그러나 아직 시간이 없습니다. 더 자유로워지고 창의력이 넘쳐 날 것이기 때문에 나는 확실히 구독을 취소 할 것입니다 ..... 그리고 그래서 .....

흥미롭습니다... 이미 1년 동안 알고리즘을 성공적으로 사용하고 있다고 썼습니까? 몇 시간 전에 게시됨 "아직도 성배 를 만들려고 하고 있군요???? 글쎄요......" 알고리즘이 몇 시간 전에 작동한 다음 알고리즘이 병합되었음을 알 수 있습니다???????? ???????????? ?? 왠지 당신의 이야기가 어울리지 않습니다...

  

들어봐, 할 말이 있으면 PM을 써줘. 너가 쓴 것과 똑같은 일을 했기 때문에 이 주제는 나에게 흥미롭다.

 

여기 주제에서 RNeat에 대한 메시지가 있었습니다. 이것은 적응형 토폴로지가 있는 뉴런입니다. 여기서 뉴런의 가중치와 연결은 유전학을 사용하여 형성됩니다.
설명과 간단한 테스트로 판단하면 모델은 상당히 좋습니다. 그러나 Forex의 경우 다소 약할 것입니다. 400개의 예측 변수를 사용하여 다음 막대에 대한 매수/매도를 예측하면서 이미 일주일 동안 교육을 실행하고 있습니다.
모델 훈련이 너무 느립니다. 일주일 만에 모델의 적합도가 2%로 거의 증가했습니다. 훈련 데이터에서도 예측 정확도는 55%에 불과했고, 모델은 수익을 창출하기 위해 좋은 논리로 발전할 시간이 없었습니다.

검증 데이터(훈련 데이터에서 제거된 임의의 막대)의 정확도는 약간 더 높지만 이는 모델의 장점보다 우연의 일치에 가깝습니다.
전면 테스트의 정확도는 50%에서 53% 사이에서 변동하며, 그래프로 판단하면 이것도 모델의 장점이 아니라 우연이다.
기적은 일어나지 않았습니다. 저는 모델이 몇 개월에 걸쳐 원하는 로직으로 진화할 것이라고 생각하지만, 동시에 잘못된 유효성 검사 결과로 다시 훈련될 것이며, 그때까지는 이미 구식이 될 것이며 다시 시작합니다.
실험을 중단했는데 계속할 이유가 없습니다.