트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1354

 
유리 아사울렌코 :

아카이브를 유지합니다. 첨부 파일을 참조.

Learn.csv - 입력. 각 줄의 첫 번째 숫자는 기록에 대한 링크이므로 삭제해야 합니다.

Cell.scv - 대상.

이 데이터에 대한 교육을 마치면 이 그래프와 같은 결과를 얻을 수 있습니다.

필터는 대략 ЕМА(16), 예측 - 5분에 해당합니다.

ZY 그러면 필요할 때 테스트하겠습니다.

이 그래프가 어떤 샘플에서 나타났는지 여부는 완전히 명확하지 않습니다. 훈련 중입니까 아니면 테스트 중입니까?

다음 은 테스트 중인 CatBoost 입니다. 100개의 마지막 값입니다.

편차 히스토그램

교육용으로 4000개, 검증용으로 2000개, 테스트용으로 100개 라인을 사용했습니다. 6, RMSE 공식( Poisson 으로 대체됨)으로 1000개의 나무를 훈련했습니다.

샘플과 설정을 첨부하겠습니다. 재생하려면 CB를 다운로드하여 Setup 디렉터리에 넣어야 합니다.

훈련 샘플의 분포도 귀하의 분포와 유사하지 않습니다.

추가됨: 모델을 잘못 적용했습니다. 확률 그래프에서 밝혀졌습니다...

파일:
Setup.zip  587 kb
 
알렉세이 비아즈미킨 :

이 그래프가 어떤 샘플에서 나타났는지 여부는 완전히 명확하지 않습니다. 훈련 중입니까 아니면 테스트 중입니까?

다음은 테스트 중인 CatBoost입니다. 100개의 마지막 값입니다.

편차 히스토그램

교육용으로 4000개, 검증용으로 2000개, 테스트용으로 100개 라인을 사용했습니다. 훈련된 1000그루의 나무 깊이 6, RMSE 공식.

샘플과 설정을 첨부하겠습니다. 재생하려면 CB를 다운로드하여 Setup 디렉터리에 넣어야 합니다.

훈련 표본의 분포도 귀하의 분포와 유사하지 않습니다.

내 그래프는 전체 샘플에 대해서만 훈련하고 있습니다. 이 테스트를 하지 않았습니다. 훈련과 거의 같을 것입니다.
x축 그래프에서 음수 값은 어디로 갔습니까? 그리고 x 의 범위는 y와 같지 않습니까? 이와 같이?
예측값과 실제값(목표값)을 비교한 그래프가 있습니다. 배포가 없습니다.
 
유리 아사울렌코 :
내 그래프는 전체 샘플에 대해서만 훈련하고 있습니다. 이 테스트를 하지 않았습니다. 훈련과 거의 같을 것입니다.
x축 그래프에서 음수 값은 어디로 갔습니까? 그리고 x 의 범위는 y와 같지 않습니까? 이와 같이?
예측 값과 실제 값을 비교하는 그래프가 있습니다.

예, 이전에 회귀를 다루지 않았습니다. 분류와 달리 모호한 피트니스 기능이 많이 있으며 다른 결과를 제공하고 잘못된 값을 취했습니다.

여기 테스트 샘플에서 밝혀졌습니다.

그러나 훈련 중 - 4000 라인

테스트 샘플에 대한 편차 히스토그램

다음은 3개의 샘플에 대한 전체 그래프입니다.

테스트 세트에서 학습하는 데 사용되는 메트릭

그는 250번의 반복에서 훈련을 중단할 수 있었다고 말합니다. 모델은 다시 훈련됩니다.

 
알렉세이 비아즈미킨 :

예, 이전에 회귀를 다루지 않았습니다. 분류와 달리 모호한 피트니스 기능이 많이 있으며 다른 결과를 제공하고 잘못된 값을 취했습니다.

여기 테스트 샘플에서 밝혀졌습니다.

그러나 훈련 중 - 4000 라인

테스트 샘플에 대한 편차 히스토그램

다음은 3개의 샘플에 대한 전체 그래프입니다.

좋아요. 시험에서도., 비록 재교육을 받았지만.)
 
유리 아사울렌코 :
좋아요.

네, 원한다면 개선할 수 있습니다. 저는 회귀 모델 에 대한 경험이 없을 뿐입니다.

따라서 주요 예측자는 작업 도구입니다. :)

설정이 포함된 최종 버전 첨부 - 다른 Seed로 10개 모델 학습

파일:
Setup.zip  588 kb
 
알렉세이 비아즈미킨 :

네, 원하는 경우 개선할 수 있습니다. 저는 회귀 모델에 대한 경험이 없습니다.

따라서 주요 예측자는 작업 도구입니다. :)
입구에 스케일된 가격대가 있습니다. - 20개의 가까운 값, 그게 다야. 예측자에 관한 것이 아니라 문제를 설정하는 것입니다. 해결할 수 있습니다. 그리고 당신의 숲은 예측자를 제시할 것입니다.)
 
유리 아사울렌코 :
입구에 스케일된 가격대가 있습니다. - 20개의 가까운 값, 그게 다야. 예측자에 관한 것이 아니라 문제를 설정하는 것입니다. 해결할 수 있습니다. 그리고 당신의 숲은 예측자를 제시할 것입니다.)

예, 요점은 문제의 공식화에 있습니다. 저는 여기에 동의합니다. 가격을 파이가 만들어지는 반죽으로 생각하지 않고 그 파이의 모양에 대한 예측자가 필요하다는 것입니다.

 
막심 드미트리예프스키 :

모델을 개선할 수 있는 고전적인 기술 중 하나입니다. 또는 오히려 최적의 것을 찾으십시오. 몬테카를로의 원래 응용 프로그램입니다.

https://en.wikipedia.org/wiki/Importance_sampling

당신은 당신의 생성에서이 방법을 사용하지 않았습니까?

 
막심 드미트리예프스키 :

오프 정책의 경우(정책 기울기) RL

https://medium.com/@jonathan_hui/rl-importance-sampling-ebfb28b4a8c6

러시아어로 자신의 말로 아이디어의 본질이 무엇인지 설명할 수 있습니까? 말하자면 인기있는 언어 :)

 
유리 아사울렌코 :

LPF 필터를 성공적으로 예측했습니다. 지금도 함께하는 국회는 물론이고 숲도 함께 합니다. 이제 일반적으로 무의미한 가격을 예측해 보겠습니다.) 현재로서는 알 수 없는(기대) 가격의 기대 변화의 저주파 성분을 예측하는 것이 좋습니다. 그리고 여기 모든 종류의 움직임, 고주파 진동 및 기타 모든 조건에서.

1m의 TF에서 예측 시간은 5m입니다.

평소와 같이: x - 예측, y - 실제 값. 음, 45도 기울어져 있습니다. 사각형은 원이 아닌 것에 감사함을 상기시킵니다. x에서 0의 오른쪽이나 왼쪽으로 조금 움직이면 50%가 조금 넘는 확률로 플레이할 수도 있습니다(영역 참조).

물론 모든 종류의 회귀선, 분포를 작성하는 것이 좋겠지만 최소한 몇 개는 수행해야 합니다. 그건 나중에 해야 합니다.

PS 음, 약간 수정된 알고리즘에 대한 힙 예측입니다. TF 1m에서 동일한 5분

이미 훨씬 낫습니다.) 예측에서 시작하여 x의 경우 > 2 및 < -2에서 시작하여 5분 안에 어리석게 닫는다면 수익성 없는 거래는 거의 예상되지 않습니다.

2번째 사진 진짜 좋네요! 알고리즘의 어떤 변화로 인해 그것을 얻을 수 있었습니까?
사유: