혼돈에 패턴이 있을까요? 찾아보겠습니다! 특정 샘플의 예에 대한 머신 러닝. - 페이지 3

 
Aleksey Vyazmikin #:

exam.csv 파일에서 모델을 정확히 확인할 수 있나요?

샘플링으로 어떤 조작을 시도해 보셨나요?

다음은 일부 예측 변수를 제거한 후의 시험 샘플의 잔액입니다.

물론 모델 응답 분포의 그래프를 보면 약간의 훈련만 수행되었음을 알 수 있습니다. 리콜은 매우 낮지만 이미 어느 정도 결과가 나온 것입니다.

train.csv


exam.csv

시험에 9046줄이 있습니다. 저는 9000개입니다. 거의 차이가 없을 것입니다.

곡선이 훨씬 좋아졌습니다. 매개 변수를 좀 더 조정해 보겠습니다.
 
elibrarius #:

가장 좋은 균형은 무엇인가요?

이제 나는 다른 변형을 검색했는데,이 결과는 일종의이 결과 -위원회 라운드에도 3 점이 아이디어에 대해 취해집니다.


 
elibrarius #:
9,046개의 회선이 있습니다. 저는 9000개입니다.

훨씬 더 나은 곡선이 있습니다. 매개 변수를 좀 더 조정해 보겠습니다.

글쎄요, 시험 파일 데이터라면 네, 큰 차이가 없습니다. 아마도 기차 파일 일 것이라고 생각했습니다. 원래 세 파일을 병합하셨나요?

해보세요.

 
Aleksey Vyazmikin #:

네, 시험 파일 데이터라면 큰 차이가 없으니 기차 파일일 수도 있다고 생각했습니다. 원래 세 파일을 병합하셨나요?

해보세요.

네, 세 파일을 모두 병합한 다음 섹션의 길이만 지정했습니다.
 
elibrarius #:
네, 세 가지를 모두 합친 다음 섹션의 길이를 입력하기만 하면 됩니다.

알겠습니다. 그렇다면 괜찮습니다.

샘플을 줄여서 훈련을 개선 할 수있는 가능성이 있다고 생각합니다. 예를 들어 1/10로 훈련한다고 가정하면 시장의 한 단계 / 구조를 훈련 할 수 있습니다 - 아직 필요하지 않았습니다.

 

학습 속도를 변경해야만 100점 만점에 기준을 충족하는 두 가지 모델을 얻을 수 있었습니다.

하나.

두 번째.

예, CatBoost는 많은 것을 할 수 있지만 설정을 더 적극적으로 조정할 필요가 있음이 밝혀졌습니다.

 
Aleksey Vyazmikin #:

네, 그럼 괜찮습니다.

샘플을 1/10로 줄여서 훈련을 개선할 가능성이 있다고 생각합니다. 예를 들어 시장의 한 단계 / 구조를 훈련 할 수 있습니다 - 아직 필요하지 않습니다.

1000에서 발킹 포워드와 20000에서 발킹 포워드로 훈련을 시도했지만 모든 것이 실패했습니다.
 
한 클래스에서 거래/거래하지 않나요?
아니면 매수/매도를 분리해서 가르치나요?
 
elibrarius #:
한 클래스를 거래/비거래로 가르치나요?
아니면 매수/매도를 분리해서 가르치나요?

결과는 목표 변환이 없는 샘플, 즉 예 - 거래 및 비거래에서 표시됩니다.

하지만 실제로는 매수/매도 샘플을 따로 만드는 것이 훈련하기 더 쉬울 것입니다.

elibrarius #:
1000과 20000에서 앞으로의 가치를 평가하여 학습을 시도했습니다 - 모두 배수.

흠, 이상하네요. 훈련에 어떤 방법을 사용하시나요 - 랜덤 포레스트?

 
Aleksey Vyazmikin #:

흠, 이상하네요. 훈련에 어떤 방법을 사용하나요 - 랜덤 포레스트?

알글리보우에서 재설계했습니다.
지금 더 많은 트리를 실행 중입니다. 내일 아침이면 새 버전이 계산될 것 같습니다.

아니면 결과가 당신보다 훨씬 나쁘다면 제가 뭔가 잘못했을 수도 있습니다.

사유: