트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3168

 
Vladimir Perervenko #:

블라디미르, 새 데이터에서 최대 "정직한" 아쿠라시는 어느 정도인가요?

그리고 어떤 MO 알고리즘을 사용하셨나요?

 
Aleksey Nikolayev #:

이 아이디어는 예시를 서로 다른 그룹으로 나누고 그 안에 동질성이 있는 그룹으로 나누는 것입니다. 특정 기능으로 이 작업을 수행할 수 있는지는 확실하지 않습니다. 사실, 예를 들어 비고정성 때문에 어떤 기능도 그렇게 할 수 있는지는 확실하지 않습니다.

이 기사는 제가 관심있는 주제 만 다루기 때문에 자세히 연구 할 계획이 없습니다. CHAID는 조금 더 가깝지만 완전히 동일하지는 않습니다.

시퀀스 순서 변경의 역학에서 규칙 성을 찾거나 적어도 중단 점을 식별하여 변위를 추정하고 싶습니다. 그리고 저는 사소한 이진 예측자에 대해 이야기하고 있습니다. 예를 들어, 지난 5년 동안 발생한 5개의 서열을 식별하고, 목표 값에 대한 성향의 안정성을 살펴본 다음, 서열과 성향 모두에 상당한 변화가 있는 경우 예측자를 훈련 또는 모델에서 제외합니다. 지난 반년 동안 많은 방법을 읽고 보았지만 테스트를 위해 모든 방법을 코딩하는 것은 현실적으로 불가능하고 해야 할 일이 너무 많습니다. 가장 슬픈 일은 무언가를 작업하고 나서 결과가 예상과 다르다는 것을 깨달을 때입니다.

CHAID의 장점은 무엇이라고 생각하시나요?

 

이러한 훈련 방법은 양자 세그먼트별로 샘플에서 제외(제로화)하기에 유리한 선을 탐지하는 것입니다.

각 단계는 규칙을 추가하는 것입니다. 규칙은 다음과 같습니다. if( arr_Q[n0][i]==1 || arr_Q [n1][i]==1 || arr_Q[nn][i ]==1 ) Propusk=true;

이것은 GIF입니다. 작동하려면 클릭해야 합니다.

잔액 - 핍 단위의 수익 - 다섯 자리.

예, 이것은 훈련을위한 샘플 일 뿐이며 아직 더 이상 실험을하지 않았습니다.

추가 : 그리고 여기에 신호가 제외 될 양자 세그먼트의 선택을 평가하는 또 다른 기준이 있습니다. 여기에서 수익성이없는 라인을 제거하는 것이 더 쾌활한 것 같습니다.


 
Aleksey Vyazmikin #:

시퀀스 순서 변경의 역학에서 규칙성을 찾거나 적어도 중단점을 식별하여 이동을 추정하고 싶습니다. 그리고 저는 사소한 이진 예측자에 대해 이야기하고 있습니다. 예를 들어, 지난 5년 동안 발생한 5개의 서열을 식별하고 목표 값에 대한 성향의 안정성을 살펴본 다음, 서열과 성향 모두에 상당한 변화가 있는 경우 예측자를 훈련이나 모델에서 제외하는 것입니다. 지난 반년 동안 많은 방법을 읽고 보았지만 테스트를 위해 모든 방법을 코딩하는 것은 현실적으로 불가능하고 해야 할 일이 너무 많습니다. 가장 슬픈 일은 무언가를 작업하고 나서 결과가 예상과 다르다는 것을 깨달을 때입니다.

제 생각에는 조합적인 의미에서 나쁜 접근 방식입니다. 시퀀스 세트가 너무 풍부하면 과잉 훈련으로 이어질 수 있으며, 항상 무작위로 "좋은" 시퀀스가 있을 것입니다.

알렉세이 뱌즈미킨 #:

CHAID의 장점은 무엇이라고 생각하시나요?

우선 매트스탯 관점에서의 사려 깊음입니다. 어떤 왼손 규칙 대신 특정 수준의 중요도에 도달하면 트리 구축을 중지합니다. 그리고 본페로니 보정 등을 사용하는 것도 마찬가지입니다. 물론 명목상의 기능 만 사용하는 것은 전혀 적합하지 않으므로 다른 것을 찾고 (구축하려고) 노력하고 있습니다.

 
Aleksey Vyazmikin #:

시퀀스 순서 변경의 역학에서 규칙성을 찾거나 적어도 중단점을 식별하여 이동을 추정하고 싶습니다. 그리고 저는 사소한 이진 예측자에 대해 이야기하고 있습니다. 예를 들어, 지난 5년 동안 발생한 5개의 서열을 식별하고 목표 값에 대한 성향의 안정성을 살펴본 다음, 서열과 성향 모두에 상당한 변화가 있는 경우 예측자를 훈련이나 모델에서 제외하는 것입니다. 지난 반년 동안 많은 방법을 읽고 보았지만 테스트를 위해 모든 방법을 코딩하는 것은 현실적으로 불가능하고 해야 할 일이 너무 많습니다. 가장 슬픈 일은 무언가를 작업하고 나서 결과가 예상과 다르다는 것을 깨달을 때입니다.

CHAID의 장점은 무엇이라고 생각하시나요?

1) 다음과 같은 방식으로 진행하면 (의미 측면에서) 귀하와 동일한 결과를 얻을 수 있습니까?
우리는 시트를 가져 와서 (5 분할 후) 시간별로 모든 예를 정렬하고 먼저 성장한 다음 특정 값 이상으로 떨어지면 시트를 사용에서 제거합니다.

2) 차트에 OOS가 있나요?

3) 규칙/시트는 교육 또는 검증/테스트의 데이터를 기반으로 선별됩니다.

 
Aleksey Nikolayev #:

조합적 의미에서 이는 나쁜 접근 방식입니다. 시퀀스 세트가 너무 풍부하면 과잉 훈련으로 이어질 수 있으며, 항상 무작위로 발생하는 "좋은" 시퀀스가 있을 것입니다.

여기서 문제는 안정성이 기록에 존재한다면 적어도 모델의 실제 기능 사용에서 안정성을 기대할 수 있는 이유가 있다는 것을 감지하는 것입니다. 그리고 이를 감지하는 방법은 다를 수 있습니다. 그러나 분포 추정만으로는 충분하지 않으며 안정성을 추정할 수 없습니다. 청소가 필요합니다. 그리고 한 달과 같은 간격을두면 통계적 결론을 내릴 수있는 신호가 충분하지 않다는 사실도 발견했습니다. 지금까지 나는 그것에 구두점을 넣었습니다.... 어쨌든 시간 경과에 따른 이벤트 분포를 평가하는 것이 중요합니다.

알렉세이 니콜라이 예프 #:

우선 매트 스탯 측면에서 사려 깊습니다. 이것은 어떤 왼손 규칙 대신 주어진 수준의 유의성에 도달하면 트리 구축을 중지하는 것입니다. 그리고 본페로니 보정 등을 사용하는 것도 마찬가지입니다. 이렇게 잘 생각한 모델을 보는 것은 미학적으로 즐겁습니다.) 물론 명목상의 기능 만 사용하는 것은 전혀 적합하지 않으므로 다른 것을 찾고 (구축하려고) 노력하고 있습니다.

한번 시도해 봐야겠습니다. 다른 트리 구축 옵션과 비교해 보셨나요? 결과가 정말 더 나은가요?

 
Forester #:

1) 다음과 같은 방식으로 진행하면 (의미 측면에서) 귀하와 동일한 결과를 얻을 수 있습니까?
우리는 시트를 가져 와서 (5 분할 후) 시간별로 모든 예를 정렬하고 처음에는 성장이 있고 일정 값 이상으로 떨어지면 시트를 사용에서 삭제합니다.

2) 차트에 OOS가 있나요?

3) 규칙/시트는 교육 또는 검증/테스트의 데이터를 기반으로 선별됩니다.

1) 거부는 정상이며, 여기서 문제는 우리가 말하는 시트인 경우 주기성입니다(저는 양자 세그먼트가 있습니다 - 말 그대로 두 개의 분할 F>=X1 && F<X2로 이루어진 시트). 즉, 0에 가까운 진동이라면 나쁘지는 않지만 한 방향으로 매우 높으면 안됩니다 (추정을 위해 10 개의 샘플 간격을 취합니다). 또는 문자 그대로, 당신이 쓰는 것처럼 처음에는 성장이 있었고 대부분 감소했습니다. 이것은 즉시 쓰레기통에 있습니다. 그러나 이것은 모두 잎에 관한 것이며, 양자 섹션의 경우 초기 선택 기준 중 하나로서 클래스의 평균 5 %에서 확률 편향에 의한 선택이 있습니다.

2. 물론 아니오, 나는 이것이 훈련 샘플이라고 썼습니다. 모델 자체에 대한 훈련은 없습니다 - 훈련해야 할 것이 더 있다고 가정합니다.

3. 예제의 훈련에서. 그러나 스크리닝이 아니라 필터로 사용할 필터를 선택하는 것, 즉 모델의 응답을 0으로 만드는 것만 선택합니다. 글쎄, 그리고 훈련에서 문자열 / 예제를 제외하십시오.

그리고 일반적으로 안정적인 양자 세그먼트 (고려-바이너리 예측자)를 식별하는 데 초점을 맞추면 이러한 "모델"은 분류기에 의한 훈련없이 작동합니다. 그리고 그것이 할 수없는 한 분류기를 사용하는 것은별로 의미가 없습니다. 물론 아무도 무작위성을 취소하지 않으며 성공적인 모델을 찾을 수 있지만 그러한 방법을 합리적으로 고려하기는 어려울 것입니다.

이 방법의 단점 중 하나는 리콜의 하락이지만, 예시에서는 약 0.5로 CatBoost 모델보다 강하지는 않습니다.

 
Aleksey Vyazmikin #:

다른 트리 구축 옵션과 비교해 보셨는지, 그 결과가 정말 더 나은가요?

기성품 형태로 찾은 것은 시장에 적합하지 않으며 수제 제품은 준비가되지 않았습니다. 그러나 나는 많은 희망을 가지고 있지 않으므로 서두르지 않습니다.

 

이런 일이 일어납니다. 왼쪽에는 OOS 패스가, 오른쪽에는 그렇지 않습니다. 그리고 오른쪽은 말 그대로 바로 다이빙합니다.


대부분의 경우 발생합니다.

즉, 말 그대로 즉시 중요한 다이빙입니다. 다이빙의 성격은 불분명합니다. SB에 가까운 무언가가 있어야 할 것 같지만 그런 그림을 너무 자주 봅니다.


최적화 후 역 TS를 실행하면 잃지 않을 수도 있다고 생각합니다.

 
fxsaber #:

이런 일이 일어납니다. 왼쪽에는 OOS 패스가 있고 오른쪽에는 그렇지 않습니다. 그리고 오른쪽에서는 말 그대로 즉시 "다이빙"합니다.


대부분의 경우 이런 일이 발생합니다.

즉, 말 그대로 즉시 중요한 다이빙입니다. 다이빙의 성격이 불분명합니다. SB에 가까운 것이어야한다고 생각하지만 그런 그림을 너무 자주 봅니다.


최적화 후 반전 된 TS를 실행하면 잃지 않을 수도있는 것 같습니다.

약 2 년 전에이 효과를 여기에 게시했습니다.
사유: