트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3012

 
Maxim Dmitrievsky #:

제 생각에는 여전히 아무도 이해하지 못합니다.)

그는 Occam의 면도기 원리에 따라 말없이 간단하게 모든 것을 명확하게 설명했습니다.

아니요, 제가 스레드에 와서 나무에서 규칙을 추려 내고 평가하는 것에 대해 이야기하기 시작했을 때 그 아이디어를 비웃었을뿐입니다.

이제 다음 단계인 예측자의 양자 세그먼트 평가를 통해 잠재적으로 고품질의 규칙을 만들 수 있는 조건을 만들었는데, 또다시 완전히 오해에 직면했습니다.

 
СанСаныч Фоменко #:

몇 번 글을 썼습니다.

여기서는 같은 말을 백 번도 더 해야 들리죠.

 
Aleksey Vyazmikin #:

아니요, 제가 스레드에 와서 나무에서 규칙을 추려내고 평가하는 것에 대해 이야기하기 시작했을 때 그 아이디어를 비웃으셨을 뿐입니다.

이제 다음 단계인 예측자의 양자 섹션 추정을 통해 잠재적으로 고품질의 규칙을 생성할 수 있는 조건을 만들었는데, 또다시 완전히 오해에 직면했습니다.

나무에서 규칙을 뽑아내는 것만으로는 만족할 수 없나요? 이론적으로는 운의 문제이기도 하지만, 그 (규칙) 숫자를 희생하면 무언가를 찾을 수 있습니다.

최적화 프로그램에서 전략 매개변수를 검색하는 것과 거의 같지만 좀 더 우아한 방식입니다.
 
Maxim Dmitrievsky #:

나무에서 규칙을 뽑아내는 것만으로는 만족스럽지 않으셨나요?

이 방법은 후속 환생과 함께 규칙의 추가 수명에 대한 확실성이 없다는 사실을 제외하고는 꽤 좋은 것으로 판명되었습니다. 긴 간격으로 선택한 규칙의 50% 이상이 긍정적 인 성능 결과를 보여주었습니다.

저는 유전자 트리를 사용했는데, 샘플에 많은 예측자가 포함되어 있으면 속도가 매우 느립니다.

그래서 저는 훈련을 위해 트리에 공급되는 정보의 양을 줄이는 방법을 찾기로 결정했습니다. 잠재적으로 유용한 데이터를 강조하는 방법을 찾기 시작했습니다.

또 다른 문제는 잎/규칙의 활성화 지점이 매우 유사하다는 점입니다. 그리고 잎 기반이 커지면서 고유성을 찾기가 어려웠습니다.

결과적으로 디자인은 흥미롭고 개선해야 할 점이 있지만 제 경우에는 매우 느렸습니다. 일반적으로 실험에는 적합하지 않지만 TC 구성 장치의 전체 개념이 준비되면 구현에는 흥미 롭습니다.

그리고 물론-R을 모르고 현지 전문가에게 물어 보았지만 아무도 내 작업을 해결하는 데 도움을 줄 수 없었습니다.

이제 샘플링 및 루트 예측자 (목록 별)의 강제 선택과 이미 사용 된 예측자의 차단을 추가합니다.

 
Aleksey Vyazmikin #:

이 방법은 후속 환생과 함께 규칙의 추가 수명에 대한 확실성이 없다는 사실을 제외하고는 꽤 좋은 것으로 판명되었습니다. 긴 간격으로 선택한 규칙의 50% 이상이 긍정적인 성능 결과를 보였습니다.

저는 유전자 트리를 사용했는데, 샘플에 많은 예측자가 포함되어 있는 경우 매우 느립니다.

그래서 저는 훈련을 위해 트리에 공급되는 정보의 양을 줄이는 방법을 찾기로 결정했습니다. 그래서 잠재적으로 유용한 데이터를 선별할 수 있는 방법을 찾기 시작했습니다.

또 다른 문제는 잎/규칙의 활성화 지점이 매우 유사하다는 점입니다. 그리고 잎 기반이 커질수록 고유성을 찾기가 어려웠습니다.

결과적으로 디자인은 흥미롭고 개선해야 할 점이 있지만 제 경우에는 매우 느렸습니다. 일반적으로 실험에는 적합하지 않지만 TC 구성 장치의 전체 개념이 준비되면 구현에는 흥미 롭습니다.

그리고 물론-R을 모르고 현지 전문가에게 물어 보았지만 아무도 내 문제를 해결하는 데 도움을 줄 수 없었습니다.

이제 샘플링 및 루트 예측자 (목록 별)의 강제 선택과 이미 사용 된 예측자의 차단을 추가합니다.

캣버스트와 무슨 관련이 있나요? 캣버스트가 왜 필요한가요, 거기서 규칙도 가져오나요?

단순한 트리를 가지고 규칙에 따라 루트에서 상단으로 이동하여 복잡한 규칙에 더 적은 가중치를 부여하는 것은 어떻습니까 (규칙 복잡성에 대한 페널티)?

새로운 데이터에 대해 테스터에서 각 규칙을 실행하여 큰 오류가 있는 규칙은 미리 버리세요.

ZY, 저는 여전히 이 접근 방식이 직관적으로 마음에 들지 않는데 그 이유를 아직 파악하지 못했습니다.
 
Aleksey Vyazmikin #:

물론 저는 R을 모릅니다,

1년 넘게 그 말을 들어왔어요.

R은 일주일이면 배울 수 있습니다.

 
Maxim Dmitrievsky #:

캣버스트와 무슨 관련이 있나요? 캣버스트가 왜 필요한가요, 규칙도 거기서 얻나요?

캣부스트는 애초에 아이디어의 방향이 올바른지 확인하는 데 매우 빠른 속도입니다.

첫 번째 트리에서 규칙을 가져올 수는 있지만, 물론 평균적으로 훨씬 약하기 때문에(좋은 규칙도 있지만 아주 드물게) 지금은 이 아이디어를 남겨두었습니다. 이제 트리를 만드는 다른 방법이 있으며 아마도 규칙이 더 강력 할 수 있지만 파이썬 없이는 이러한 모델로 MQL5에서 작업 할 가능성이 없습니다.

그리고 일반적으로 생성 속도가 느리지 만 잎을 선택하는 데 사용 된 것과 동일한 검사를 사용하여 모델을 구축하는 방법에 대한 저만의 아이디어가 있습니다. 언젠가는 코드에서 구현할 수있을 것입니다.

 
Maxim Dmitrievsky #:

단순한 트리를 가지고 규칙에 따라 뿌리에서 꼭대기까지 이동하여 복잡한 규칙에 가중치를 적게 부여하는 것은 어떨까요(규칙 복잡성에 대한 페널티)?

새로운 데이터에 대해 테스터에서 각 규칙을 실행하여 큰 오류가 있는 규칙을 미리 버리는 것은 어떨까요?

ZY, 저는 여전히 이 접근 방식이 직관적으로 마음에 들지 않는데, 그 이유를 아직 파악하지 못했습니다.

차이점은 본질적으로 모델을 적용할 때 데이터의 양과 CPU 부하에만 있습니다.

게다가 나뭇잎은 가중치를 그룹화하고 분배하여 앙상블하기가 더 쉽습니다 (나는 그것을 식물 표본 상자라고 불렀습니다 :) ).

규칙을 만드는 데 많은 트리가 사용되므로 신호가 겹치는데, 이는 하나의 트리에서는 그렇지 않다는 것을 의미합니다.

 
mytarmailS #:

이 얘기는 1년 넘게 들었습니다.

R은 일주일이면 배울 수 있습니다.

분명히 모든 사람이 그렇게 재능이 있는 것은 아닙니다.

그리고 코드는 간단하지 않습니다. 다시 시도했지만 인터넷에 문제를 해결할 수있는 정보가 충분하지 않았습니다.

R의 또 다른 단점은 컴퓨터 간 계산을 병렬화하는 간단한 솔루션이 없다는 것입니다.

 
Aleksey Vyazmikin #:

기본적으로 모델을 적용할 때 데이터의 양과 CPU 부하만 차이가 있을 뿐입니다.

게다가 나뭇잎은 앙상블하기가 더 쉽고 그룹으로 모이고 가중치를 분배합니다 (나는 그것을 식물 표본 상자라고 불렀습니다 :) ).

많은 트리가 규칙을 만드는 데 사용되므로 신호가 겹치는데, 이는 하나의 트리에서는 그렇지 않다는 것을 의미합니다.

연관성(예: 규칙) != 인과관계이기 때문에 제가 이 아이디어를 싫어하는 이유를 깨달았습니다.)

사유: