트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3024

 
Maxim Dmitrievsky #:

나는 잎을 선택할 수있는 나무가있는 파이썬으로이 모자를 만들 것을 제안하고, 콜라브에서 데이터 세트를 그 안에 넣을 수 있습니다.

더 나은 / 더 나쁜 아이디어, 최고 만 취하는 규칙 또는 일부 필터를 통해 아이디어가 있으면 제안하십시오.

하나의 데이터 세트를 두 가지 접근 방식을 통해 실행하여 비교하고 싶습니다. 그러면 무엇이 무엇인지 이해할 수 있을 것입니다.)

흥미로운 아이디어입니다!

우선, 우리는 어떤 트리 구현이 잎의 규칙을 쉽게 꺼내어 더 작업 할 수 있는지 이해해야합니다.

그런 다음 나무를 만드는 방법-탐욕 스럽거나 유전 적입니다. 나는 모든 개체군의 나무 잎을 확인했습니다 (내가 제대로 얻지 못했다면 :)).

물론 유전학 대신 숲을 사용할 수 있지만 잎을 검색하려면 더 많은 나무가 필요하고 전체 샘플에서 잎의 예제 비율로 가지 치기를해야합니다. 포리스트 트리는 유전학보다 더 빠를 수 있으며 설정이 더 적을 수 있습니다.

새 잎을 생성하는 과정은 필요한 (지정된) 수의 선택된 잎에 도달할 때까지 수행해야 합니다.

이 경우 트리를 구축하기 전에 두 가지 유형의 샘플로 구성된 무작위 하위 샘플을 생성해야 하는데, 첫 번째는 훈련 샘플의 백분율로 지정된 크기의 연속적인 균일한 간격에서 N개의 부분을 선택하는 것이고 두 번째는 완전히 무작위로 얻은 하위 샘플입니다.

트리를 구성하는 데 사용되는 무작위 예측자 집합입니다.

모든 데이터에 대한 전처리에 대해서는 더 많은 고려가 필요합니다.

잎을 평가하는 기준 - 나중에 추가할 수도 있지만, 요점은 메트릭에 임계값이 설정되어 있다는 것입니다. 어떤 메트릭이 있는지 모르겠고 어떤 메트릭을 사용했는지 기억이 나지 않아서 코드를 파싱해야 합니다. 균형, 기대 행렬 및 복구 계수를 사용할 수 있습니다.

전체 훈련 샘플의 각 간격에서 추정이 이루어져야 하며, 간격 수는 설정됩니다. 어떤 간격에서든 필요한 기준에 도달하지 못하면 잎은 보관되거나 폐기됩니다. 다시 확인하지 않도록 중복을 제거하여 나뭇잎 데이터베이스를 보관합니다.

잎을 선택한 후에는 유사성별로 그룹화해야 하며, 순위 상관관계가 올바르게 작동할 수도 있습니다. 그런 다음 그룹 내에서 가중치를 분배하고 그룹에 대한 투표 규칙을 결정합니다. 그러나 그것은 이미 너무 많을 수 있으며 적어도 지금까지 새로운 데이터에 효과적인 잎을 선택하는 방법을 배우는 것이 좋습니다.


어떤 샘플을 가지고 실험을 할 것인지, 제가 제공할 샘플과 무작위로 생성할 샘플 중 어떤 샘플을 사용할 것인지 잘 모르겠습니다.

어쨌든 방법을 비교하려면 샘플이 동일하고 큰 시간 간격이어야하므로 주기성이 아니라면 대규모 TF에서 다른 시장 단계의 추세를 고려할 수 있습니다.

제가 사용한 방법이 매우 느리다고 한 번에 말씀 드리겠습니다. 아마도 MQL5에서 리프 평가 프로세스를 수행하는 것이 더 낫습니다. 코어에 부하를 분산시킬 수 있습니다.

 
Aleksey Vyazmikin #:

흥미로운 아이디어입니다!

지금은 트리에 간단한 예제를 스케치하고 즉시 테스트한 다음 원하는 대로 확장해 보겠습니다.

모든 데이터 세트에서 Google 디스크를 통해 아무것도 설치하지 않고 다운로드하여 테스트 할 수 있습니다.

빨리 작동하길 원합니다.)
 
Maxim Dmitrievsky #:

한 번에 테스트할 수 있도록 트리에 간단한 예제를 스케치한 다음 원하는 대로 확장해 보겠습니다.

모든 데이터 세트에서 Google 디스크를 통해 아무것도 설치하지 않고 다운로드하여 테스트 할 수 있습니다.

빨리 작동하길 원합니다)

좋아요-가장 중요한 것은 시작하는 것입니다! :)

 
Maxim Dmitrievsky #:

더 이상 재미없습니다.

"재미없다"와 무슨 관련이 있나요?

샘플에서 벗어난 것이 있나요?

 
СанСаныч Фоменко #:

"재미있다"는 것과 무슨 관련이 있나요?

샘플을 벗어난 것이 있나요?

그리고 만약

 
Maxim Dmitrievsky #:

그리고 만약 내가

"만약"이라는 단어는 없습니다. 이것은 판단의 기준입니다. 표본을 벗어난 추정치가 없는 추정치는 흥미롭지 않습니다.

 
Maxim Dmitrievsky #:

그리고 만약 내가

10주기 OOS 전진 및 후진 그래프를 만듭니다.

 
СанСаныч Фоменко #:

"만약"과는 아무런 관련이 없습니다. 그것은 판단의 기준입니다. 표본 외 평가가 없는 평가는 흥미롭지 않습니다.

자, 이제 그만 웃으세요.
 
Valeriy Yastremskiy #:

10주기 OOS 앞뒤 그래프를 만듭니다.

100년입니다.
 
Maxim Dmitrievsky #:
그만 웃으세요.

지금 이집트인에게 말하는 건가요 아니면 저에게 말하는 건가요?

이 주제에 대한 귀하의 활동에 매우 만족합니다.

사유: