트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1278

 
도서관 :

Maxim이 찾은 순열과 유사한 것. 그러나 값이 0.1에서 0.2로 변경되는 예측 변수 대신 예측 변수를 800에서 300000으로 변경하는 것이 의미가 있습니까? 아니다!

그러나 그것의 라인을 혼합하기 위해 - 그것은 가지고 있습니다. 숫자의 범위와 확률 분포는 유지되지만 각 예의 값은 무작위가 됩니다.

예, 정말 뭔가처럼 보입니다. 아마도이 아이디어가 떠올랐을 것입니다. 라인의 각 예측 변수에는 자체 지표가 있기 때문에 예측 변수를 변경하는 것이 어떤 문제인지 이해하지 못했습니다. 게다가 이러한 값의 분석 그리드를 어떻게든 저장해야 합니다(이는 0.1 0.2 0.3 또는 기타의 균일한 단계 - 가능한 경우 트리 구축 알고리즘이 실행 중일 때와 같이 다른 모델 빌더에 대한 옵션이 있습니다.

또한 전체 샘플이 아니라 이전 시트가 활성화된 라인을 확인하여 정확도 데이터를 비교할 수 있도록 하는 것도 중요합니다. 샘플을 미리 필터링해야 합니다(각각 다른 잎에 대한 평가를 위해 다른 여과).

 
알렉세이 비아즈미킨 :

예, 정말 뭔가처럼 보입니다. 아마도이 아이디어가 떠올랐을 것입니다. 라인의 각 예측 변수에는 자체 지표가 있기 때문에 예측 변수를 변경하는 것이 어떤 문제인지 이해하지 못했습니다. 게다가 이러한 값의 분류 그리드를 어떻게든 저장해야 합니다(이는 0.1 0.2 0.3 또는 기타의 균일한 단계 - 가능한 경우 트리 구축 알고리즘이 실행 중일 때와 같이 다른 모델 빌더에 대한 옵션이 있습니다.

음, 최대값이 0.2인 예측 변수 대신 800에서 300000 사이의 값을 가진 다른 예측 변수의 값으로 대체하시겠습니까? 그리고 그는 항상 올바른 가지로 갈 것입니다. 그리고 오른쪽과 왼쪽 가지를 모두 확인해야 합니다.
정규화는 범위 내에서 유지하는 데 도움이 되지만 확률 분포 가 다를 수 있으므로 결과적으로 오른쪽 분기가 왼쪽 분기보다 더 자주 작동하거나 그 반대의 경우도 마찬가지입니다.
또는 나는 당신의 생각을 이해하지 못했고 우리는 다른 것에 대해 이야기하고 있습니다.

알렉세이 비아즈미킨 :

또한 전체 샘플이 아니라 이전 시트가 활성화된 라인을 확인하여 정확도 데이터를 비교할 수 있도록 하는 것도 중요합니다. 샘플을 미리 필터링해야 합니다(각각 다른 잎에 대한 평가를 위해 다른 여과).

예측자를 제거하고 데이터를 분리하는 노드를 버립니다(별도의 시트가 그것과 무슨 관계가 있습니까?). 각 노드를 폐기할 때 2개의 분기를 확인해야 합니다. 10개의 노드를 버리면 11개의 잎이 답인 11개의 옵션(하위 트리)을 얻습니다. 이것은 평균화되어야 하며, 섞인 열로 전체 샘플을 실행하면 트리/포리스트의 총 오류 변화에서 대략 이 값이 표시됩니다.
순열에 대한 기사를 읽으십시오. 모든 것이 거기에 자세히 설명되어 있습니다.

 
도서관 :

음, 최대값이 0.2인 예측 변수 대신 800에서 300000 사이의 값을 가진 다른 예측 변수의 값으로 대체하시겠습니까? 그리고 그는 항상 올바른 가지로 갈 것입니다. 그리고 오른쪽과 왼쪽 가지를 모두 확인해야 합니다.
정규화는 범위 내에서 유지하는 데 도움이 되지만 확률 분포가 다를 수 있으므로 결과적으로 오른쪽 분기가 왼쪽 분기보다 더 자주 작동하거나 그 반대의 경우도 마찬가지입니다.
또는 나는 당신의 생각을 이해하지 못했고 우리는 다른 것에 대해 이야기하고 있습니다.

예측자를 제거하고 데이터를 분리하는 노드를 버립니다(별도의 시트가 그것과 무슨 관계가 있습니까?). 각 노드를 폐기할 때 2개의 분기를 확인해야 합니다. 10개의 노드를 버리면 11개의 잎이 답인 11개의 옵션이 생깁니다. 이것은 평균화되어야 하며, 섞인 열로 전체 샘플을 실행하면 트리/포리스트의 총 오류 변화에서 대략 이 값이 표시됩니다.
순열에 대한 기사를 읽으십시오. 모든 것이 거기에 자세히 설명되어 있습니다.

내 방법은 순열이 아니므로 재현할 수 없습니다.

나는 잎이 이미 완성된 규칙 - 일종의 관찰의 표시이며 나무 구조 없이 이미 존재할 수 있다는 다른 말을 하고 있습니다. 트리는 관찰에서 규칙을 생성하는 도구입니다.

물론 일부 예측 변수가 샘플의 동일한 부분에서 변경된 리프 규칙을 완전히 작동하지 않게 할 것이라는 데 동의하지만 목표는 최상의 아날로그를 찾고 그것과만 비교하는 것이기 때문에 문제가 되지 않습니다. 샘플을 분할하는 예측 변수 중 일부가 손실되는 것은 정상이지만 일반적으로 단일 예측 변수에 대한 일련의 값에만 관련됩니다. 예를 들어 A>3 && B<1 && C>=20이라는 3개의 예측 변수 시트가 있고 시트의 규칙에 아직 포함되지 않은 예측 변수 D와 E가 있습니다. 각 예측 변수를 다음에서 제거해야 합니다. 먼저 A를 돌리고 예측 변수 값을 분할하는 그리드 단계와 다른 부등식 기호로 D와 E로 교체하면서 원본이 활성화된 동일한 샘플 영역에서 각각의 새로운 규칙을 확인하고 각각에 대한 분류 정확도 통계를 얻습니다. 규칙. 따라서 가장 좋은 방법은 이미 원본과 비교하고 이 비교를 평가하는 것입니다. 모든 잎에 대해 이 작업을 수행합니다. 동시에 중복된 잎은 제외합니다. 트리의 결과를 일련의 규칙으로 평가하는 것이 아니라 시트에 나와 있는 각 규칙을 다른 규칙과 별도로 평가하는 것이 중요합니다.

탐욕의 원리에 따라 트리를 구축하기 위한 예측자의 중요성이 아니라, 모델이 제안하는 규칙(리프)의 안정성에 대한 예측자의 중요성을 판단하려고 합니다.
 
알렉세이 비아즈미킨 :

내 방법은 순열이 아니므로 재현할 수 없습니다.

나는 잎이 이미 완성된 규칙 - 일종의 관찰의 표시이며 나무 구조 없이 이미 존재할 수 있다는 다른 말을 하고 있습니다. 트리는 관찰에서 규칙을 생성하는 도구입니다.

물론 일부 예측 변수가 샘플의 동일한 부분에서 변경된 리프 규칙을 완전히 작동하지 않게 할 것이라는 데 동의하지만 목표는 최상의 아날로그를 찾고 그것과만 비교하는 것이기 때문에 문제가 되지 않습니다. 샘플을 분할하는 예측 변수 중 일부가 손실되는 것은 정상이지만 일반적으로 단일 예측 변수에 대한 일련의 값에만 관련됩니다. 예를 들어 A>3 && B<1 && C>=20이라는 3개의 예측 변수 시트가 있고 시트의 규칙에 아직 포함되지 않은 예측 변수 D와 E가 있습니다. 각 예측 변수를 다음에서 제거해야 합니다. 먼저 A를 돌리고 예측 변수 값을 분할하는 그리드 단계와 다른 부등식 기호로 D와 E로 교체하면서 원본이 활성화된 동일한 샘플 영역에서 각각의 새로운 규칙을 확인하고 각각에 대한 분류 정확도 통계를 얻습니다. 규칙. 따라서 가장 좋은 방법은 이미 원본과 비교하고 이 비교를 평가하는 것입니다. 모든 잎에 대해 이 작업을 수행합니다. 동시에 중복된 잎은 제외합니다. 트리의 결과를 일련의 규칙으로 평가하는 것이 아니라 시트에 나와 있는 각 규칙을 다른 규칙과 별도로 평가하는 것이 중요합니다.

탐욕의 원리에 따라 트리를 구축하기 위한 예측자의 중요성이 아니라, 모델이 제안하는 규칙(리프)의 안정성에 대한 예측자의 중요성을 판단하려고 합니다.
저는 현재 숲에서 일하고 있습니다. 따라서 MO의 방향으로 - 무엇을 해야할지 더 잘 알고 있습니다)
 
도서관 :
저는 현재 숲에서 일하고 있습니다. 따라서 MO의 방향으로 - 무엇을 해야할지 더 잘 알고 있습니다)

그래서 모두가 자신에 대해 이야기하고 있음이 밝혀졌습니다. :)

말해봐, 동일한 Alglib에서 고유한 예측 값으로만 또는 최소한 고유한 분할을 사용하여 포리스트를 구축할 가능성을 구현할 수 있습니까? 물론 더 적은 수의 트리가 있지만 실수/정답을 복제하지 않으므로 아이디어에 따르면 교육 샘플 외부에서 더 큰 신뢰성을 제공해야 합니다.

 
알렉세이 비아즈미킨 :

말해봐, 동일한 Alglib에서 고유한 예측 값으로만 또는 최소한 고유한 분할을 사용하여 포리스트를 구축할 가능성을 구현할 수 있습니까? 물론 더 적은 수의 트리가 있지만 실수/정답을 복제하지 않으므로 아이디어에 따르면 교육 샘플 외부에서 더 큰 신뢰성을 제공해야 합니다.

틀림없이. MQL - 다른 언어와 마찬가지로 무엇이든 프로그래밍할 수 있습니다. 그리고 Alglib은 당신의 아이디어에 맞게 인식할 수 없을 정도로 삽질될 수 있습니다.

 
도서관 :

틀림없이. MQL - 다른 언어와 마찬가지로 무엇이든 프로그래밍할 수 있습니다. 그리고 Alglib은 당신의 아이디어에 맞게 인식할 수 없을 정도로 삽질될 수 있습니다.

"진짜"라는 단어에 "얼마나 간단한지"를 넣었습니다 ...

그러나 대답에서 나는 기분을 이해했습니다. 감사합니다. 귀찮게하지 않을 것입니다.

 
알렉세이 비아즈미킨 :

"진짜"라는 단어에 "얼마나 간단한지"를 넣었습니다 ...

그러나 대답에서 나는 기분을 이해했습니다. 감사합니다. 귀찮게하지 않을 것입니다.

물론 어렵습니다.
그러나 베이스는 트리 구성 함수의 형태입니다. 여기 있으며 귀하의 재량에 따라 변경할 수 있습니다.
 
도서관 :
물론 어렵습니다.
그러나 베이스는 트리 구성 함수의 형태입니다. 여기 있으며 귀하의 재량에 따라 변경할 수 있습니다.

답변 해주셔서 감사합니다. 당신은 코드에 정통합니다. 트리 구축 알고리즘이 개선된 공개 릴리스를 계획하지 않습니까? 나무 깊이 또는 상당한 수의 규칙 관찰에 대한 기본 제공 가지치기와 같은 것도 매우 도움이 될 것입니다. 나는 Alglib을 직접 사용하지는 않았지만 매우 유용하다고 생각하는 사람들이 있습니다.

 
알렉세이 비아즈미킨 :

답변 해주셔서 감사합니다. 당신은 코드에 정통합니다. 트리 구축 알고리즘이 개선된 공개 릴리스를 계획하지 않습니까? 나무 깊이 또는 상당한 수의 규칙 관찰에 대한 기본 제공 가지치기와 같은 것도 매우 도움이 될 것입니다. 나는 Alglib을 직접 사용하지는 않았지만 매우 유용하다고 생각하는 사람들이 있습니다.

이해하는 것과 릴리스를 만드는 것은 다른 것입니다. 아직 실험 중입니다. 이제 예측 변수를 혼합하고 있습니다. 소음에 대처하지 못해서 국회를 포기했듯 버릴지도 모르겠다.

그리고 그것을 알아내는 것은 쉽습니다. 몇 시간 동안 코드를 볼 필요가 있으며 모든 것이 명확해질 것입니다.