트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3370

 
Bogard_11 #:

패턴(일명 모델)은 단 하나뿐입니다. 어떤 움직임이든 ABC로 단순화하면 패턴의 모든 행렬 비율을 찾을 수 있습니다. 머신러닝 없이도 이 모든 것을 손으로 쉽게 계산할 수 있습니다. 라녹은 학교에서 배우는 대수학이나 기하학 수업보다 더 복잡하지 않습니다.

예를 들어 나무 모델의 패턴은 많은 모델이 있는 나무입니다. 예를 들어 각 나무 모델, 예를 들어 CatBoost는 백 개가 넘는 나무를 찾아 패턴을 읽습니다. 랜덤포레스트의 경우 50그루까지는 분류 오류가 떨어지고 150그루 이상에서는 분류 오류가 안정적이라는 통계가 있습니다. 즉, 제가 처리한 시계열에서 패턴의 수가 150개를 넘지 않습니다.

 
СанСаныч Фоменко #:

예를 들어 나무 모델에서 패턴은 많은 모델이 있는 나무입니다. 예를 들어 각 나무 모델에서 CatBoost는 100개 이상의 나무를 찾아 패턴을 읽습니다. 랜덤포레스트의 경우 50그루까지는 분류 오류가 감소하고 150그루 이상에서는 분류 오류가 안정적이라는 통계가 있습니다. 즉, 제가 처리한 시계열에서 패턴의 수가 150개를 넘지 않습니다.

이제 이 150개의 패턴을 하나의 공통 패턴으로 정형화하는 작업만 조금 남았습니다. A가 있고 B가 있다면 C는 이런 오리에서 특정 시간에 올 것이고, 그렇지 않다면 시간과 시점이 달라질 것입니다. C의 개발에는 세 가지 변형 만 있습니다. 모든 것은 시간에 의해 결정됩니다! 그리고 이것은 먼저 손으로 쉽게 해결할 수 있으며 원하는 경우 로봇에 넣을 수 있습니다.

추신 - A의 크기는 이미 B의 풀백에 대해 특정 수준을 제공 할뿐만 아니라 (매우 자주 백래시가 1-3 점을 초과하지 않음). 마찬가지로 B는 C의 가격 수준에 대해 미리 신호를 보냅니다. 모든 곳에 많은 수학이 있습니다.

예를 들어 수동 전문가 어드바이저는 관심 있는 움직임에서 레벨을 자동으로 계산합니다. 즉, 원하는 파동을 당기면 미래가 이미 표시되어 있습니다.

파일:
 
СанСаныч Фоменко #:

예를 들어 나무 모델에서 패턴은 많은 모델이 있는 나무입니다. 예를 들어, 각 나무 모델에서 CatBoost는 100개 이상의 나무를 찾아 패턴을 읽습니다. 랜덤포레스트의 경우 50그루까지는 분류 오류가 감소하고 150그루 이상에서는 분류 오류가 안정적이라는 통계가 있습니다. 즉, 제가 처리한 시계열에서 패턴의 수가 150개를 넘지 않습니다.

오히려 응답이 거래 개시 임계값을 초과하는 모든 리프의 경로가 패턴입니다.
예를 들어:
1차 분할: 40 바 델타, 현재 = 0,
2차 분할: 30 바 = 100,
3차 분할: 20 바 = 50,
4차 분할: 10 바 100,
5차 분할: 1 바 = 0.
저점이 있는 2개의 고점입니다. 패턴인가요? 예. 하나의 나뭇잎에 대한 경로가 이를 설명합니다.

트리에 거래하는 임계값을 초과하는 나뭇잎이 20개 있다면 트리에 사용하는 패턴이 20개 있는 것입니다. 성공률이 낮은 나뭇잎 - 역시 패턴을 설명하지만 무작위/손실입니다.
다른 100개의 트리는 분할 값이 다른 다른 칩/바를 사용할 수 있습니다.
숲은 모든 나무의 답을 평균(더하고 나무의 수로 나눈 값)하여 상황에 대한 평균 의견을 얻습니다.
부스트는 단순히 가중치/명확화 계수로 추가합니다.

 
Bogard_11 #:

이 150가지 패턴을 하나의 공통 패턴으로 공식화하는 작업만조금 남았습니다. A가 있고 B가 있다면 C는 이런저런 오리에서 특정 시점에 올 것이고, 그렇지 않다면 시점과 시점이 달라질 것입니다. C의 발달에는 세 가지 변형이 있을 뿐입니다. 모든 것은 시간에 의해 결정됩니다! 그리고 이것은 먼저 손으로 쉽게 해결할 수 있으며 원하는 경우 로봇에 넣을 수 있습니다.

추신 - A의 크기는 이미 B의 풀백에 대해 특정 수준을 제공 할뿐만 아니라 (매우 자주 백래시가 1-3 점을 초과하지 않음). 같은 방식으로 B는 C의 가격 수준에 대해 미리 신호를 보냅니다. 모든 곳에 많은 수학이 있습니다.

예를 들어 수동 전문가 어드바이저는 관심 있는 움직임에서 레벨을 자동으로 계산합니다. 즉, 원하는 파동을 당기면 미래가 이미 표시되어 있습니다.

아무것도 공식화할 필요가 없습니다. 모든 것이 자동으로 이루어집니다.

 
Forester #:

그보다는 거래 개시 임계값을 초과하는 모든 시트의 경로가 패턴입니다.
예를 들어:
1차 분할: 40 바 델타, 현재 = 0,
2차 분할: 30 바 = 100,
3차 분할: 20 바 = 50,
4차 분할: 10 바 100,
5차 분할: 1 바 = 0.
저점이 있는 2개의 고점입니다. 패턴인가요? 예. 하나의 나뭇잎에 대한 경로가 이를 설명합니다.

트리에 거래하는 임계값을 초과하는 나뭇잎이 20개 있다면 트리에 사용하는 패턴이 20개 있는 것입니다. 성공률이 낮은 나뭇잎 - 역시 패턴을 설명하지만 무작위/손실입니다.
다른 100개의 트리는 분할 값이 다른 다른 칩/바를 사용할 수 있습니다.
숲은 모든 나무의 답을 평균(더하고 나무의 수로 나눈 값)하여 상황에 대한 평균 의견을 얻습니다.
부스트는 단순히 가중치/명확화 계수로 추가합니다.

나무는 나무이고 제 기억으로는 인쇄할 수도 있습니다.

반면에 나뭇잎은 암흑 물질입니다. 알고리즘이 디자이너의 펜과 함께 분류 오류와 편견 사이의 균형을 찾는 것은 나뭇잎 수준에서입니다. 트리를 너무 깊게 설정하면 입력 집합을 정확하게 설명할 수 있습니다(과훈련 또는 과적합). 문제는 입력 집합을 알 수 없는 미래에서 최소한의 오류로 분류하는 것입니다. 물론 유한하지만, 정확히 "유한"이 아니라 근사치여야 합니다. 따라서 패턴은 트리입니다.

 
СанСаныч Фоменко #:

제 기억으로는 나무는 나무이고 인쇄도 가능한 것으로 알고 있습니다.

하지만 나뭇잎의 문제는 어둡습니다. 알고리즘이 디자이너의 펜과 함께 분류 오류와 편향 사이의 균형을 찾는 것은 잎 수준에서입니다. 트리를 너무 깊게 설정하여 입력 세트를 정확하게 설명하는 것이 가능합니다(과훈련 또는 과적합). 문제는 입력 집합을 알 수 없는 미래에서 최소한의 오류로 분류하는 것입니다. 물론 유한하지만, 정확히 "유한"이 아니라 근사치여야 합니다. 따라서 패턴은 트리입니다.

저는 동의하지 않습니다. 저는 깊이가 5인 나뭇잎의 예를 들었습니다(이 나뭇잎은 5개의 분할을 통해 얻어지며 패턴입니다). 200개의 분할을 통해 잎을 얻으면 새로운 데이터에서 성능이 저하되는 과도하게 훈련된 패턴이 됩니다. 하지만 패턴이 되는 것을 멈추지는 않습니다. 트리는 패턴의 집합입니다.

 
Forester #:

동의하지 않습니다. 5개의 깊이 시트를 예로 들었습니다(이 시트는 5개의 분할을 통해 얻어지며 패턴입니다). 200개의 분할을 통해 시트를 얻으면 새로운 데이터에서 성능이 떨어지는 재학습된 패턴을 얻을 수 있습니다. 하지만 패턴에서 멈추지 않습니다. 트리는 패턴의 집합입니다.

스토브부터 시작하겠습니다.

저는 트리의 두 가지 변형, 즉 배깅과 부울(RF, ADA) 유형을 고려하고 있습니다.

이 두 가지 알고리즘은 이웃 행을 참조하지 않고 입력 데이터를 가능한 것으로 간주하므로 행을 무작위로 선택하여 훈련 집합을 생성합니다.

한 행 내에서 목표 변수(교사)가 지정한 클래스를 가장 높은 확률로 예측할 수 있는 예측값이 선택됩니다.

입력 예측자 집합의 예측자 몇 개와 그 값을 한 행에 조합한 것을 패턴이라고 합니다.

 
СанСаныч Фоменко #:

내에서 대상 변수(교사)가 지정한 수업을 가장 높은 확률로 예측할 수 있는 예측자 값이 선택됩니다.

입력 예측자 집합에서 몇 개의 예측자와 그 값을 한 줄에 조합한 것을 패턴이라고 할 수 있습니다.

스토브 파이프를 잘못 이해하셨습니다. 트리 구성 코드를 본 적이없는 것 같습니다.... 거기에는 한 줄 안에 연산이 전혀 없습니다 !!!, 세트 (전체 또는 배치 포함)만 있습니다.

간단히 요약하면:
훈련에 전달된 무작위/전체 행 세트는 각 예측자/열에 대해 하나씩 정렬됩니다. 다른 분할(중간/백분위수/무작위)이 확인되고, 각각의 통계가 계산되며, 제안하신 대로 각 행이 아닌 전체 행 세트에 대해 가장 좋은 분할이 선택됩니다.
최적의 분할에 따라 문자열 집합을 2 개의 집합으로 나눈 다음 각 집합을 다시 정렬하고 중지 규칙에 도달 할 때까지 각 부분 등에 대해 최상의 분할을 선택합니다 (깊이, 행당 예제 수 등)

편집기에서 자세한 내용을 볼 수 있으며
\MQL5\Include\Math\Alglib\dataanalysis.mqh
ClassifierSplit () 함수 및 호출되는 파일을 가지고 있습니다.
몇 시간만 지나면 예측자를 한 줄씩 검색하는 것에 대해 이야기할 필요가 없을 것입니다.
 
СанСаныч Фоменко #:

모든 절차는 이미 완료되었으므로 따로 공식화할 필요가 없습니다.

그렇다면 미래 3시간 후의 플러스 또는 마이너스 간격에 대한 로봇의 정확도는 어느 정도일까요? 저는 인공지능이 미래를 계산할 피벗 포인트에 대해 이야기하고 있습니다. 동일한 파운드-달러에 대해 장중 플러스 마이너스 5~10핍의 오차, m5에 대해 +-1~2바의 오차를 갖는 것입니다.

그러면 AI는 모델(패턴)이 가격이 아니라 시간에 따라 움직였다는 것을 제때 알아차릴 수 있을까요? 즉, 첫 번째가 아니라 두 번째 또는 세 번째 계산 지점이 트리거됩니다. :)

코더는 아이들과 같아서 누군가가 컴퓨터의 기능을 의심하면 (기계가 모든 것을 찾을 수있는 것처럼) 즉시 입술을 삐죽 내밀고 화를냅니다. ;) 그리고 아무도 100 % 작동하는 알고리즘을 찾을 수없는 이유를 결코 알 수 없다는 것을 아무도 따라 잡을 수 없습니다. 그리고 눈에 띄지 않는 작은 세부 사항이 하나 있기 때문에 향후 패턴의 비율이 일정 부분 변경 될 것이라는 신호를 제공합니다. 그러나 당신은 Heniuses이자 코드의 신이며, 무언가를 선택하는 것은 명예로운 일이 아닙니다 (종이 나 계산기를 세고 손으로 모든 것을 검색하는 것). 입력에서 헛소리를 코딩하고 출력에서 헛소리를 얻은 다음 모든 것을 최적화하려고 시도하는 것이 더 쉽습니다.

명확한 논리적 수학 체계는 100여 년 전에 설명되었습니다(여전히 시계처럼 작동합니다). 대수와 기하학 측면에서 모두 그렇습니다. 그러나 그들 자신의 리사페데스의 발명가들은 여전히 풍부합니다....

 
Bogard_11 #:

명확한 논리적 수학 체계는 100년 전에 설명되었습니다(여전히 시계처럼 작동합니다). 대수와 기하학 측면에서 모두 그렇습니다. 하지만 여전히 자신만의 리사페데스 발명가들이 많이 있습니다.....

그러니 당신의 거래를 보여주세요...
왜 이렇게 유행어가 많을까요?

그리고 시계처럼 작동하는 100년 된 이론에 따라 TS가 어떻게 작동하는지 봅시다.
어서
사유: