트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 105

 
트레이더 박사 :

나는 "구매"와 "판매"의 두 가지 클래스만 예측합니다. 즉, 항상 어떤 종류의 거래가 열려 있을 것입니다. 나는 한 모델로 작업하는데, 단순히 반대 결과를 주는 두 모델을 만들 이유가 없습니다.

그러나 점차적으로 "구매"/ "모든 것을 닫고 거래하지 않음"/ "판매"의 3 가지 클래스로 이동하고 싶습니다. 이렇게 하면 더 복잡한 전략으로 거래할 수 있습니다. 몇 번 시도했지만 3개의 클래스에 대한 훈련 모델에 문제가 있었습니다. 특히 모델이 이후에 클래스로 결과를 반올림하는 회귀인 경우에는 더욱 그렇습니다.
원래 클래스 1/0/-1이 첫 번째 모델( 구매만 )에 대해 1/0/0으로, 두 번째 모델(판매 오직). 이것은 각 모델에서 불균형한 클래스로 이어지지만(한 클래스의 예제 수가 다른 클래스보다 훨씬 많음) F-점수 및 카파와 같은 조건에서 작동하는 모델을 평가하기 위한 좋은 메트릭을 찾았습니다. 아직 이 방향으로 실제로 행해진 것은 없지만 그러한 계획은 꽤 가능성이 있어 보입니다.

이 분기에서 고려된 방법의 문제는 시계열의 비정상성(가격 및 시간 측면에서 동일한 패턴의 다른 척도)뿐만 아니라 패턴의 가변성에도 있습니다. 즉, 어제는 성장을 예고한 패턴이 오늘은 이후의 하락을 의미할 수 있습니다.

매매를 위한 별도의 교육은 이러한 문제를 부분적으로 해결합니다. 나는 몇 페이지를 뒤에서 썼습니다. 두 개의 그리드가 있는데 하나는 신호를 사는 법(1; 0) - 구매 또는 아무것도 하지 않음, 다른 하나는 판매(-1, 0) - 판매 또는 아무것도 하지 않습니다. 이 두 그리드의 출력에는 신호를 회로(-1, 0, 1)로 줄이는 스위치가 있습니다. 그러한 그리드 위원회의 작업은 매우 흥미로운 것으로 밝혀졌습니다. 처음에는 OOS에 대한 좋은 신호가 있고 점차적으로 신호 수가 감소합니다. 즉, 출력에서 더 자주 답이 0입니다(패턴이 더 이상 인식되지 않고 이것이 잘못된 거래 신호보다 낫습니다), 잠시 후 잘못된 거래 신호가 나타나기 시작합니다(패턴이 변경됨). 따라서 이미 주어진 임계값 아래로 신호 수를 줄이는 단계에서 새로운 데이터에 대한 새로운 교육의 필요성의 시작으로 간주될 수 있고 간주되어야 합니다.

그러나 일반적으로 실제로 그러한 "훈련"과 "훈련"은 없습니다. oos에 대한 모든 종류의 교차 검증 및 검사는 기대되는 효과를 제공하지 않으며 제공할 수도 없습니다. 사실 그러한 트릭은 검색에 불과하며 훈련 영역과 검증 영역 모두에서 거의 만족스럽게 작동하는 값을 선택합니다. 옵션이며 이는 전체 기록에서 즉시 선택하는 것과 같습니다.

그럼에도 불구하고 두 가지 모델(제 경우에는 두 개의 그리드)을 사용하는 것이 오늘날 사용할 수 있는 "머신 러닝" 방법 중에서 적용할 수 있는 가장 좋은 방법이라고 생각합니다. 이것은 훈련이나 훈련이 아니라 모델을 최적화하는 방법입니다.

오늘날에는 진정한 교육이 없습니다. 동일하거나 유사한 패턴의 인식은 학습의 결과가 아니라 암기의 결과입니다. 학습은 새로운 정보를 수신할 때 추론하고 결론을 도출할 수 있는 특정 사고 과정(가장 원시적이긴 하지만)을 포함해야 할 뿐만 아니라 새로운 정보를 독립적으로 생성할 수 있는 능력도 포함해야 합니다. 시장은 바로 그러한 접근 방식을 필요로 합니다. 오늘날에는 제가 아는 한 그렇지 않습니다. 그리고 오늘날 우리가 사용하는 것은 불행히도 생각하는 것이 아니라 암기하는 것입니다.

 
안드레이 딕 :

그러나 일반적으로 실제로 그러한 "훈련"과 "훈련"은 없습니다. oos에 대한 모든 종류의 교차 검증 및 검사는 기대되는 효과를 제공하지 않으며 제공할 수도 없습니다. 사실 그러한 트릭은 검색에 불과하며 훈련 영역과 검증 영역 모두에서 거의 만족스럽게 작동하는 값을 선택합니다. 옵션이며 이는 전체 기록에서 즉시 선택하는 것과 같습니다.

교차 검증을 통과했지만 새 데이터에 대한 테스트를 통과하지 못한 모델이 있습니다. 그리고 교차 검증을 통과할 수 있는 모델이 있습니다. 그런 다음 그들은 어떻게든 플러스로 무언가를 교환합니다. 그러나 모델이 교차 검증을 통과하지 못했다면 새로운 데이터로 거래를 시도할 의미가 없습니다.
제 생각에 이것은 예측 변수와 모델 매개변수를 선택 하기 위한 아주 좋은 첫 번째 단계입니다. 다음은 모델(또는 모델 매개변수 및 예측 변수를 피팅하는 경험적 방법)이 새 데이터를 사용할 수 있는지 여부를 결정하기 위한 롤포워드 테스트입니다. 그렇게 할 수 없다면 무언가를 바꿔야 합니다.

여기에 두 개의 뉴런이 있습니다. 천장에서 매개변수를 가져오지 않았습니까? 뉴런이 가지고 있는 레이어, 학습률, 억제, 체중 조절 및 수십 가지 기타 매개변수. 적절한 매개변수를 결정하기 위해 롤포워드 테스트와 같은 작업을 수행했을 것입니다. 이는 본질적으로 교차 검증이기도 합니다. 기본 매개변수가 있는 두 개의 뉴런을 사용하여 즉시 이익 거래를 시작할 수 있다고 생각하지 않습니다.

 
트레이더 박사 :

기본 매개변수가 있는 두 개의 뉴런을 사용하여 즉시 이익 거래를 시작할 수 있다고 생각하지 않습니다.

왜요?
 
Dr.Trader :

1. 교차 검증을 통과했지만 새로운 데이터에 대한 테스트를 통과하지 못한 모델이 있습니다.

2. 그리고 교차 검증을 통과할 수 있는 모델이 있으며, 그 후에 그들은 어떻게든 플러스로 무언가를 교환합니다.

3. 그러나 모델이 교차 검증을 통과하지 못했다면 새로운 데이터를 가지고 거래를 시도할 의미가 없습니다.

4. 제 생각에는 이것은 예측 변수와 모델 매개변수를 선택하기 위한 아주 좋은 첫 번째 단계입니다.

5. 다음 - 롤포워드 테스트를 통해 모델이 새 데이터를 사용할 수 있는지 확인합니다. 그렇게 할 수 없다면 무언가를 바꿔야 합니다.

6. 여기에 두 개의 뉴런이 있습니다. 천장에서 매개변수를 가져오지 않았습니까? 뉴런이 가지고 있는 레이어, 학습률, 억제, 체중 조절 및 수십 가지 기타 매개변수. 적절한 매개변수를 결정하기 위해 롤포워드 테스트와 같은 작업을 수행했을 것입니다. 이는 본질적으로 교차 검증이기도 합니다. 기본 매개변수가 있는 두 개의 뉴런을 사용하여 즉시 이익 거래를 시작할 수 있다고 생각하지 않습니다.

1. 네. 그렇다고 해서 모델이 나쁘다는 것은 아닙니다. 이는 제공된 데이터 양에 대한 모델의 "메모리 부족"을 의미하거나 교육 및 검증 사이트를 포함하여 전체 사이트에 적합한 매개변수 세트를 찾지 못했음을 의미할 수 있습니다. 문제는 새로운 데이터에 대한 테스트 실패의 문제가 정확히 무엇인지 결정할 방법이 없다는 것입니다.

2. 네. 그것은 "충분한 기억"을 의미합니다. 훈련 데이터의 양을 줄이는 것만으로 1단계에서 동일한 것을 얻을 수 있습니다. 알려지지 않은 데이터에서 플러스가 얻어졌다는 사실은 시스템이 알고 있는 패턴과 동일하거나 매우 유사한 패턴이 있었고 동시에 이전에 발생한 시장 반응이 정확히 발생했기 때문에 순수한 "운이 좋은" 것으로 간주될 수 있습니다. 해당 패턴. 문제는 패턴이 지속적으로 점진적으로, 때로는 갑자기 변하고 미래에 대한 보장이 없다는 것입니다.

3. 네. 그러나 위에서 언급한 이유로 그녀가 통과하더라도 그다지 나쁘지 않습니다.

4. 네, 좋습니다. 그러나 미래에 모델의 견고성에 대한 확신을 제공하기 위해서가 아니라 유효성 검증을 통과하기 위해서만 그 이상은 아닙니다.

5. 롤 포워드는 시스템의 성능을 확인하는 유일한 방법입니다. 유일한. 제 생각에는 적어도 55-60% 효율성(즉, "훈련" 영역에 비해 효율성이 30% 이상 감소)의 시스템을 만드는 것이 가능하다면 성공했다고 가정할 수 있습니다. 달성. 그러나 그렇다고 해도 시장 패턴의 변화 속도와 필요한 정보량을 기억하는 시스템의 능력 사이에 타협이 발견되었다는 의미일 뿐이지, 시스템이 30세까지 "바보"가 된 것은 아닙니다. %, 그러나 시스템이 새롭거나 변경된 오래된 것을 30% 인식하지 못한다는 것을 의미합니다.

6. 내가 말한 두 개의 뉴런에 대한 접근은 그 자체로 "학습"을 의미하지 않습니다. 그것은 단지 까다로운 방식으로 적용된 동일한 "기억"입니다. 오래된 것을 잊어 버리고 새로운 패턴을 인식하지 못하는 것이 당신과 마찬가지로 발생하지만 익숙하지 않은 패턴으로 거래가 발생하지 않고 시간이 지남에 따라 거래가 희미 해지며 잘못된 신호가 시작됩니다. 롤포워드 테스트를 수행했습니다. 단위 시간당 트랜잭션 수가 허용 임계값 아래로 감소할 때 새로운 학습이 발생하므로 동일한 "학습" 섹션을 사용하여 롤포워드에서 다른 길이의 테스트 섹션을 얻었습니다. 평균적으로 효율성이 동일한 30% 감소하는 것으로 나타났습니다.

 
결합기 :
왜요?

Neuronka는 다른 모델과 마찬가지로 사용 가능한 데이터에서 일부 패턴을 찾습니다. 이러한 패턴이 일부 내부 외환 프로세스에 해당하는지, 아니면 "결과만 일치하면 무언가를 곱한다"는 원칙에 따라 단순히 뉴런에 의해 선택되는지 여부 - 아무도 모릅니다. 보장은 없습니다. Forex의 내부 프로세스를 정확히 결정하기 위해서는 그 구조(계층, 연결)가 어떻게든 Forex와 일치해야 하며, 이에 대해 특별히 구성되어야만 일관되게 좋은 결과를 제공하기 시작할 것입니다.

예를 들어, 이제 사진을 분류하기 위한 컨볼루션 신경망 은 매우 인기가 있습니다. 그들의 응용 프로그램은 매우 간단해 보이지만(Python 라이브러리를 다운로드하면 완료됩니다), 사람들은 많은 대학이 수십 년 동안 "그림 인식" 대회에 참가해 왔으며 모든 승률을 놓고 경쟁한다는 사실을 잊었습니다. "반 고흐처럼 그림을 그린다"나 그림에서 얼굴을 바꾸는 것과 같은 유행은 적응하는 데 많은 시간을 보내는 모든 학생과 대학원생(그리고 교수도 추측)과 함께 대학에서 수십 년 동안 작업한 결과입니다. 모델 매개변수 또는 새 모델 개발 .
Forex의 경우 이것도 가능하지만 더 적은 노력을 기울여야 합니다. 이 경우 상금은 Forex에서 실제 이익이므로 모델의 구성을 자랑하지 않고 대중에게 퍼뜨리지 않습니다. 경쟁의 각 새로운 참가자는 처음부터 다시 시작해야 합니다.

 
트레이더 박사 :

기본 매개변수가 있는 두 개의 뉴런을 사용하여 즉시 이익 거래를 시작할 수 있다고 생각하지 않습니다.

물론 나도 믿지 않는다. 일생에 한 번만 훈련하면 되는 사고 기계를 만드는 것을 의미하기 때문입니다. 인류는 아직 생각하는 기계와는 거리가 멀다.
 
안드레이 딕 :

매매를 위한 별도의 교육은 이러한 문제를 부분적으로 해결합니다. 나는 몇 페이지를 뒤에서 썼습니다. 두 개의 그리드가 있는데 하나는 신호를 사는 법(1; 0) - 구매 또는 아무것도 하지 않음, 다른 하나는 판매(-1, 0) - 판매 또는 아무것도 하지 않습니다.

내 삼항 분류기에는 두 개의 그리드가 있지만 숨겨진 레이어가 서로 다르며 둘 다 다음 가격 방향에 대한 예측을 분류합니다. 1 또는 -1. 출력에 스위치가 있는데 그리드 중 하나가 1을 출력하고 다른 하나가 -1을 출력하면(서로 모순됨) 스위치는 0을 출력합니다. 아무 것도 하지 않습니다.

종속 변수의 가치에 대한 매매로 모든 것이 명확합니다. 왜냐하면 패턴을 따라가는 가격 움직임의 방향이라는 사실에 의해 결정될 수 있습니다. 그러나 여기서 백필에 대한 까다로운 질문이 발생합니다. 이진 분류기가 종속 변수를 0으로 표시하는 조건은 무엇입니까? 아무 것도 하지 않습니까?

결국, 자연에 사실 형태의 그러한 상태는 존재하지 않습니다, IMHO.

 
안드레이 딕 :

5. ...

6. ...

이러한 설명으로 그럴듯하게 들립니다. 그리고 얼마나 희귀한 패턴을 거래합니까? 예를 들어 " 구매 위치 열기 " 및 "모든 거래 닫기" 클래스가 포함된 교육 예제가 있는 경우 이러한 클래스의 비율은 얼마가 될까요? 바이 클래스는 수백 포인트 급등한 가격 급등에 해당한다고 가정할 수 있습니다. 즉, 바이 클래스의 양은 모든 교육 예제의 약 10%입니다.
 
안드레이 딕 :

1. 네. 그렇다고 해서 모델이 나쁘다는 것은 아닙니다. 이는 제공된 데이터 양에 대한 모델의 "메모리 부족"을 의미할 수 있습니다.

2. 시스템이 알고 있는 패턴과 동일하거나 매우 유사한 패턴이 있었고 동시에 해당 패턴 이전에 발생한 시장 반응이 정확히 발생했기 때문입니다. 문제는 패턴이 지속적으로 점진적으로, 때로는 갑자기 변하고 미래에 대한 보장이 없다는 것입니다.

1) 이전에 학습할 수 있는 그런 네트워크가 있는데, 이전에 알지 못했던 데이터를 수신하면 흥미롭게 읽을 수 있습니다. 네트워크는 SOINN https://www.google.com.ua/webhp 입니다. ?sourceid=chrome-instant&ion= 1&espv=2&ie=UTF-8#q=soinn

2) 나는 이미 이것에 대해 쓰는 것이 지겹습니다. 게다가 시장이 자체 통계에 어긋난다는 것을 실제로 증명했고 역학 자체도 설명했습니다. 왜 이런 일이 발생하고 고전적인 형식의 모든 교육은 적용되지 않습니다. 그러나 그것은 누구에게도 흥미롭지 않습니다. 모두가 한 일을 하기도 합니다.

Google
Google
  • www.google.com.ua
Голосовой поиск – это очень удобно! Чтобы найти нужную информацию, скажите "О'кей, Google" и произнесите запрос.
 
유리 레셰토프 :

내 삼항 분류기에도 두 개의 그리드가 있지만 숨겨진 레이어가 서로 다르며 둘 다 다음 가격 방향, 즉 다음 가격 방향에 대한 사실을 분류합니다. 1 또는 -1. 출력에 스위치가 있는데 그리드 중 하나가 1을 출력하고 다른 하나는 -1을 출력하면 스위치가 0을 출력합니다. 아무 것도 하지 않습니다.

구매 및 판매와 함께 모든 것이 명확하기 때문입니다. 패턴을 따라가는 가격 움직임의 방향이라는 사실에 의해 결정될 수 있습니다. 그러나 여기서 백필에 대한 까다로운 질문이 발생합니다. 이진 분류기가 종속 변수를 0으로 표시하는 조건은 무엇입니까? 아무 것도 하지 않습니까?

결국, 자연에 사실 형태의 그러한 상태는 존재하지 않습니다, IMHO.

매도 매수 해석

-1 0 판매

0 0 울타리

0 1 구매

-1 1 울타리

다음은 스위치 테이블입니다. 그리드의 신호가 존재할 때 신호가 나타나고 서로 모순되지 않음을 보여줍니다. 훈련 후 패턴이 인식되고 성공적인 거래가 발생합니다. 시간이 지남에 따라 판독값이 서로 모순되기 시작하거나(출력 0 - 울타리) 두 그리드가 패턴 인식을 중지합니다(출력 0 - 울타리). 따라서 시간이 지남에 따라 거래 수가 감소합니다. 즉 "확실하지 않음 - 거래하지 않음"이라는 원칙이 적용됩니다.

그러나 귀하의 질문은 다른 것 같습니다. 울타리에 앉아 있는 대신 해당 그리드를 구매/판매하는 방법은 무엇입니까? - 답은 간단합니다. 포인트 시스템입니다. 정답과 오답 및 펜스 벌금에 대해 점수가 부여됩니다. 포인트 비율을 선택해야 합니다. 이 또한 작업입니다. 결국 두 그리드의 조정된 작업을 달성해야 하기 때문이지만 결과는 문제의 가치가 있습니다.

IMHO, 매수 및 매도 패턴이 다릅니다. 그것은 당신과 같은 아이디어입니다.

사유: