트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 172

 
산산이치 포멘코 :

추신.

MCL의 열렬한 지지자를 위해 이 스레드에서 논의된 모든 작업과 도구가 없으면 테스터는 거래 시스템의 미래 동작에 대해 이야기할 이유가 전혀 없습니다. 테스터는 "이 기간에 대한 결과는 다음과 같습니다."라고 말합니다. 모두. 테스터는 예를 들어 특정 역사적 기간을 나타내는 이익 요소와 같이 정확히 하나의 수치를 제공합니다. 그리고 통계는 R에서만 얻을 수 있습니다 . 그리고 테스터는 모델 설계의 마지막 부분이지만 전체 개발 프로세스를 대체하지는 않습니다.

넌센스와 넌센스!

테스터는 질문을 받은 만큼 정확하게 알려줄 것입니다. 손익분기점을 물어보셨나요? 다음은 수익 요소입니다. 우리가 다른 또는 여러 가지를 묻는다면 이것에 대한 대답이 있을 것입니다. 그리고 통계는 OnTester() 에서 TesterStatistics( )를 호출하여 얻을 수 있으며 이 모든 것이 아주 오랫동안 사용 가능했습니다. 필요한 경우 다른 통계 수를 추가할 수 있습니다.

당신의 R은 아무것도 없거나 무엇을 물어야 할지 모를 경우 아무 대답도 할 수 없을 것입니다.

 
Dr.Trader :

예를 들어, 지연된 샘플에 대해 검증을 수행했습니다. 연기된 데이터 병합에 대한 모델을 인정합시다. 그런 경우에는 어떻게 합니까? 지연된 샘플에 대한 유효성 검사를 성공적으로 통과하기 위해 매개변수에서 무언가를 선택하기 위해 다시 시작하면 기본적으로 교차 검증에 지연된 샘플의 데이터를 포함하고 교차 검증도 적합하게 됩니다. 새로운 지연된 가져오기를 추가하여 이 문제를 해결할 수 있습니다. 그리고 모델도 여기에 병합되면 어떻게 될까요? 전달할 매개변수와 보류 중인 새 샘플을 선택하려면? 끝없는 레이스입니다.

교차 검증에 지연된 샘플링을 포함하고 새로운 지연된 샘플링을 생성하는 것은 선택 사항이 아니지만 행운이 당신에게 미소 짓고 모델이 실수로 지연된 검증을 통과할 때까지 끝없는 반복입니다. 그런 다음 멈출 수 있지만 이것은 외환 결정이 아니지만 운이 당신에게 미소 지었지만 통계에 따르면 배수가 될 것입니다.

따라서 문제는 지연된 데이터의 모델이 병합되었다고 가정해 보겠습니다. 그런 경우에는 어떻게 합니까?

남. 트레이더 박사님, 사진으로 설명하겠습니다. 걱정하지 마십시오. 이 문제는 복잡하지만 해결할 수 있습니다. 당신이 제안한 대로 할 필요가 없습니다. 그렇지 않으면 악순환이 있을 것입니다.

그러나 이 주제에 대한 활동으로 점차 마무리하겠습니다. 포럼이 지겹습니다. PM과 예제가 더 좋습니다.

여기 있습니다:

시끄러운 시계열 예측 및 거래를 위한 모델 선택

단계별:

모델 훈련 - 모델은 성배 특성을 보여줍니다

모델 테스트 - 모델은 이미 눈에 띄게 악화되었습니다. 그러나 그들 중에는 완벽하게 작동하는 것들이 있습니다.

모델을 선택해야 하는 순간이 왔습니다. 당신과 나는 테스트에서 더 나은 성능을 보이는 모델을 선택합니다(교차 검증에서 검증 블록이 될 수 있음). 그리고 그 특성이 이미 알려진 기간 동안 모델을 선택하면 낙관적인 선택을 하고 있다는 것이 즉시 분명해집니다.

교차 검증이 있는 경우(다른 모델에 대한 데이터가 혼합됨) 테스트 위원회로 만들 수 없습니다(테스트가 혼합됨). 대신 테스트에서 선택한 "최상의" 모델을 선택하고 지연된 샘플에서 테스트합니다. 우리는 무엇을 볼 것으로 예상합니까? 실제 애플리케이션에서는 교차 검증 블록(또는 교차 검증으로 장난을 치고 싶지 않은 경우 단일 테스트)에서 모델의 성능에 의존하기 때문에 선택된 최상의 모델이 향후 유사한 성능을 보일 것입니다(지연된 샘플 1에서). 연결이 있다면 이미 아주 좋은 것입니다. 사실 여기에서 연구를 중단하고 향후 최고의 교차 검증 모델을 선택할 수 있습니다.

그러나 우리가 여전히 위원회를 만들고 싶다면 위원회를 위해 어떤 모델을 선택해야 하는지 이해해야 합니다. 지연된 샘플 1에서 이 작업을 수행하지만 어쨌든 그렇지는 않습니다. 다시 말하지만, 실생활에서는 테스트 데이터(사용 가능한 최신 데이터)에만 의존한다는 것을 기억하십시오. 따라서 우리는 TEST에서 가장 좋은 결과를 보여주는 모델을 위원회에 교대로 포함시킵니다. 우리는 지연된 샘플에 대한 위원회 작업의 특성을 극대화합니다.

이 시점에서 우리는 위원회의 특성이 이미 알려진 데이터에 대한 위원회의 선택을 평가하기 때문에 다중 모델 선택 편향의 대상이 됩니다.

마지막 샘플은 위원회 검증에 필요합니다.

지연된 샘플에서 선택한 모델(테스트에서)을 검증하는 단계에서 모델의 특성이 유동적임을 확인하면 테스트에 따라 모델을 선택할 기회가 없기 때문에 이는 이미 치명적입니다. . 이 단계에서 접근 방식을 변경해야 합니다.

모인 위원회가 마지막 보류 샘플(일회성 테스트임)에 병합되면 이전 샘플에 적합한 위원회가 있는 것입니다.

특성을 최대화하기 위해 다른 매개변수를 사용하여 전체 절차를 반복합니다. 이것은 또한 모델의 낙관적인 선택이 될 것이기 때문에 최종 연기된 샘플에 대해서는 불가능합니다.

지연된 샘플에서 모든 것이 잘 작동하더라도(즉, 모델 선택 편향을 최소로 줄임) 동일한 매개변수를 사용하여 주기에서 전체 절차를 반복하고 마지막 샘플에 대한 위원회 작업의 분포를 얻는 것이 일반적으로 좋습니다. . 동시에 매번 다른(적어도 부분적으로) 데이터가 필요하다는 것이 분명합니다. 그리고 이것은 이미 매우 어렵습니다 ...

이 계획을 기억하십시오. 실제 거래에 대한 평가를 가능한 절대값으로 가져옵니다.

 
이전에는 청년 시절과 Neuroshell이 제공되었을 때 종이 거래를 사용했습니다. 모두가 그것이 무엇인지 알기를 바랍니다. 그러나 실생활에서 일할 때 Ts가 병합되기 시작했고 종이 거래의 세그먼트를 사용하지 않고 네트워크를 훈련하기로 결정했습니다. 네트워크의 올바른 작동. 예를 들어, 나는 지금 다음과 같은 일을 하고 있습니다. 볼륨과 인터넷 개방에 따라 마지막 날을 삭제합니다. 무엇을 위해???? 결국, 최적화 섹션 후 맨 처음에 TS가 약간 병합 된 다음 꽤 괜찮은 신호를 보내기 시작하는 그런 그림을 자주 보았습니다. 그래서 내가 이미 알고 있는 어느 날을 삭제하고 TS는 말하자면 다음날부터 거래를 시작합니다 .... 물론 오류가 없는 것은 아니지만 전혀 나쁘지 않은 것으로 판명되었지만 여전히 만들기에는 허용됩니다. 이익 ...
 
마이클 마르쿠카이테스 :


모든 것이 사실이지만이 패턴은 수염이 많고 모두가 오랫동안 그것에 대해 알고 있었기 때문에 ...

그리고 이제 가장 간단한 분류기는 그것을 감지합니다. 가격, 거래량 및 OI의 해석과 같은 하나의 시리즈에 대해 데이터가 충분하지 않으며 최소한 주문서와 거래 지침이 있는 테이프가 필요합니다. Forex의 경우, 이 정보를 사용할 수 없으므로 서부 유동성 시장 선물 시장에서 가져와야 합니다.

 
그러나 아니요, 네트워크가 미래에 나타날 패턴을 정확히 제출하면 어떻게 될지 생각해 보셨습니까 ??? 문제는 패턴을 찾는 방법, 현재 날짜에 이러한 패턴이 무엇인지 알기 위해 네트워크 교육을 위해 선택해야 하는 요일입니다. 다음은 실제 답변입니다. 현재 볼륨과 OI가 있는 날짜를 정확히 선택하여 해당 날짜의 컨텍스트가 훈련 샘플에 포함된 날짜와 유사하기를 바랍니다. 나는 볼륨과 ROI 값을 네트워크 입력에 자체적으로 공급하지 않고 이러한 바닥을 선택하지만 AD, Zscore, Kelli 등이 입력에 공급됩니다. 즉, 오늘날과 같이 역사의 패턴과 이에 대한 시장의 반응을 정확히 선택하는 것이 포인트입니다. 다른 방법을 사용하여 그러한 선택에 대한 이론이 있다면 기꺼이 들어 드리겠습니다 ....
 
블랙톰캣 :
결국 똑똑한 사람들은 온갖 신경망을 개발하고 훈련하지만, 여전히 단순한 것은 보지 못한다. 나는 당신의 게시물을 읽고 놀랐습니다. 내가 모든 것을 올바르게 이해했다면 대략적으로 말하면 특정 고점 이후에 모든 가격이 0.2 % 하락한 것을 발견 한 다음이 고점 영역에서 세 개의 양초를 가져 와서 가격으로 일종의 조작을 수행하여 결국 가져 왔습니다. 특정 확률로. 그러나 실례합니다. 이 접근 방식이 너무 원시적인 것 같지 않습니까? :) 당신은 잘못된 곳을 파고 있습니다. 그렇기 때문에 결과는 현실과 정반대입니다. 나는 당신의 접근 방식을 다음과 같이 특징지을 것입니다: 당신은 FullHD 이미지에서 3픽셀을 가져오려고 하고, 이 3픽셀을 사용하여 전체 그림에 대한 아이디어를 얻으려고 합니다. 모두는 아니지만 이미지 영역의 최소 10%를 정확하게 예측할 확률은 얼마입니까? 내 예가 명확하기를 바랍니다. 사진을 보기 위해 픽셀을 볼 필요는 없습니다. 즉, 차트를 이해하려면 개별 막대를 볼 필요가 없으며 전체 차트를 봐야 합니다. 그리고 문제의 해결책은 예를 들어 대수학, 물리학 또는 생물학이 아니라 기하학 분야에 있습니다. 여기에서 사람들이 하고 있는 연구를 읽을 때면 지리학의 도움으로 인간의 구조를 이해하려고 한다는 강한 느낌을 받습니다. :)

+1

'차트'가 아니라 차트라고 하기도 하고, 게다가 가격 뿐만 아니라 ...

3픽셀과 HD에 대한 비유는 내 생각에 그들이 주로 여기서 하는 일과 매우 관련이 있습니다.

 

안드레이 딕 :

또는 누군가가 "예, 당신은 MO를 요리하는 방법을 모릅니다!"라고 말할 것입니다. - 아마 예, 할 수 없습니다. 그러나 누가 그것을 어쨌든 할 수 있습니까? 누가 시장에서 MO를 사용할 수 있었습니까?

그리고 당신은 혼자가 아닙니다. 정상입니다. 모든 일이 잘되고 "성공적인 거래"에 대한 과정을 판매하지 않고, 제휴 프로그램 및 기타 이단을 다루지 않고 https://와 같은 문을 두드리면 정상적이지 않습니다:/ /www.rentec.com/Jobs.action?data=true(알고 거래를 위한 자금 조달에 신경쓰지 않으려면))
Renaissance Institutional
Renaissance Institutional
  • www.rentec.com
RENAISSANCE TECHNOLOGIES, a quantitatively based financial management firm, has openings for programming positions at its Long Island, NY research center. Programming Opportunity We are looking for bright, outstanding programmers who are interested in working in a stimulating and academic environment to implement and support software used in...
 
그리고 NN이 작동하려면 거래 중(일, 주)에 있을 패턴에 대해 훈련해야 하며 가장 중요한 것은 이러한 패턴에 대한 시장 반응이 NN이 작동하는 동안과 같아야 한다는 것을 깊이 확신합니다 훈련 기간. 그러면 모든 퍼셉트론이 대처하고 강타와 함께 작동합니다. 문제는 다음 거래일 또는 주 중에 있을 패턴 세트를 정확히 선택하는 방법입니다???? 여기에 그러한 접근 방식이 있으며 네트워크가 미래 패턴에 대해 훈련된 경우 매우 복잡한 NN이나 무언가를 발명할 필요가 없습니다....
 
마이클 마르쿠카이테스 :
그러나 아니요, 네트워크가 미래에 나타날 패턴을 정확히 제출하면 어떻게 될지 생각해 보셨습니까 ??? 문제는 패턴을 찾는 방법, 현재 날짜에 이러한 패턴이 무엇인지 알기 위해 네트워크 교육을 위해 선택해야 하는 요일입니다. 다음은 실제 답변입니다. 현재 볼륨과 OI가 있는 날짜를 정확히 선택하여 해당 날짜의 컨텍스트가 훈련 샘플에 포함된 날짜와 유사하기를 바랍니다. 나는 볼륨과 ROI 값을 네트워크 입력에 자체적으로 공급하지 않고 이러한 바닥을 선택하지만 AD, Zscore, Kelli 등이 입력에 공급됩니다. 즉, 오늘날과 같이 역사의 패턴과 이에 대한 시장의 반응을 정확히 선택하는 것이 포인트입니다. 다른 방법을 사용하여 그러한 선택에 대한 이론이 있다면 기꺼이 들어 드리겠습니다 ....

그것이 수행되는 방법이지만 다른 방법은 무엇입니까? 사소한 경우 훈련 데이터 세트는 볼륨 가격과 ROI의 정규화된 증분의 벡터 시퀀스입니다. vectorSet [][]를 신경망 또는 다른 분류기에 호출합시다. 입력 =   벡터 세트 [ t ][], 출력 출력 = vectorSet 티치 [ t +1][]


제가 질문을 제대로 이해했다면...
 
마이클 마르쿠카이테스 :
문제는 다음 거래일 또는 주 중에 있을 패턴 세트를 정확히 선택하는 방법입니다????
불행히도 더 깊이 갈 권리가없고 솔직히 말하면 욕망, 우리는 서로 돈을 가지고 있습니다)))) 그러나 2 년 전에 여전히 혼자 일할 때 더 많은 것을 처리했습니다. 신경망에 대한 입력에 500개 이상의 기능이 있고 약 30개의 출력이 있지만 시간이 지남에 따라... ;)
사유: