트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1227

 
독성 :

칩은 일반적으로 유용하다고 말하기는 어렵지만 세부 사항은 글쎄, 당신 자신이 이해합니다 ...

시계열에서 기능을 구성할 때 심각한 오류를 방지할 수 있는 여러 "규칙"이 있습니다. 특히 가장 많이 위반되는 것 중 하나는 대상과 기능의 진부한 "혼합"입니다. 기능은 엄격하게 과거의 것이어야 합니다. 점의 대상은 엄격하게 미래에서 온 것이어야 합니다. 그러한 분리는 시리즈를 데이터 세트로 변환하는 알고리즘 수준에서 이루어져야 하며, 다른 모든 사람들처럼 모든 종류의 지표를 망쳐서는 안 됩니다. 기차와 시험 속으로 , 무언가가 어딘가로 이동하는 등. 원래 행을 잘라낸 다음 교차하지 않는 슬라이딩 창(과거 및 미래)이 있는 행을 실행하고 lern 및 테스트에 대해 기능과 대상을 별도로 가져와야 합니다. 여전히 유효성을 검사할 수 있습니다. 물론 기능에 대한 칠면조는 앞을 내다보지 않고 대상에 대해서는 뒤를 돌아보지 않는다는 것을 확실히 알고 있다면 표시기로 이 작업을 수행할 수 있습니다. 훨씬 더 미묘한 오류가 많이 있지만 지금은 그것에 대해 이야기하지 않겠습니다.

변환 자체는 사소한 것(수익률, 변동, 거래량 변화, DOM 델타, 거래 분배 등)에서 거래량의 수평 수준의 이색적인 기울기, "패턴"이 없는 경우 "패턴")에 이르기까지 다를 수 있습니다. Inokentii가 위에서 말한 "트렌드/플랫" 및 "질서/혼돈" 등과 같이 유용한 것으로 판명된 "통찰" 또는 클러스터링으로 얻은 수십 가지 특정 사용자 정의 통계. 일부 통계는 다른 시간 척도에 대해 계산되고, 일부는 그렇지 않으며, 일부 기능은 일부 기기에서 작동하고 다른 통계는 작동하지 않습니다. 대상에 대한 기능을 필터링하고 선택할 수 있어야 합니다. 많은 것들이 있습니다. 표준 모델 ARMA, GARCH... 같은 기능, 다양한 스펙트럼 방법, 물론) 기능 등과 같은 중장기 거시 예측 지금까지 손이 닿지 않았고 소셜 네트워크 등에서 텍스트 스트림을 분석하기 위해 NLP\NLU 를 수행할 사람이 없습니다. 여기에서 딥 러닝이 반드시 필요합니다.

Vladimir Perervenko의 기사를 반복했을 때 추가 작업을 수행했습니다. 실험 - 추가 지표가 전혀 없음(최신 기사에 대한 디지털 필터 ), 즉 순전히 가격에. 결과는 단지 몇 퍼센트 더 나빴습니다. 그리고 그때도 나는 이것이 덜 성공적인 국회 교육이라고 생각합니다 (다른 혼합 및 가중치 초기화 및 OHLC는 기사가 아니라 제 서버에서 왔습니다). 국회는 예측에 필요한 지표라면 스스로 쉽게 만들 것이다. 일부 매개변수(LPF/HPF/대역통과 또는 일종의 Mashka)가 있는 디지털 필터가 예측에 유용하다고 추측할 이유가 없다고 생각합니다. OHLC의 모든 것을 국회가 스스로 할 것입니다.

그러나 더 미묘한 오류에 대해 아는 것은 여전히 흥미롭습니다 ...

MO for VR에 대한 유용한 정보가 1200페이지가 넘는다. 한곳에 다 모았으면 좋겠는데 아이디어가 안 나온다면 ZZ, PCA, 앞/뒤 엿보기 등 막다른 골목이라도

 
독성 :

따라서 "성배"는 울트라-hft의 맥락에서만 있을 수 있으며, 오히려 그런 우울한 규정이 없었을 때 한 번 있었습니다. 또는 그것 없이도 단순히 반죽을 인쇄할 수 있는 내부자 위기에 처하고 채권을 사십시오) )

자 여기 또...

당신은 수조와 내부자들로 사람들을 겁주는 데 지치지 않습니다. "잡종은 짖지만 캐러밴은 계속 간다"라는 속담이 있다는 것을 알고 있습니다. 우리는 당신이 마지막 백 달러를 남긴 DC, 세계에서 당신의 불만이 필요하지 않습니다. 공평하지 않다, 당신은 운이 좋지 않다. 그러나 나는 운이 좋다. 나는 함께 있고 나는 수억 달러를 벌 것이고, 그렇지 않다면 내가 성공할 때까지 다시 시도할 것이다.


당신의 여자 친구 또는 어머니에게 외치십시오. 우리가 요트와 섬에 대한 꿈을 꾸는 것을 막지 말고 우리의 꿈을 차근차근 현실로 바꾸십시오. Voronov를 어디에서 다운로드 해야하는지, 추세를 평면과 구별하고 악령을 죽이고 지옥으로 돌아가는 방법조차 모르는 모든 종류의 "전문가"가 여기에서 이혼했습니다.

 
케샤 루트 :

자 여기 또...

당신은 당신의 수조와 내부자들로 사람들을 겁주는 데 지치지 않습니다. "잡종은 짖지만 캐러밴은 계속 간다"라는 속담이 있다는 것을 알고 있습니다. 우리는 당신이 마지막 백 달러를 남긴 DC, 세계에서 당신의 불만이 필요하지 않습니다. 공평하지 않다, 당신은 운이 좋지 않다. 그러나 나는 운이 좋다. 나는 함께 있고 나는 수억 달러를 벌 것이고, 그렇지 않다면 내가 성공할 때까지 다시 시도할 것이다.


당신의 여자 친구 또는 어머니에게 외치십시오. 우리가 요트와 섬에 대한 꿈을 꾸는 것을 막지 말고 우리의 꿈을 차근차근 현실로 바꾸십시오. Voronov를 어디에서 다운로드 해야하는지, 추세를 평면과 구별하고 악령을 죽이고 지옥으로 돌아가는 방법조차 모르는 모든 종류의 "전문가"가 여기에서 이혼했습니다.

즉시 말해 - 어떤 DC에서 일합니까? 꿈의 선전가.
 

아무도 시도하지 않았지만 갑자기 :

이익 / 손실별로 거래를 정렬하여 클래스로 나눌 때 가장 수익성이 높은 거래는 0.5 영역에서 가장 수익성이 낮은 확률을 제공합니다. 저것들. 단순히 효율성을 기준으로 거래를 정렬하고 확률을 할당하면 가장 효율적인 거래는 줄어들고 노이즈 거래는 더 많아질 것이 분명합니다.

실험할 가치가 있습니까? 오류를 줄여야 합니까?

 
막심 드미트리예프스키 :

아무도 시도하지 않았지만 갑자기 :

이익 / 손실별로 거래를 정렬하여 클래스로 나눌 때 가장 수익성이 높은 거래는 0.5 영역에서 가장 수익성이 낮은 확률을 제공합니다. 저것들. 단순히 효율성을 기준으로 거래를 정렬하고 확률을 할당하면 가장 효율적인 거래는 줄어들고 노이즈 거래는 더 많아질 것이 분명합니다.

실험할 가치가 있습니까? 오류를 줄여야 합니까?

글쎄, 이것은 회귀이지만 막대의 높이를 통한 것이 아니라 트랜잭션의 결과에 따른 것입니다(분명히 자가 학습 시스템에 필요합니다). 조언은 하지 않겠습니다. 5개월 동안 MO를 전혀 다루지 않았기 때문에 지금은 어떤 아이디어를 시도할지 스스로 생각하고 있습니다. 어떻게 든 자동으로 소음 예측자의 영향을 과소 평가하고 싶습니다. 결국, 분기가 시작될 때 이것이 정확히 수행 된 것입니다.
 
독성 :

1 2 부분적으로, 예, 유행하는 현상이지만 이것은 제 생각입니다. "딥 러닝" 자체는 실제로 회귀/분류 자체가 아니라 특정 유형의 데이터에서 상당히 간단한 계층적으로 구성된 기능을 추출하는 방법입니다. 예를 들어 , 반사광에 의해 그려진 픽셀 이미지, "실제 세계"에서 카메라로 들어오는, 픽셀 자체의 밝기, 분류기에 어리석게 밀어넣으면 매우 나쁜 신호, CNN에는 일종의 "장식"이 있습니다. 인접 픽셀의" 및 차원 압축, 여러 패스에서 그림을 작은 조각으로 쪼개어 클러스터링하면 유사한 작업을 수행할 수 있습니다. 일반적으로 "딥 러닝"은 여러 패스에서 클러스터링한 다음 "고수준 기능"을 일반 분류기. 물론 이 주제는 매우 흥미롭지만 이론적으로 개발해야 할 때입니다. 매우 느린 역전파로 훈련된 서로 다른 아키텍처의 신경망으로 "분석"하는 것만이 아닙니다. 그러나 나는 반복합니다. 당신이 올바르게 지적했듯이이 방향으로 실험을하는 것은 매우 비싸기 때문에 질문은 열려 있지만 아직 시장과 친구가 될 수 없었습니다.

3 나무 잎에 상수를 넣을 필요가 없으며 선형 모델을 사용할 수 있으며 더 복잡하면 포인트 클라우드를 넘어 "외삽"이 발생합니다))

4 당신은 뭔가를 망쳤고, 숲과 부스팅으로 회귀를 할 수 있습니다. 문제 없습니다.

3. 즉, 다른 모델을 결합하여 결정 트리 모델의 잎에 넣을 수 있습니다. 어떻게 작동하는지 궁금합니다. 실제 예를 들어주세요.

4. 나는 엉망이되지 않았고 문제가 보입니다. 왜냐하면 나는 신경망에서와 같이 많은 출력(종속 변수)이 있는 스캐폴드에서 회귀 문제의 구현을 아직 보지 못했습니다.
예를 들어 MQL 라이브러리 alglib.mqh에서 랜덤 포레스트 를 구축하는 기능을 살펴보십시오.

 //+------------------------------------------------------------------+
//| This subroutine builds random decision forest.                   |
//| INPUT PARAMETERS:                                                |
//|     XY          -   training set                                 |
//|     NPoints     -   training set size, NPoints>=1                |
//|     NVars       -   number of independent variables, NVars>=1    |
//|     NClasses    -   task type:                                   |
//|                     * NClasses=1 - regression task with one      |
//|                                    dependent variable            |
//|                     * NClasses>1 - classification task with      |
//|                                    NClasses classes.             |

저것들. 종속변수 NClasses의 수가 하나 이상인 경우 이 함수는 분류 문제만 해결할 수 있습니다. 우리는 프로그래머 포럼에 있으므로 이 문제에 대한 솔루션을 구현하고 코드를 입력하세요. :)

 
막심 드미트리예프스키 :

아무도 시도하지 않았지만 갑자기 :

이익 / 손실별로 거래를 정렬하여 클래스로 나눌 때 가장 수익성이 높은 거래는 0.5 영역에서 가장 수익성이 낮은 확률을 제공합니다. 저것들. 단순히 효율성을 기준으로 거래를 정렬하고 확률을 할당하면 가장 효율적인 거래는 줄어들고 노이즈 거래는 더 많아질 것이 분명합니다.

실험할 가치가 있습니까? 오류를 줄여야 합니까?

이것이 테스터에 있고 간접적으로 거래의 수익성을 통해 올바른 진입점에 도달하기 위해 내가 Monte Carlo에서 이미 이것을 물었지만 가격대에 따라 즉시 이상적으로 찾지 않는 이유는 무엇입니까? 실 :)
 
이반 네그레쉬니 :
이것이 테스터에 있고 간접적으로 거래의 수익성을 통해 올바른 진입점에 도달하기 위해 내가 Monte Carlo에서 이미 이것을 물었지만 가격대에 따라 즉시 이상적으로 찾지 않는 이유는 무엇입니까? 실 :)

그런 다음 몇 가지 예가있을 것이며 새로운 데이터에서 그녀는 맹목적인 패자가되지 않을 것이며 그녀는 그녀의 삶에서 가능한 한 많이 "볼" 필요가 있습니다

그렇게 어리석게 받아들이고 이상적인 지그재그로 제공할 수는 없습니다. 그러면 기능을 선택할 수 있습니다. 모든 것과 모든 것을 동시에 정렬하는 양날의 프로세스여야 합니다. :)

2과목 말고 더 들을까 말까 고민중

 
막심 드미트리예프스키 :

그런 다음 몇 가지 예가있을 것이며 새로운 데이터에서 그녀는 맹목적인 패자가되지 않을 것이며 그녀는 그녀의 삶에서 가능한 한 많이 "볼" 필요가 있습니다

논리적이지만 한편으로는 m. 지속적으로 위험을 알리고 부풀리는 것보다 덜 보고 확실한 것만 거래하는 것이 좋습니다.
 
이반 네그레쉬니 :
논리적이지만 한편으로는 m. 지속적으로 위험을 알리고 부풀리는 것보다 덜 보고 확실한 것만 거래하는 것이 좋습니다.

글쎄요, 테스트 샘플에 따르면, 저는 항상 오류를 봅니다. 이 "확실한 것"은 사람에게 그렇게 보일 뿐, 다르게 "생각"하지 않습니다

신경망이 어떻게 생각하는지 생각합니다..확실한지 아닌지는 중요하지 않습니다. 가장 중요한 것은 일반화하는 방법입니다.

따라서 모든 대변이 0.5의 범위에 있고 이상치가 고품질 거래라면 일반화 능력이 향상됩니까?
사유: