트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2126

 
도서관 :
스프레드가 커버되지 않으면 무슨 소용이 있습니까?

중복이 항상 과적합되면 모델 잔차가 자기상관됩니다.

저것들. 자기기만. 이전 메시지의 그림을 참조하십시오.
 
막심 드미트리예프스키 :

중복이 항상 과적합되면 모델 잔차가 자기상관됩니다.

저것들. 자기기만. 이전 메시지의 그림을 참조하십시오.
설명이 없는 사진은 사진일뿐)
 
도서관 :
설명없는 사진 - 그냥 사진)

첫 번째 그림의 루프는 모델이 재학습되는 일련의 레이블입니다. 새로운 데이터에는 완전히 다른 계열이 있기 때문에

5개의 주요 구성요소는 데이터세트에서 가져오고 그 관계( 특징 공간 )입니다. 이미 그러한 스크린샷을 작성하고 던졌습니다.

 
막심 드미트리예프스키 :

첫 번째 그림의 루프는 모델이 재학습되는 일련의 레이블입니다. 새로운 데이터에는 완전히 다른 계열이 있기 때문에

5개의 주요 구성요소는 데이터세트, 이들의 관계(특징 공간)에서 가져옵니다. 이미 그러한 스크린샷을 작성하고 던졌습니다.

확산을 극복할 수 없다면 강하지 않고 재단련한다는 의미다.
제 생각에는 가벼이 하지 않고 과적합을 처리하는 다른 방법을 사용하는 것이 좋습니다.
 
도서관 :
확산을 극복할 수 없다면 강하지 않고 재단련한다는 의미다.
제 생각에는 가벼이 하지 않고 과적합을 처리하는 다른 방법을 사용하는 것이 좋습니다.
단순 역상관 후에는 스프레드를 극복할 수 없지만 모델은 스프레드가 없는 새로운 데이터에 대해 더 안정적입니다. 직렬성이 검증된 모든 모델은 n.d에 스프레드 없이 쏟아지지만 기차에서는 첫 번째 모델보다 훨씬 낫습니다(또한 스프레드로 쟁기질함). 이것은 순차성에 대한 재교육을 분명히 보여줍니다. 이해하기 힘든건 이해하지만 사실입니다 🤣 사진을 다시 보시면 더 높은 분포의 봉우리를 보실 수 있고 첫 번째 사진에서 꼬리가 나올 수도 있습니다. 이것은 연속성, 변동성, 무엇이든입니다. 거의 즉시 새 데이터로 변경되므로 과적합됩니다. 이것은 두 번째 맨 아래 그림에 없고 남은 모든 것이 거기에 있으며 이 쓰레기에서 스프레드를 이길 알파를 찾아야 합니다. 데이터를 보고 최소한 직렬화를 제거하거나 어떻게든 변환하여 꼬리를 제거하십시오. 그런 다음 일반 클러스터 그룹이 있는지 또는 나와 같은 완전한 무작위 그룹이 있는지 여부에 관계없이 남아 있는 클래스 분포를 살펴봅니다. 따라서 작업 데이터 세트 또는 쓰레기를 시각적으로 이해할 수도 있습니다. 그런 다음 열차의 유효성 검사를 방해할 수 있으며 아무 영향도 미치지 않습니다. 그리고 당신은 "그냥 사진"이라고 말합니다.
 
도서관 :

//день недели, час = ввести через 2 предиктора sin и cos угла от полного цикла 360/7,  360/24
                     
if(nameInd[nInd]=="Hour")        {CopyTime        (sim,per,startDt,n_bar+1,dtm);TimeToStruct(dtm[0],dts);ArrayResize(tmp,1);tmp[0]=(double)(dts.hour*60+dts.min)*360.0/1440.0;tmp[0]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));}// для увеличения точности добавлены минуты  360/24 = 360/24/60 = 360/1440

if(nameInd[nInd]=="WeekDay")     {CopyTime        (sim,per,startDt,n_bar+1,dtm);TimeToStruct(dtm[0],dts);ArrayResize(tmp,1);tmp[0]=(double)(dts.day_of_week*1440+dts.hour*60+dts.min)*360.0/10080.0;tmp[0]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));}// для увеличения точности добавлены часы и минуты 360/7 = 360/7/24/60 = 360/10080

코드에 따르면 buf==0이면 사인이고 그렇지 않으면( buf==1 ) 코사인입니다.


나무 모델은 모든 것을 소화합니다.
NS에 대한 사인과 코사인은 이미 -1...+1로 정규화되어 있기 때문에 좋습니다.

이 옵션을 번호가 매겨진 시간과 비교하면 구독을 취소하는 것이 더 좋습니다. 요일, 시, 분을 제출하면 100% 일치해야 하는 것 같습니다.

잘 이해하지 못했습니다. 사인 또는 코사인을 사용자의 재량으로 구한 것입니까?

파이 - 어딘가에서 라이브러리에서 가져오거나 특정 기호에 대한 정확도만 가져왔습니다. 어느 쪽이 설정한 상수를 여기에 쓰는 것이 더 좋습니다.

 
알렉세이 비아즈미킨 :

잘 이해하지 못했습니다. 사인 또는 코사인을 사용자의 재량으로 구한 것입니까?

파이 - 어딘가에서 라이브러리에서 가져오거나 특정 기호에 대한 정확도만 가져왔습니다. 어느 쪽이 설정한 상수를 여기에 쓰는 것이 더 좋습니다.

몇 시간 동안 사인과 코사인의 2개 열을 모델에 입력해야 합니다. 그리고 요일에 대한 사인 + 코사인. 이것이 수행되어야 하는 이유에 대한 설명 - 링크.

파이 = 3.141529 ... 학교에서

 

위에서 논의한 책은 나에게 수학 지식의 부족에 대한 인식을 제공합니다. 누가 자유롭게 읽는다면 나는 부럽습니다.

문제는 다른 시간 간격으로 주기적으로 반복되는 프로세스를 하나 또는 두 개의 숫자로 설명하는 것이 더 낫습니까? 그런 다음 프로세스는 높은 반복률, 특정 조밀한 그룹을 가지며 주파수가 감소하고 신호가 관찰된 간격의 15%가 아닐 수 있습니다. 목표는 관찰 기간의 어느 부분에서든 임계(70% 퍼센트) 밀집이 없는지 확인하고 동시에 다른 간격(즉, 다른 간격)에서 충분한 신호가 없는지 확인하는 것입니다. 균일 분포에 가까울수록 더 좋지만 신호의 특성 자체가 균일하지 않습니다(제 생각에는).

 
알렉세이 비아즈미킨 :

잘 이해하지 못했습니다. 사인 또는 코사인을 사용자의 재량으로 구한 것입니까?

파이 - 어딘가에서 라이브러리에서 가져오거나 특정 기호에 대한 정확도만 가져왔습니다. 어느 쪽이 설정한 상수를 여기에 쓰는 것이 더 좋습니다.

CATboost 가 있습니다. 기능을 범주형으로 표시하기만 하면 됩니다.
사유: