트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 98

 
트레이더 박사 :

실험의 두 번째 부분 -

나는 이전에 14개의 예측 변수를 선택했고 14개에 임의의 값을 추가했습니다. ForeCA 구성 요소의 최대 허용 수는 이제 28입니다.

두 경우 모두(foreCA가 있거나 없는) 훈련 데이터의 28개 구성 요소 모두에 대한 예측 정확도는 76%이고 두 경우 모두 새 데이터의 정확도는 57%입니다.

제 생각에는 forCA가 예측기의 쓰레기에 대처하지 못했고 예상되는 기적을 보지 못했습니다.

놀라운!

작업량을 줄여주셔서 감사합니다.

 
다른 데이터에서는 예측 변수의 공분산이 너무 높기 때문에 ForeCA 예제가 작동하지 않는다는 것을 알았습니다.
이것은 다음 코드로 해결할 수 있습니다.
 #это строки кода из примера:
targetName <- colnames(trainData)[ncol(trainData)]
predictorColnames <- colnames(trainData)[-ncol(trainData)]
#...
#это нужно добавить сразу после них:
while ( TRUE ){
        covMatrix <- cov(as.matrix(trainData[,predictorColnames]))
        covMatrixRank <- qr(covMatrix)$rank
         if (covMatrixRank == ncol(covMatrix)){
                 break
        } else {
                eigenValues <- abs(eigen(covMatrix)$values)
                 # eigenValuesLow <- order(eigenValues, decreasing= FALSE )[ 1 :(ncol(covMatrix)-covMatrixRank)]
                 # predictorColnames <- predictorColnames[-eigenValuesLow]
                eigenValuesHigh <- order(eigenValues, decreasing= TRUE )[ 1 ]
                predictorColnames <- predictorColnames[-eigenValuesHigh]
        }
}
하나씩 고유값이 높은 예측 변수가 공분산 행렬에서 제거됩니다. 고유값이 낮은 예측 변수를 제거하는 것이 좋습니다. 하지만 여전히 길고 비효율적이지만 어떻게 하면 더 잘할 수 있을지 아직 모르겠습니다.
 

지표가 작동하지 않았으며 작동하지 않는 이유는 무엇입니까? 내 의견 ... 그리고 어떻게 고칠 수 있습니까 ....

인내에 대해 조금... :)

우리 모두는 시장이 고정되어 있지 않다는 것을 잘 알고 있지만 대부분의 경우 시장 분석을 위해 나를 포함하여 고정 시리즈 전용 도구를 사용합니다. 왜 그런지 모르겠습니다. 이유가 무엇입니까? 패션? 완고? 고집?

예를 들어, 고정되지 않은 데이터를 분석하기 위한 잘 정립된 알고리즘이 있지만 그 중 많지는 않습니다. 이들은 숨겨진 Markov 모델 "HMM" , 인수 "MGUA"에 대한 그룹 회계 방법, 특히 VR의 경우 순환 신경망, 왜 이러한 알고리즘을 사용하지 않습니까 ??? 결국 논리적으로 이것은 시작하는 첫 번째 것입니다 ... 그러나 우리 모두는 모든 종류의 숲, 일반 뉴런, karoch를 사용합니다. 작업이 일반적으로 다른 가장 멍청한 분류기

왜 그런 겁니까? 이 모든 것을 이해한 나조차도 계속 RF를 훈련하는 이유는... 우리가 일반적으로 잘못한 것은... 그것에 대해 어떻게 생각하는지..

이제 지표에 대해 그리고 다시 완고함에 대해 조금... ;)

시장이 비정상적이라는 것을 알기 때문에 미래에 작동할 몇 가지 지표 매개변수를 찾으려고 노력합니다. 시장이 지속적으로 변한다면 이것이 어떻게 가능할까요? 네, 답은 뻔합니다! 아니면 너무 명확하지 않은지...

지표를 적용하여 시장에 보다 객관적인 방법이 있는 것 같습니다. 아이디어를 설명하기 위해 스펙트럼 분석이 이 경우 웨이블릿

승

그림에서 왼쪽에 눈금이 있고 기간이 표시되어 있습니다. 즉, 시장에 나와 있는 기간은 차트의 영역이 붉을수록 기간이 더 강하고 기간이 더 강하고 가장 강한 기간은 검은색으로 표시됩니다. 사진과 같이...

코드를 실행할 때까지 더 이상 읽지 마십시오.

코드가 실행된 후 스튜디오에서 사진 위의 "뒤로" 화살표를 클릭하면 코드가 실행된 후 나온 모든 사진이 슬라이드처럼 보입니다.

install.packages( "dplR" )

hankel <- function(data, r= 10 ) {
   do .call(cbind,
          lapply( 0 :(r- 1 ),function(i) { data[(i+ 1 ):(length(data)-(r- 1 -i))]}))} #hankel matrx

price <- cumsum(rnorm( 200 ))+ 1000     ;    plot(price,t= "l" )
H.price <- hankel(price, 100 )

library (dplR)
for (i in nrow(H.price): 1 ){
  m <- morlet(y1 = H.price[i,] )
  wavelet.plot(m)
}

당신은 시장의 기간이 하늘의 구름처럼 끊임없이 떠있는 것을보고 이제 시장의 고정 된 기간과 관련이 없다는 것이 분명해졌지만 적응할 수 있습니다. 시장에서 현재 강세 기간을 식별하고 지표를 현재 시장에서 정확히 실제 객관적인 기간으로 지속적으로 조정하면 어떻게 될까요?

연결

https://cran.r-project.org/web/packages/dplR/vignettes/timeseries-dplR.pdf

https://www.r-bloggers.com/wavelet-spectrogram-non-stationary-financial-time-series-analysis-using-r-ttrquantmoddplr-with-usdeur/

 

NS 애호가를 위해 여기

딥 러닝 파트 1: 심볼릭 딥 러닝 프레임워크 비교

Deep Learning Part 1: Comparison of Symbolic Deep Learning Frameworks
Deep Learning Part 1: Comparison of Symbolic Deep Learning Frameworks
  • Joseph Rickert
  • www.r-bloggers.com
This blog series is based on my upcoming talk on re-usability of Deep Learning Models at the Hadoop+Strata World Conference in Singapore. This blog series will be in several parts – where I describe my experiences and go deep into the reasons behind my choices. Deep learning is an emerging field of research, which has its application across...
 
mytarmailS :

지표가 작동하지 않았으며 작동하지 않는 이유는 무엇입니까? 내 의견 ... 그리고 어떻게 고칠 수 있습니까 ....

우리 모두는 시장이 고정되어 있지 않다는 것을 잘 알고 있지만 대부분의 경우 시장 분석을 위해 나를 포함하여 고정 시리즈 전용 도구를 사용합니다. 왜 그런지 모르겠습니다. 이유가 무엇입니까? 패션? 완고? 고집?

시장이 비정상적이라는 것을 알기 때문에 미래에 작동할 몇 가지 지표 매개변수를 찾으려고 노력합니다. 시장이 지속적으로 변한다면 이것이 어떻게 가능할까요? 네, 답은 뻔합니다! 아니면 너무 명확하지 않은지...


그리고 Sanych가 그것에 대해 것처럼 분류가 실패하지 않습니까?
 
유리 에브센코프 :
그리고 Sanych가 그것에 대해 것처럼 분류가 실패하지 않습니까?
더 자세히 설명하겠습니다. 그렇지 않으면 우리가 어떤 종류의 분류에 대해 이야기하고 있는지 전혀 이해하지 못했습니다.
 
mytarmailS :
더 자세히 설명하겠습니다. 그렇지 않으면 우리가 어떤 종류의 분류에 대해 이야기하고 있는지 전혀 이해하지 못했습니다.

L 네, 제가 의사입니까? Sanych는 다음과 같이 썼습니다.

"여기서 다음 막대를 예측할 때 이전 상태를 고려하지 않은 분류 기반 예측에 대해 논의하고 있습니다. 분류 기반 예측(예측)은 패턴별 예측입니다. 그리고 과거에 변화를 가져온 뉴스가 있었다면 이전 값(외삽되지 않음)에서 따르지 않는 경우 분류는 그러한 변경을 포착 하고 미래에 유사한 변경(정확히 동일하지는 않지만 유사)이 있는 경우 인식하고 정확한 예측을 할 것"이라고 말했다.

그래서 저는 이 방향으로 파고들 가치가 있다고 생각합니다: " 분류는 그러한 변화를 포착할 것 입니다."

 
유리 에브센코프 :

L 네, 제가 의사입니까? Sanych는 다음과 같이 썼습니다.

"여기서 다음 막대를 예측할 때 이전 상태를 고려하지 않은 분류 기반 예측에 대해 논의하고 있습니다. 분류 기반 예측(예측)은 패턴별 예측입니다. 그리고 과거에 변화를 가져온 뉴스가 있었다면 이전 값(외삽되지 않음)에서 따르지 않는 경우 분류는 그러한 변경을 포착 하고 미래에 유사한 변경(정확히 동일하지는 않지만 유사)이 있는 경우 인식하고 정확한 예측을 할 것"이라고 말했다.

그래서 저는 이 방향으로 파고들 가치가 있다고 생각합니다: " 분류는 그러한 변화를 포착할 것 입니다."

진리의 실험 기준 - 생각하지 말고 행하라

저는 개인적으로 스펙트럼 분석이 더 유망하다고 생각하지만 이것은 개인적으로 ...

 
유리 에브센코프 :


그래서 저는 이 방향으로 파고들 가치가 있다고 생각합니다: " 분류는 그러한 변화를 포착할 것 입니다."

분류는 만병 통치약이나 성배를 만드는 도구가 아닙니다.

분류를 적용하는 첫 번째 일은 도구를 적용할 수 있는 문제에 도구를 적용하는 것입니다. 예를 들어, 스펙트럼 분석을 금융 시장에 적용한다는 아이디어는 여러 번 논의되었으며 모든 것이 훌륭한 도구인 것처럼 보이지만 다른 개체의 경우에는 아니요, 다시 제공됩니다.

두번째. 분류는 금융 시장에 꽤 적용 가능하지만 여기에는 많은 문제가 있습니다. 그러나 분류할 때 주요 문제는 TS 재교육(과적합) 문제인 최전선에 놓일 수 있습니다. 무엇이 더 중요할 수 있습니까? 물론 가장 좋아하는 성배가 있다는 환상을 잃는 것은 즐겁지 않지만 여기에 선택이 있습니다. 행복은 좋지만 진실이 더 낫습니까?

제삼. 분류는 매우 구체적으로 질문을 제기합니다. 우리는 무엇을 예측합니까? TA와 비교하십시오. 우리는 지표를 취합니다. 항상 바입니다 [1]. 현재 막대는 사용되지 않습니다. H1은 무슨 뜻인가요? 시간별 신선도 정보를 사용 하여 시장 진입 을 예측합니다! 이것은 기껏해야.

분류가 완전히 다릅니다. 대상 변수의 현재 값을 가져와 어제의 초기 데이터와 비교합니다. 대상 변수를 하나 이상의 막대만큼 이동합니다. 이러한 데이터에 맞는 모델을 사용할 때 다음 막대가 도착할 때 항상 미래를 예측합니다.

추신.

급격한 시장 움직임(뉴스)을 예측하는 데 사용하려는 경우 목표 변수를 형성하면 성공할 수 있으며 이는 훨씬 단순한 경우에 큰 문제입니다.

 
다포멘코 :

예를 들어, 스펙트럼 분석을 금융 시장에 적용한다는 아이디어는 여러 번 논의되었으며 모든 것이 훌륭한 도구인 것처럼 보이지만 다른 개체의 경우에는 아니요, 다시 제공합니다.

????????????????????????????

연구원의 스펙트럼 분석 개념이 Wikipedia 기사로 끝나면 시장에 적용되지 않는다는 데 동의합니다. :)