트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 137

 
mytarmailS :


무엇이 문제인가? 도와주세요, 제발


작동 방식은 다음과 같습니다.

test_vec <- numeric() # тут будем хранить показатели теста 


for(i in 151:ln){

print(i)

idx <- (i-150):i

#проводим линейную регрессию для определения правильного соотношения

x <- data[idx, ]

model <- lm(ri ~ si + 0, x)

#вычисляем разницу цен (спред)

spread <- x$ri - coef(model)[[1]] * x$si

#проводим тест Дики-Фуллера на стационарность

test <- adf.test(as.vector(spread), k = 0)

test_vec[i-150] <- test$p.value

}


plot(test_vec, type = 's')

 
알렉세이 버나코프 :

첫째, R^2 0.55는 "메타피체"에 약간의 기능적 변환을 적용하여 실제로 달성할 수 있습니다. 또 다른 점은 기능이 외관상 다소 복잡하다는 것입니다.

또한 다음을 시도하십시오.

rowMeans(df[, 1:10])

...

10개의 새 열을 추가했는데 nnet에 대해 아무 것도 변경하지 않았으며 결과 및 학습 곡선은 거의 동일하게 유지되었으며 모델은 동일한 예측 변수를 선택합니다.

그러나 나무는 갑자기 훨씬 더 나은 결과를 주었습니다. 숲도 더 좋지만 한 나무 자체가 선두에 있습니다(의사 r^2=0.39). 여기에 새 데이터에 대한 덜걱거리는 그래프가 있습니다.

트리는 훈련 데이터의 값을 기억하여 rowMeans[,1:50]만 선택했습니다. 따라서 rowMeans[,1:50]와 대상 사이에는 매우 가깝지만 비선형 관계가 있습니다.

그러나 이 10개의 새로운 예측 변수만 남겨두면 nnet은 r^2=0.22를 학습하게 되며, 이는 또한 더 좋습니다.

 
Dr.Trader :

10개의 새 열을 추가했는데 nnet에 대해 아무 것도 변경하지 않았으며 결과 및 학습 곡선은 거의 동일하게 유지되었으며 모델은 동일한 예측 변수를 선택합니다.

그러나 나무는 갑자기 훨씬 더 나은 결과를 주었습니다. 숲도 더 좋지만 한 나무 자체가 선두에 있습니다(의사 r^2=0.39). 여기에 새 데이터에 대한 덜걱거리는 그래프가 있습니다.

트리는 훈련 데이터의 값을 기억하여 rowMeans[,1:50]만 선택했습니다. 따라서 rowMeans[,1:50]와 대상 사이에는 매우 가깝지만 비선형 관계가 있습니다.

그러나 이 10개의 새로운 예측 변수만 남겨두면 nnet은 r^2=0.22를 학습하게 되며, 이는 또한 더 좋습니다.



정확히 추측했습니다. 평균(1:50). 좋은 결과. 이제 함수 근사를 약간 개선하려고 합니다. 어렵지 않다면 시뮬레이션된 출력에 대해 발견된 기능의 산점도를 게시하십시오. NS 또는 임의 포리스트의 경우. 나중에 내 글을 올리겠습니다. 비선형성이 있어야 합니다.

 

알렉세이 버나코프 :

비선형성이 있어야 함

그래프로 판단하면 약간의 연결이 있습니다. 그러나 뉴런이 무엇인지, 나무가 무엇인지, 그것들은 특정한 일반적인 경향만을 강조합니다. 네, 그리고 이 예측자만으로는 모델을 훈련시키는 것이 분명히 불가능할 것입니다. 트리에서 더 많은 것을 얻는 것은 불가능합니다.

 
Dr.Trader :

그래프로 판단하면 약간의 연결이 있습니다. 그러나 뉴런이 무엇인지, 나무가 무엇인지, 그것들은 특정한 일반적인 경향만을 강조합니다. 네, 그리고 이 예측자만으로는 모델을 훈련시키는 것이 분명히 불가능할 것입니다. 트리에서 더 많은 것을 얻는 것은 불가능합니다.

감사해요.

그래, 난 동의.

내 차트:

rmse 최소화

실제 의존성:

모델:

실제 및 모델:

원래 아이디어는 깨끗합니다.

소음을 고려하여 실제로 어떻게 나타나는지 이미 보았습니다.


가능한 최대 시뮬레이션 품질:

 
알렉세이 버나코프 :

작동 방식은 다음과 같습니다.

고마워, 나는 그것을 알아내지 못했을 것이다.
 
트레이더 박사 :

그래프로 판단하면 약간의 연결이 있습니다. 그러나 뉴런이 무엇인지, 나무가 무엇인지, 그것들은 특정한 일반적인 경향만을 강조합니다. 네, 그리고 이 예측자만으로는 모델을 훈련시키는 것이 분명히 불가능할 것입니다. 트리에서 더 많은 것을 얻는 것은 불가능합니다.

작업을 요약하고 이해한 내용을 작성해야 합니다.

실생활에서 우리는 중독의 유형에 대해 아무것도 모릅니다.

나는 다음과 같이 이해했다.

1) 가격 반환과 같은 많은 단순한 기능에서 의존성을 추출하기 어렵고 많은 방법이 잘 작동하지 않습니다. 그러나 일반적인 원리에 따르면 컨볼루션을 통해 근사해를 구할 수 있습니다.

2) 미리 많은 피처를 생성해 두면 평소의 방법이 잘 통할 가능성이 상당합니다.

3) 원시 기능에 대한 최상의 품질 메트릭, 컨볼루션 NN 이후 일반 NN에서 다른 방법은 거의 동일한 결과를 가져옵니다.

4) 잠재적으로 생성된 기능 집합에서 포리스트, NS가 잘 작동합니다.

5) 사람이 아닌 기능을 수집하기 위해 번들 자체를 남겨 두는 것이 더 바람직한지 여부는 여전히 열려 있습니다. 올바른 컨볼루션 아키텍처를 검색할 때 작업은 아마도 많은 기능을 미리 생성하는 것 이상일 것입니다.

무엇을 추가합니까, 박사님?

 

방금 문제를 게시했을 때 기능을 생성하려고 시도했습니다. 알고리즘은 밤새 다른 수학적 조합을 거쳤고 vtreat 추정을 통해 최고의 새 예측 변수를 선택했습니다. 긍정적인 결과는 없었고 모델은 새로운 예측 변수로부터 실제로 학습조차 할 수 없었습니다. 즉, 실수로 여기에 와서 필요한 예측 변수와 수학 연산을 추측하거나 추측하지 않습니다. 옵션을 생성하고 정렬하는 데 며칠을 보낼 수 있지만 여전히 의미가 없습니다. 원래 예측 변수 의 컨벌루션 네트워크 는 행 평균을 사용하는 일반 네트워크보다 더 나은 결과를 얻었으므로 컨볼루션 네트워크에서 중지하는 것이 더 나을 것입니다.

 
트레이더 박사 :

방금 문제를 게시했을 때 기능을 생성하려고 시도했습니다. 알고리즘은 밤새 다른 수학적 조합을 거쳤고 vtreat 추정을 통해 최고의 새 예측 변수를 선택했습니다. 긍정적인 결과는 없었고 모델은 새로운 예측 변수로부터 실제로 학습조차 할 수 없었습니다. 즉, 실수로 여기에 와서 필요한 예측 변수와 수학 연산을 추측하거나 추측하지 않습니다. 옵션을 생성하고 정렬하는 데 며칠을 보낼 수 있지만 여전히 의미가 없습니다. 원래 예측 변수의 컨벌루션 네트워크는 행 평균을 사용하는 일반 네트워크보다 더 나은 결과를 얻었으므로 컨볼루션 네트워크에서 중지하는 것이 더 나을 것입니다.

감사합니다 박사님!

네, 그것도 타당한 주장입니다. 내 습관에서 나는 슬라이딩 증가 창으로 합계를 표시하고 슬라이딩 지연 및 기타 모든 것이 과거로 슬라이딩하는 차이를 표시합니다.

거의 모든 것을 모델링하기 위해 (거의!) 다음 형식의 예측 변수를 사용하는 것으로 충분하다는 의견이 있습니다.

current_price - 가격(lag1)

current_price - 가격(lag2)

...

current_price - 가격(lag_n)

이것은 이동 합계(평균으로 쉽게 축소됨)로 처리될 수 있으며 다른 위치의 꼬임, 속도, 가속과 같은 모든 추세 구성을 재현할 수 있습니다.

우리가 convolutional network에 대해 이야기한다면 나는 실용적인 것을 해결하기 위해 내가 준 코드를 시도해 볼 것을 제안합니다. 그리고 네트워크의 가중치와 코어 분석에 중점을 둡니다. 커널은 컨볼루션의 보기를 표시합니다. 가중치는 중요도와 비선형성을 나타낼 수 있습니다.

개인적으로 나는 여전히 내 주요 실험에서 휴식을 취하고 있지만 이미 견딜 수 있는 결과가 있습니다. 그냥 지쳤습니다... 컨볼루션 네트워크를 사용하여 하나의 주식 상품을 예측하기로 결정했습니다. 오버헤드가 상당히 낮고(Forex의 스프레드보다 10배 더 낮음) 효과가 있을 것이라는 환상이 있습니다. 그럼 더 말씀드리겠습니다.

CNN 빠른 과정: http://cs231n.github.io/convolutional-networks/

 

이 비디오 강의는 YouTube에도 있었고 거기에서 제거되었지만 archive.org에 남아 있었습니다. - https://archive.org/details/cs231n-CNNs

영어로 되어 있지만 매우 유익하고 도움이 됩니다. 주로 convolutional network에 의한 이미지 인식에 관한 것이지만 일반적으로 뉴런에 대한 유용한 정보가 많이 있습니다.

사유: