트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3042

 

데이터에서 몇 가지 "좋은" 규칙/전략 추출하기...

전체 단계

1) 데이터 변환 및 정규화

2) 모델 훈련

3) 규칙 추출

4) 규칙 필터링

5) 시각화

코드가 준비되면 데이터를 대체하기만 하면 됩니다.

close <- cumsum(rnorm(10000,sd = 0.00001))+100
par(mar=c(2,2,2,2))
plot(close,t="l")

sw <- embed(x = close,dimension = 10)[,10:1] #  make slide window data
X <- t(apply(sw,1,scale)) #  normalase data

dp <- c(diff(close),0) #  diff prices
Y <- as.factor( ifelse(dp>=0,1,-1) ) #  target for classification

tr <- 1:500
library(inTrees)  # ?inTrees::getRuleMetric()
library(RRF)

rf <- RRF(x = X[tr,],y = Y[tr],ntree=100)
rule <- getRuleMetric(unique(extractRules(RF2List(rf),X[tr,])),X[tr,],Y[tr])
rule <- data.frame(rule,stringsAsFactors = F)
for(i in c(1,2,3,5)) rule[,i] <- as.numeric(rule[,i])
buy_rules <- rule$condition[ rule$pred==1 ]

plot(x = 1:1000,y = rep(NA,1000), ylim = c(-0.001,0.001)) 
for(i in 1:length(buy_rules)){
   cum_profit <- cumsum( dp[  eval(str2expression(buy_rules[i]))  ] )
   lines(cum_profit,col=8,lwd=1)
}
for(i in 1:length(buy_rules)){
  cum_profit <- cumsum( dp[  eval(str2expression(buy_rules[i]))  ] )
  ccor <- cor(cum_profit, 1:length(cum_profit))
  if(ccor>=0.9)  lines(cum_profit,col=i,lwd=2)
}
abline(h = 0,col=2,lty=2)



문제는 무작위로 "작동하는 TC"를 찾을 수 있다면 실제 데이터에서 발견 된 TC가 무작위가 아니라는 것을 증명하는 방법은 무엇입니까?

Alexey가 여기서 하고 있는데, 이런 종류의 작업에 대한 통계적 테스트가 있는지 궁금합니다.

 
chatgpt에게 물어보면 종종 사람보다 더 유익한 답변을 얻을 수 있습니다 :)

프롬프트를 통해서만 봇을 처음부터 작성하는 실험을 해보고 싶어요.
 
Maxim Dmitrievsky 봇을 처음부터 작성하는 실험을 하고 싶습니다.

왜요? 릴리스를 능가하기 위해? 비록 ..... ... ... ... 나는하고 싶다)))))))))))))))))))))))) 숙련된 손에서 정말 멋진 도구입니다.)

 
Valeriy Yastremskiy #:

왜? 릴리스를 이기려고? 비록 ..... ... ... ... sya)))))))) 올바른 손에 정말 멋진 도구입니다.)

메타 수준의 프로그래밍이고, 게다가 그녀는 파이썬을 완벽하게 알고 있습니다. 나는 또한 소파에 누워서 음성으로 프롬프트를합니다. 아이디어가 떠오르지만 이 코드를 다시 작성하기에는 너무 게으른 경우가 종종 있습니다 :).
 
Maxim Dmitrievsky #:
메타 레벨 프로그래밍인데다 파이썬도 완벽하게 알고 있죠. 소파에 누워서 음성으로 프롬프트를 하기도 해요. 아이디어가 떠오르지만 너무 게을러서 이 코드를 다시 작성하지 못하는 경우가 종종 있습니다.)

동의합니다, 올바른 질문은 메타 수준입니다))))

음 및 코드 실행의 정확성 확인)
 
Valeriy Yastremskiy #:

동의합니다, 제대로 제기 된 질문은 메타 수준입니다)))))

음과 코드 실행의 정확성 확인)
입을 움직일 필요가 없도록 신경 인터페이스를 제공해주세요.
 
성능 저하라고 생각합니다.
 
mytarmailS #:

데이터에서 몇 가지 "좋은" 규칙/전략 추출하기...

전체 단계

1) 데이터 변환 및 정규화

2) 모델 훈련

3) 규칙 추출

4) 규칙 필터링

5) 시각화

준비된 코드 , 데이터를 대체하기만 하면 됩니다.



문제는 무작위로 '작동하는 TC'를 찾을 수 있다면, 실제 데이터에서 찾은 TC가 무작위가 아니라는 것을 어떤 방법으로 증명할 수 있느냐는 것입니다.

Alexey가 여기서 하고 있는데, 이런 종류의 작업에 대한 통계적 테스트가 있는지 궁금합니다.

이러한 문제에 대해 matstat을 적용할 때 가장 큰 문제는 TC 검색이 많은 수의 변형 중에서 선택하여 수행된다는 것입니다. 가격을 SB로 모델링하면 거래하기 좋은 요일을 항상 "찾을 수 있다"는 간단한 예시를 통해 많은 변형 집합에서 매우 아름다운 것을 선택할 수 있습니다. 그리고 선택할 수 있는 변형은 120개에 불과합니다.

매트스탯은 선택한 TS가 반드시 나쁘다고 말하는 것이 아니라, 그러한 결과가 SB에서 선택된 결과일 수 있다는 것(반드시 그런 것은 아님)만을 말합니다.

 
mytarmailS #:

데이터에서 몇 가지 "좋은" 규칙/전략 추출하기...

시작 시 오류가 발생합니다.

> sw <- embed(x = close,dimension = 10)[,10:1] # make slide window data
Error in h(simpleError(msg, call)) : 
  ошибка при оценке аргумента '.data' при выборе метода для функции 'embed': argument ".data" is missing, with no default
 

순전히 이론적인 질문이 생겼습니다. 하나의 ONNX 모델을 사용하여 다른 ONNX 모델을 도출할 수 있는가 하는 것입니다. 예를 들어, 첫 번째 모델은 새로운 데이터를 주기적으로 재학습하고 작업 모델을 업데이트하는 데 사용됩니다. 즉, 파이썬 등을 사용하지 않고도 말이죠.

언뜻보기에 이것은 가능하지 않을 것 같지만 누군가가 이와 같은 일을 시도한 경우를 대비하여.

나는 AI로부터 의미있는 답변을 얻지 못했습니다. AI는 할 수 있다고 쓰고 질문과 관련이없는 참조를 인용합니다).

사유: