트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 92

 
마법사_ :
좋아))) 그러나 조건을 주의 깊게 읽으십시오 -
"두 샘플(train = xx%, test = xx%)에 대한 결과를 %(성공적으로 예측된 사례)로 배치합니다. 방법 및 모델은 음성으로 표시할 필요가 없으며 숫자만 표시됩니다."
더 많은 결과를 기다리고 있습니다. Mihail Marchukajtes가 어떤 결론을 내릴 수 있는지 궁금합니다.

내 결과(원하는 경우 방법도 음성으로 알려드립니다):

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

56% 교육:

> table(glm_predict_train[, 2], glm_predict_train[, 1])

      

       down  up

  down  333 181

  up    256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

      

        down    up

  down 0.333 0.181

  up   0.256 0.230

52% 테스트:

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

      

       down  up

  down  332 173

  up    309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

      

        down    up

  down 0.332 0.173

  up   0.309 0.186

 
뭐, 일반적으로 데이터 일반화의 최대 수준은 약 53% 정도 이므로.....쓰레기 속 쓰레기가 가끔 기어나오네, 그건 쓰레기야.... 긴 수식이 있기 때문에 테스트를 확인할 방법이 없다. 엑셀에서는 지원하지 않습니다. 이 경우 MKUL에 글을 쓰고 싶지 않습니다. 모델이 정상적인 품질이면 혼란스러워 할 것이고 일반화 비율이 높으면 테스트 결과가별로 좋지 않을 것이라고 생각합니다 ...
 
mytarmailS :
나는 이 "예측 가능성"이 어떻게 계산되는지 이해하지 못하며 목표가 고려되지 않은 경우에 의미가 있습니까?

거기에서 일부 공식의 도움으로 신호가 얼마나 시끄러운지 또는 그 반대의 경우가 규칙적인지 추정됩니다. 한 저자가 어떻게 그리고 어떤 수식을 계산하는지 알고 있으므로 그가하는 일을 이해하고 있다고 믿을 수 있습니다.
본질은 매우 간단합니다. 예측자 자체가 "노이즈"가 아닌 경우 무언가를 예측하는 것이 더 쉽습니다. 그리고 어떻게 든 처리되면 훨씬 더 안정적인 신호를 얻을 수 있습니다. 안정적인 신호는 예측을 위한 좋은 기초입니다.

이 패키지의 Omega() 함수를 사용하여 예측자를 직접 빠르게 평가할 수도 있습니다. 특정 예측자의 값(훈련 테이블의 한 열)을 제공해야 합니다. 결과 0% - 노이즈와 예측기는 쓸모가 없습니다. 100% - 모든 것이 정상이며 예측자를 사용할 수 있습니다.
나는 함수에 순수한 지표 값이 아니라 그 성장을 예를 들어 이동 평균 - c(MA[0]-MA[1], MA[1]-MA[2], MA[2])에 공급해야 한다고 생각합니다. ]-MA[ 3] 등).

대상 값은 예, 패키지에 사용되지 않습니다. 이 패키지는 아무것도 예측할 수 없습니다. 신뢰할 수 있는 예측 변수와 그렇지 않은 예측 변수를 어떻게든 결정하고 이를 기반으로 몇 가지 새로운 예측 변수를 생성합니다. 대상 변수의 선택과 예측 모델의 학습은 다르게 처리되어야 합니다. 일부 대상 변수는 더 잘 예측되고 일부는 더 나빠지는 것이 논리적입니다.
대상 변수는 일반적으로 모든 패키지의 문제입니다. 사용된 목표 변수를 사용 가능한 예측 변수를 사용하여 전혀 예측할 수 있는지는 확실하지 않습니다. 예를 들어, "다음 막대에 대한 가격 상승/하락" 또는 목표 변수에 대해 "지그재그 상승/하락"을 사용할 수 있습니다. 기존 예측 변수와 가장 잘 맞도록 새 대상 변수를 만드는 방법을 배우고 싶습니다. 누가 알겠습니까? 예측기로 아파트를 완벽하게 예측할 수는 있지만 시도하지 않았기 때문에 절대 알 수 없습니다.

 
내가 이해하는 한 아무도 조건을 읽지 않으므로 (데이터 조작을 사용할 수 있음) 괴롭히지 않을 것입니다. 사실 모든 것이 간단합니다.
A6에서 시차를 가져오고 5보다 작은 7의 간단한 공식을 적용하고 두 샘플에서 100%를 얻으면 됩니다. 모두에게 감사합니다. 행운을 빕니다...
 
마법사_ :
내가 이해하는 한 아무도 조건을 읽지 않으므로 (데이터 조작을 사용할 수 있음) 괴롭히지 않을 것입니다. 사실 모든 것이 간단합니다.
A6에서 시차를 가져오고 5보다 작은 7의 간단한 공식을 적용하고 두 샘플에서 100%를 얻으면 됩니다. 모두에게 감사합니다. 행운을 빕니다...
글쎄, 캐치는 무엇입니까??? 입력 가비지 힙에서 이와 같은 출력 변수를 인코딩할 수도 있습니다. 도대체 무슨 추측. 이게 무슨 뜻인지 아직도 이해가 안감??
 
마이클 마르쿠카이테스 :
글쎄, 캐치는 무엇입니까??? 입력 가비지 힙에서 이와 같은 출력 변수를 인코딩할 수도 있습니다. 도대체 무슨 추측. 이게 무슨 뜻인지 아직도 이해가 안감??
그는 사용된 데이터의 양이 예측에 항상 충분하지 않다는 사실에 주의를 기울였습니다. 예를 들어, 9개의 막대로 제한함으로써 더 먼 막대에서 중요한 정보를 놓칠 수 있습니다. 또한 다른 예측 변수와의 상호 작용을 고려하지 않고 예측 변수를 평가하는 것은 불가능합니다.
 
마이클 마르쿠카이테스 :
글쎄, 캐치는 무엇입니까??? 입력 가비지 힙에서 이와 같은 출력 변수를 인코딩할 수도 있습니다 . 도대체 무슨 추측. 이게 무슨 뜻인지 아직도 이해가 안감??
고퍼가 보이지 않지만 존재한다는 사실)))
해보자. 단순합니다.
 
마법사_ :
고퍼가 보이지 않지만 존재한다는 사실)))
해보자. 단순합니다.
자, 생각 좀 해보게...
 
예를 들어 이 파일이 있습니다. Chitso 기차는 테스트를 수행할 필요가 없습니다. 옵티마이저에서 Reshetov는 가비지 실트 56%를 보여주지만 거기에는 고퍼도 있습니다. 누가 찾을 수 있나요....???? 사실, 나는이 게임에서 요점을 보지 못합니다. 출력이 입력 변환에서 만들어지면 네트워크가 필요하지 않습니다 .... 그래서 ....
 
마이클 마르쿠카이테스 :
예를 들어 이 파일이 있습니다. Chitso 기차는 테스트를 수행할 필요가 없습니다. 옵티마이저에서 Reshetov는 가비지 실트 56%를 보여주지만 거기에는 고퍼도 있습니다. 누가 찾을 수 있나요....???? 사실, 나는이 게임에서 요점을 보지 못합니다. 출력이 입력 변환에서 만들어지면 네트워크가 필요하지 않습니다 .... 그래서 ....
톱질, 글쎄,이 포럼은 간단한 Rarovsky 아카이브를 첨부 할 수 없다는 것을 화나게합니다 .... 한 마디로 불결함 ....
파일:
사유: