트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 82

 
mytarmailS :

모델을 훈련시킬 때, 더 많은 나무, 더 많은 클래스 "0"이 훈련되고 클래스 "0"이 더 강하고 더 잘 학습함에 따라 클래스 "1", "-1", 이것이 더 많은 나무가 더 적은 거래를 의미하는 이유입니다

뭔가 잘못되었습니다. 숲은 거의 항상 왜곡과 함께 100% 정확도를 위해 훈련합니다. 이러한 데이터로 검증하면 문제가 발생할 수 있지만 숲은 항상 훈련 데이터의 결과를 정확하게 예측합니다. 나는 당신이 분류가 아니라 회귀를 사용하고 있다고 가정할 수 있고, 모델을 테스트할 때 명확한 클래스 -1, 0, 1을 얻지는 못하지만 -1에서 1 사이의 범위에 있는 실수를 얻습니다. 회귀로 나오지 않습니다.

이렇게 하는 것이 더 낫습니다. 마지막 열이 대상 변수이고 다른 모든 열이 예측 변수인 trainingData 테이블이 있다고 가정해 보겠습니다.

trainingData <- data.frame(trainingData) #на всякий случай сконвертировать таблицу из матрицы в датафрейм, если не было сделано раньше
trainingData[,ncol(trainingData)] <- factor(trainingData[,ncol(trainingData)]) #тип последней колонки сменить на фактор. Модели в R обычно сразу по этому типу понимают что нужна классификация, и работают чуть иначе чем при регрессии
 
mytarmails :

확실히 그런 방식은 아니지만...

내가 쓰는 것은 내 접근 방식에만 적용됩니다.

내가 어떻게 타겟을 잡는지 알잖아, 반전이야

나는 "up", "down"및 "not turn"( 1 , -1 , 0) 세 가지 턴 클래스가 있습니다.

또한 클래스의 왜곡이 거대하고 클래스 "0"이 "-1" 및 "1"보다 10배 더 많다는 것을 알고 있습니다.

이것은 모델이 가장 많은 관찰을 설명하기 때문에 클래스 "0"에서 가장 잘 훈련된다는 것을 의미합니다. 모델을 훈련할 때 더 많은 트리가 더 많은 클래스 "0"이 훈련되고 클래스 "0"이 더 좋아지고 강해집니다. 그는 클래스 "1", "-1"과 같이 ( 흡수 - 짜내기 ) 배우기 시작합니다. 그래서 트리가 많을수록 트랜잭션이 적습니다.

당신은 나를 위해 놀라운 것들을 씁니다!

불균형 클래스에 대한 매우 독창적인 접근 방식입니다.

그런 다음 내 이해에 따르면 예측 변수 목록에는 노이즈가 포함되어 있지 않을 뿐만 아니라 매우 높은 예측력도 있습니다.

그렇다면 어떻게 달성했습니까?

 
트레이더 박사 :

뭔가 잘못되었습니다. 숲은 거의 항상 왜곡과 함께 100% 정확도를 위해 훈련합니다. 이러한 데이터로 검증하면 문제가 발생할 수 있지만 숲은 항상 훈련 데이터의 결과를 정확하게 예측합니다. 나는 당신이 분류가 아니라 회귀를 사용하고 있다고 가정할 수 있고, 모델을 테스트할 때 명확한 클래스 -1, 0, 1을 얻지 못하지만 -1에서 1까지의 범위에 있는 실수를 얻습니다. 회귀로 나오지 않습니다.

이렇게 하는 것이 더 낫습니다. 마지막 열이 대상 변수이고 다른 모든 열이 예측 변수인 trainingData 테이블이 있다고 가정해 보겠습니다.

나무에 대한 100%는 절대 말도 안되는 소리입니다!

모든 예측 변수에 노이즈가 있는 경우 이러한 결과를 얻기가 매우 어렵습니다. 오류는 여전히 3% -5%입니다. 노이즈는 항상 모든 교차 검증 및 기타 트릭을 사용하여 매우 높은 품질의 결과를 제공합니다.

100%의 정확도는 유일한 의미입니다. 예측 변수 중 대상 변수의 복제본이 있습니다(일부 수정). 저것들. 미래를 내다보는 모델.

 
산산이치 포멘코 :


100%의 정확도는 유일한 의미입니다. 예측 변수 중 대상 변수의 복제본이 있습니다(일부 수정). 저것들. 미래를 내다보는 모델.

이것은 데이터 유출입니다. 데이터를 다시 확인해야 합니다.
 
알렉세이 버나코프 :

이 접근 방식이 마음에 들지 않는 점은 무엇입니까? 설정을 어떻게 선택하시겠습니까?

예, 접근 방식이 훌륭합니다. 더 나은 것을 찾기가 어렵습니다. 문제는 시장 자체에 있습니다 ...

기억하십시오. 나는 실험, 상관 관계 및 역사 의 패턴 검색 (SSA가 아니라 이전)에 대해 이야기했습니다.

나는 현재 상황을 가지고 과거의 유사체를 찾고 그들이 어떻게 끝났는지 살펴 보았습니다. 20 개의 유사체가 발견되었을 때 그러한 상황 "X"가 있었다면, 그 중 17은 하락으로, 3은 증가에서 끝났습니다. 당신이 교차 검증을 하지 않는 것보다 우월성은 얼굴에 있습니다( 당신은 팔 필요가 있습니다 ), 그런데? 그냥 별도의 패턴으로, 동의합니까? 이 패턴이 작동하지 않는 것으로 나타났습니다. 시장이 올라갈 확률이 크면 시장이 자체 통계에 반하여 엄청난 통계적 확률로 진행된다는 것이 밝혀졌습니다.

더 간단하게 말하면 어제 이벤트 "x"가 있었고 그 이후에 가을이 있었고 어제는 이벤트가 있었다면   'x' 하고 어제도 다 쓰러지고 포즈 취한 뒤 사건 이후 무너져   "x" - 오늘이 오면   "x" - 모든 것이 성장할 것입니다. 어떤 종류의 교차 검증이 여기에 도움이 될까요 ?? 없음, 절대

그 과정을 이해하면서 가장 중요한 것을 설명하겠습니다.

시장은 이 비즈니스를 만든 일부 사람들이 합법적으로 다른 사람들로부터 돈을 가져가는 잔인한 비즈니스입니다. 대다수는 항상 잃을 수밖에 없습니다. 모두가 그것에 대해 알고 모두가 그것에 대해 쓰고 아무도 숨기지 않습니다. , 이것은 공리입니다 - 이것은 트레이더의 95%가 돈을 잃는 패턴입니다 - 이러한 시장은 트레이더가 돈을 잃을 확률이 95%인 대다수에 반대합니다

그리고 군중은 거래할 때 무엇을 사용합니까? 그리고 군중은 본질적으로 거래를 성사시키는 단 한 가지뿐입니다.

차트 시각적으로 보고 갭에서 패턴을 검색하고 신경망 교육으로 끝나는 모든 작업은 시장에서 작동하지 않는 통계에 따르면 거래에 불과합니다. 내가 무엇인지 이해합니까? 에 대해 말하다?

시장은 군중의 거래에 반대합니다 ------ 군중은 통계에 따라 행동합니다 ------ 미래에 군중의 행동을 예측하고 그 반대를 수행하기만 하면 됩니다. 예측할 수 있습니다. 유일한 방법, 이것은 통계입니다

)))) 나는 하나에서 시작하여 세 번째로 끝났습니다.

ps 여기에서 내가 말한 모든 것은 내 의견일 뿐이며, 나는 누구에게도 강요하지 않습니다. 나는 논쟁하고 증명할 수 있지만 기분은 아닙니다.

 
트레이더 박사 :

뭔가 잘못되었습니다. 숲은 거의 항상 왜곡과 함께 100% 정확도를 위해 훈련합니다. 이러한 데이터로 검증하면 문제가 발생할 수 있지만 숲은 항상 훈련 데이터의 결과를 정확하게 예측합니다. 나는 당신이 분류가 아니라 회귀를 사용하고 있다고 가정할 수 있고, 모델을 테스트할 때 명확한 클래스 -1, 0, 1을 얻지 못하지만 -1에서 1까지의 범위에 있는 실수를 얻습니다. 회귀로 나오지 않습니다.

이렇게 하는 것이 더 낫습니다. 마지막 열이 대상 변수이고 다른 모든 열이 예측 변수인 trainingData 테이블이 있다고 가정해 보겠습니다.

아니, 분류, 뭔가 잘못되었습니다 ...

qqq

나는 이와 같이 보이는 두 가지 모델을 가지고 있었는데, 별도로 구매 및 착석 클래스 (1, 0) 및 (-1, 0)

못생겼어) 동의

 
mytarmails :

예, 접근 방식이 훌륭합니다. 더 나은 것을 찾기가 어렵습니다. 문제는 시장 자체에 있습니다 ...

기억하십시오. 나는 실험, 상관 관계 및 역사의 패턴 검색(SSA가 아니라 이전)에 대해 이야기했습니다.

나는 현재 상황을 가지고 과거의 유사체를 찾고 그들이 어떻게 끝났는지 살펴 보았습니다. 20 개의 유사체가 발견되었을 때 그러한 상황 "X"가 있었다면, 그 중 17은 하락으로, 3은 증가에서 끝났습니다. 당신이 교차 검증을 하지 않는 것보다 우월성은 얼굴에 있습니다( 당신은 팔 필요가 있습니다 ), 그런데? 그냥 별도의 패턴으로, 동의합니까? 이 패턴이 작동하지 않는 것으로 나타났습니다. 시장이 올라갈 확률이 크면 시장이 자체 통계에 반하여 엄청난 통계적 확률로 진행된다는 것이 밝혀졌습니다.

더 간단하게 말하면 어제 이벤트 "x"가 있었고 그 이후에 가을이 있었고 어제는 이벤트가 있었다면   'x' 하고 어제도 다 쓰러지고 포즈 취한 뒤 사건 이후 무너져   "x" - 오늘이 오면   "x" - 모든 것이 성장할 것입니다. 어떤 종류의 교차 검증이 여기에 도움이 될까요 ?? 없음, 절대

그 과정을 이해하면서 가장 중요한 것을 설명하겠습니다.

시장은 이 비즈니스를 만든 일부 사람들이 합법적으로 다른 사람들로부터 돈을 가져가는 잔인한 비즈니스입니다. 대다수는 항상 잃을 수밖에 없습니다. 모두가 그것에 대해 알고 모두가 그것에 대해 쓰고 아무도 숨기지 않습니다. , 이것은 공리입니다 - 이것은 트레이더의 95%가 돈을 잃는 패턴입니다 - 이러한 시장은 트레이더가 돈을 잃을 확률이 95%인 대다수에 반대합니다

그리고 군중은 거래할 때 무엇을 사용합니까? 그리고 군중은 본질적으로 거래를 성사시키는 단 한 가지뿐입니다.

차트 시각적으로 보고 갭에서 패턴을 검색하고 신경망 교육으로 끝나는 모든 작업은 시장에서 작동하지 않는 통계에 따르면 거래에 불과합니다. 내가 무엇인지 이해합니까? 에 대해 말하다?

시장은 군중의 거래에 반대합니다 ------ 군중은 통계에 따라 행동합니다 ------ 미래에 군중의 행동을 예측하고 그 반대를 수행하기만 하면 됩니다. 예측할 수 있습니다. 유일한 방법, 이것은 통계입니다

)))) 나는 하나에서 시작하여 세 번째로 끝났습니다.

ps 여기에서 내가 말한 모든 것은 내 의견일 뿐이며, 나는 누구에게도 강요하지 않습니다. 나는 논쟁하고 증명할 수 있지만 기분은 아닙니다.

잘.

나에게 외환은 소음이 있는 어리석은 신호입니다. 중독을 찾으면 내가 돈을 가져가고, 내가 다시 훈련하면 브로커가 돈을 가져갑니다. 그리고 군중 등에 대해 정보가 없습니다. 나는 그것을 충분히 얻는 방법을 모른다.

이 실험을 마친 후 견적을 받고 싶습니다. 볼륨은 여전히 실제이며 플러스입니다.

 
알렉세이 버나코프 :

잘.

나에게 외환은 소음이 있는 어리석은 신호입니다. 중독을 찾으면 내가 돈을 가져가고, 내가 다시 훈련하면 브로커가 돈을 가져갑니다. 그리고 군중 등에 대해 정보가 없습니다. 나는 그것을 충분히 얻는 방법을 모른다.

이 실험을 마친 후 견적을 받고 싶습니다. 볼륨은 여전히 실제이며 플러스입니다.

forex는 forex입니다. 그것은 시장이 아닙니다(mt4인 것). 만약 당신이 forex에서 유로달러를 거래한다면, 당신은 무엇이 당신의 그림을 이끄는지 이해해야 합니다. CME 거래소의 유로달러에서 실제 군중은 실제 거래와 함께 움직이지만 터미널에서 방송되는 것은 실제 유로벅스의 움직임을 반복하는 그림일 뿐이며 MT4에서의 거래는 시장에 영향을 미치지 않습니다. 귀하의 10은 은행간 $(비유적으로)의 영향을 받지 않습니다. 아무도 인출하지 않습니다. 귀하는 DC와 거래하고 그게 전부입니다. 또는 오히려 귀하의 드레인이 그의 순이익이기 때문에 그는 귀하와 거래합니다.
 
알렉세이 버나코프 :

이 실험을 마친 후 견적을 받고 싶습니다. 볼륨은 여전히 실제이며 플러스입니다.

나를 믿으십시오. 거래량은 많은 도움이되지 않습니다. 일반적인 변동성으로 대체 할 수 있습니다. 거의 항상 실제 시장에서만 거래합니다. 무슨 말인지 압니다.
 
mytarmailS :
나를 믿으십시오. 거래량은 많은 도움이되지 않습니다. 일반적인 변동성으로 대체 할 수 있습니다. 거의 항상 실제 시장에서만 거래합니다. 무슨 말인지 압니다.

확인.

볼륨에서 입력 기능을 만들려고 시도한 다음 살펴보겠습니다.

사유: