트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 838

 
마이클 마르쿠카이테스 :

일반적으로 예측 변수를 선택하는 데 이 특정 패키지를 사용합니다. 단점이 있음은 분명합니다. 특히 대상 예측 변수와 관련하여 여러 예측 변수의 상호 작용이 부족합니다. 그러나 일반적으로 지금까지는 최적화에 충분합니다 ... 그래서 데이터 전처리를위한 다른 패키지가 있다면 기꺼이 고려하겠습니다 ...

내 경험에 따르면 RandomUniformForest 패키지는 예측 변수의 중요성에 대한 다양한 측면과 관련된 문제에 대한 가장 포괄적이고 전문적인 접근 방식으로 추천할 수 있습니다. 예는 여기에서 볼 수 있습니다.

행운을 빕니다

추신: 그건 그렇고, 새 데이터에 대해 모델을 다시 훈련시킬 수 있는 몇 안 되는 도구 중 하나입니다. 시간이 많이 절약됩니다.

 
박사 상인 :

매주 새로운 투어. 일주일 안에 모델을 훈련하고 예측을 보내야 합니다. 그러나 3주 후에만 모델의 예상 추정치를 알 수 있습니다. 이 3주 동안의 예측값은 실제 예측값과 비교될 것입니다.

나는 그들이 적어도 90 %는 자신을 떠난다고 생각합니다.

"최소 90%를 유지한다고 생각합니다"은(는) 무슨 뜻인가요? 그들이 보낸 이러한 예측을 거래한다고 생각합니까? 일반적으로 예측을 계산할 징후를 미리 어떻게 알 수 있습니까? 보간 또는 무엇? 그들은 문서에 이것이 마이닝에서와 같이 "작업 증명"일 뿐이며 승자도 무작위로 선택되며 아마도 결과의 절반이 거의 같을 것이며 필터가 무작위로 던져져 순위가 매겨집니다. 또한, 예, 이 카지노는 부끄럽지만 데이터 세트는 순수한 합성일 가능성이 높으며 신호가 약간 혼합된 노이즈, 시장이 전혀 없습니다. 헤지 펀드와 물건에 관한 이 모든 헛소리. 순전히 코인의 인기를 얻기 위해서입니다.

 
막심 드미트리예프스키 :

글쎄, Mikhail, 당신은 당신의 분노에서 벗어 났고, 당신은 곧 당신의 차량을 현명하고 광신적으로 평가하기 시작할 것입니까? :)

나는 어떤 분노도 없었다. 최근에도 변함이 없는 냉정한 계산만 있을 뿐입니다. 여전히 작동하는 접근 방식의 이론은 말할 것도 없습니다. 잠시 동안..

 
고비치 :

특히, 그들이 자신을 위해 얼마나 많이 남기는지에 대해서는 공식적으로 작성되지 않았습니다. 각종 금융잡지들이 2016년에 150만 정도의 이익을 기록했는데, 이 중 참가자들에게 얼마를 지급했는지 비교해보면 조금 나옵니다.

> 그들이 보낸 이러한 예측을 거래한다고 생각하십니까?
예, 이것이 전체 전략입니다. 예를 들어, 여러 기능을 만들고 교육 테이블을 만들고 여기 포럼에 보내고 10명이 예측을 제공하고 거래를 합니다. 모든 것이 간단합니다.
그들은 오랫동안 자신의 암호를 가지고 있지 않았고 비트 코인으로 지불했습니다. 그들은 1년 동안 매주 비트코인으로 수천 달러를 받고 지불했습니다. 그런 다음 그들은 비트 코인을 망치지 않도록 암호를 공개했습니다.

> 일반적으로 예측을 계산할 징후를 미리 어떻게 알 수 있습니까? 보간 또는 무엇?
보간, 최근접이웃에 의한 예측, 클러스터링, 많은 옵션이 있으며 특정 답변을 제공하지 않으며 추측만 할 수 있습니다.

 
블라디미르 페레르벤코 :

내 경험에 따르면 RandomUniformForest 패키지는 예측 변수의 중요성에 대한 다양한 측면과 관련된 문제에 대한 가장 포괄적이고 전문적인 접근 방식으로 추천할 수 있습니다. 예는 여기에서 볼 수 있습니다

행운을 빕니다

추신: 그건 그렇고, 새 데이터에 대해 모델을 다시 훈련시킬 수 있는 몇 안 되는 도구 중 하나입니다. 시간이 많이 절약됩니다.

그것을 시도했다. 결과를 얻지 못했습니다...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

5분 후에 나옵니다.
OOB.votes의 오류 - Y : 유사하지 않은 다차원 행렬

제공된 매트릭스의 구조:

> str(x1)
숫자 [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
숫자 [1:20000, 1] 0 0 0 0 0 0 1 1 1 1 ...
> str(x2)
숫자 [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
숫자 [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

그것은 명확하지 않습니다 - 그가 무엇과 함께 요구하는 것과 유사합니다.
xtest = x2, ytest = y2 없이 시도 - 동일한 결과.
다음 패키지로 넘어가겠습니다.

 
도서관 :

그것을 시도했다. 결과를 얻지 못했습니다...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

5분 후에 나옵니다.
OOB.votes의 오류 - Y : 유사하지 않은 다차원 행렬

제공된 매트릭스의 구조:

> str(x1)
숫자 [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
숫자 [1:20000, 1] 0 0 0 0 0 0 1 1 1 1 ...
> str(x2)
숫자 [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
숫자 [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

그것은 명확하지 않습니다 - 그가 무엇을 요구하는 것과 유사합니다.
xtest = x2, ytest = y2 없이 시도 - 동일한 결과.
다음 패키지로 넘어가겠습니다.

그것이 작동하지 않은 이유는 분명하지 않으며 모든 것이 저에게 효과적입니다.

캐럿에서 좋은 결과를 얻었습니다. 예측 변수를 선택하는 세 가지 기능이 있으며 효율성은 다르지만 다른 방식으로 컴퓨팅 리소스 를 소비합니다.


또 다른 매우 흥미로운 패키지가 있습니다: CORElearn. 이 패키지에는 예측 변수를 선택하기 위한 두 가지 기능이 있습니다. 저는 쌍으로 사용했으며 예측 변수에 대해 매우 좋은 결과를 제공합니다. 특히 흥미로운 것은 절대적으로 환상적인 선택 평가 방법 세트를 가진 attrEval입니다. 그 중 특별한 장소는 하나의 관찰(행)뿐만 아니라 가장 가까운 행도 평가하는 Relief 그룹입니다.


행운을 빕니다.


추신.

예측 변수의 선택은 최소한 다음 단계로 구성되어야 함을 잊지 마십시오.

  • 원칙에 따른 선택: 대상과 관련된 예측자. 마법사는 여기에서 이 단계의 이론에 대한 링크를 제공했습니다. 통계와 엔트로피의 두 가지 방법을 구별할 수 있습니다. 둘 다 여기에 코드가 있습니다.
  • 미래 모델과 관련이 없는 나열된 패키지로 선택
  • 모델의 결과에 따라 선택합니다. 선형 모델에서 매우 효과적입니다. 예를 들어, glm에 의해 중요한 예측 변수만 선택한 다음 네트워크에 포함됩니다. 결과는 당신을 놀라게 할 수 있습니다.


예측 변수는 선택 전에 센터링과 같은 사전 처리가 필요할 수 있습니다. Vladimir Perervenko 의 기사에 잘 설명되어 있습니다.

 
도서관 :

그것을 시도했다. 결과를 얻지 못했습니다...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

5분 후에 나옵니다.
OOB.votes의 오류 - Y : 유사하지 않은 다차원 행렬

제공된 매트릭스의 구조:

> str(x1)
숫자 [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
숫자 [1:20000, 1] 0 0 0 0 0 0 1 1 1 1 ...
> str(x2)
숫자 [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
숫자 [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

그것은 명확하지 않습니다 - 그가 무엇을 요구하는 것과 유사합니다.
xtest = x2, ytest = y2 없이 시도 - 동일한 결과.
다음 패키지로 넘어가겠습니다.

원본을 게시할 수 있습니까?

목표가 요인이 아니므로 이것이 회귀가 아님을 표시해야 합니다. 옵션 추가

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, 회귀 = FALSE)

또는

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3,

ntree = 300, 스레드 = 2, 노드 크기 = 2)

행운을 빕니다

 
산산이치 포멘코 :

또 다른 매우 흥미로운 패키지가 있습니다: CORElearn. 이 패키지에는 예측 변수를 선택하기 위한 두 가지 기능이 있습니다. 저는 쌍으로 사용했으며 예측 변수에 대해 매우 좋은 결과를 제공합니다. 특히 흥미로운 것은 절대적으로 환상적인 선택 평가 방법 세트를 가진 attrEval입니다. 그 중 특별한 장소는 하나의 관찰(행)뿐만 아니라 가장 가까운 행도 평가하는 Relief 그룹입니다.


동의한다. 원칙적으로 이것은 아마도 RF에 대한 가장 심각한 패키지일 것입니다. 개발자 작성자: Marko Robnik-Sikonja에 주의를 기울여야 합니다.

행운을 빕니다

 
블라디미르 페레르벤코 :

원본을 게시할 수 있습니까?

목표가 요인이 아니므로 이것이 회귀가 아님을 표시해야 합니다. 옵션 추가

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, 회귀 = FALSE)

또는

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3,

ntree = 300, 스레드 = 2, 노드 크기 = 2)

행운을 빕니다

도움이 되었습니다. 고맙습니다!
 
박사 상인 :

특히, 그들이 자신을 위해 얼마나 많이 남기는지에 대해서는 공식적으로 작성되지 않았습니다. 각종 금융잡지들이 2016년 150만 원의 수익에 대해 썼는데, 이 중 참가자들에게 얼마를 지급했는지 비교해보면 조금 나옵니다.

> 그들이 보낸 이러한 예측을 거래한다고 생각하십니까?
예, 이것이 전체 전략입니다. 예를 들어, 여러 기능을 만들고 교육 테이블을 만들고 여기 포럼에 보내고 10명이 예측을 제공하고 거래를 합니다. 모든 것이 간단합니다.
그들은 오랫동안 자신의 암호를 가지고 있지 않았고 비트 코인으로 지불했습니다. 그들은 1년 동안 매주 비트코인으로 수천 달러를 받고 지불했습니다. 그런 다음 그들은 비트 코인을 망치지 않도록 암호를 공개했습니다.

> 일반적으로 예측을 계산할 징후를 미리 어떻게 알 수 있습니까? 보간 또는 무엇?
보간, 최근접이웃에 의한 예측, 클러스터링, 많은 옵션이 있으며 특정 답변을 제공하지 않으며 추측만 할 수 있습니다.

$ 1.5m은 페니입니다. 전체 cantor에 관해서는 그들이 거래소에 토굴을 배치하는 순간에 일부 참가자 (최상위)가 수백만 달러는 아니더라도 각각 수백 달러를 인출했다고 들었습니다. , 1위와 4000NMR을 주화당 200$ = 800.000k$에 얻을 수 있었던 것은 한 번이었습니다. 비록 공이 빨리 소진되고 NMR이 무너지고 주화의 규모가 훨씬 작아지기 시작했지만 누군가는 기분 좋게 운이 좋았을 것입니다.

IMHO, 제 생각에 처음에는 그들이 보낸 예측을 어떻게든 거래하려고 시도했을 수 있다고 생각합니다. 그러면 그곳의 장소는 어느 정도 예측 가능합니다. 아마도 방금 지불한 돈의 90%, 처음 100%의 대부분은 돈이 누구에게나 흘러가지 않도록 친구들. 그러나 지금은 많은 무작위성을 가진 순수한 작업 증명 카지노입니다. 적어도 그것은 소문입니다.


추신: 코인 이전에는 주당 6천 달러를 지불했습니다(누구에게?), 즉 1년에 28만 8천 달러, 수익에서 수량으로 150만에서 20%까지 동일한 "정직한" ~ 20%가 나옵니다)) 그러나 이 숫자는 모두 조작될 수 있다는 것이 분명합니다.

사유: