트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 883

 
막심 드미트리예프스키 :

일반 숲과 랜덤 숲과 나무의 숲은 같은 것입니다 :) Forest는 Trees의 앙상블입니다.

그들이 작아졌다는 의미에서 표시가 축소되거나 무엇입니까? 희소 기호는 거의 변경되지 않거나 1과 0의 범주형 유형으로 이해됩니다(음, 이것은 이미 높은 수준의 이해입니다)

아니요, 축소되었습니다. 즉, 하나의 변수에 많은 값이 있지만 조합의 수는 동일하게 유지됩니다. 구매를 위해 과거와 유사하지만 다른 보기에서 파일을 첨부합니다.

파일:
 
마법사_ :

이진화는 많은 유용한 정보를 죽였습니다.

정보가 표시되는 방식에 어떤 차이가 있습니까? 이것에서 변경되지 않습니다 ... ???

 
막심 드미트리예프스키 :

개인적으로 나는 SanSanych에 대해 아무 것도 모릅니다. 그는 매우 유능하고 절제된 사람이며 거기에서 알려지지 않은 일을 하고 있으며 아마도 R이 필요할 것입니다.

파이썬은 저에게 더 직관적입니다. 와우가 맞도록 무엇을 해야할지 몰랐지만 조용히 계속 공부하고 있습니다. 아마도 도움이 될 것입니다.:D

R은 Python에 비해 많은 장점이 있는 훌륭한 환경입니다. 기본적으로 R은 모델링 환경입니다. Python과 비교하여 R의 결과는 다음과 같습니다. 더 빠르고 쉽게 받았습니다.

Python은 모듈과 함께 고유한 장점이 있습니다.

그런데 RF에 관해서는 여기에서도 NS와 마찬가지로 예측변수의 열거-선택 없이 할 수 있고 그대로 정규화된 VR을 그대로 사용할 수 있는 것 같습니다.

 
산산이치 포멘코 :

일반 포리스트 또는 임의 포리스트 또는 둘 다?

래틀에서는 나무와 ada라는 숲 모델을 모두 실행합니다. 로그 탭을 열면 R 코드, 사용된 패키지에 대한 참조가 표시되며 차이점을 이해할 수 있습니다.

나는 나무와 숲의 차이점을 이해합니다. (또는 그렇게 생각합니다) 숲은 데이터에 더 많은 불확실성이 있을 때 가장 잘 사용됩니다. 숲이 투표를 통해 결정을 내리기 때문에 덜 안정적인 패턴입니다. 이는 임의의(축소로 인해 독립적인) 트리에서 발생합니다. 아니면 제가 틀렸습니까? 그러나 나는 "adad"옵션이 보이지 않습니다. 화면에도 없습니다. 거기에 "Forest"가 있습니다. 그렇지 않습니까?

산산이치 포멘코 :

Rattle과 R을 넣었습니다(음, 모든 것이 버그입니다...),

버그가 무엇인지 이해하지 못했습니다. 최근에 엄청난 수의 모델을 운전했습니다. 모든 것이 정상입니다.

패키지를 다운로드할 때 이해할 수 없는 몇 가지 사항이 있었습니다. 그는 다운로드를 시작했지만 다운로드하지 않는다고 쓰고 필요한 라이브러리가 없다고 설치하고 작성한 다음 파일에서 데이터를 읽을 때 멈춥니다... 글쎄, 작업 과정이 보이지 않습니다. 끝날 때까지 얼마나 기다려야하는지 명확하지 않습니다. 그런 버그에 대해 이야기하고 있습니다. 디스패처에서 작업을 제거하면 ...

산산이치 포멘코 :


당신이 미완성인 딸랑이 사진. 최소한 인접한 평가 탭으로 이동하여 결과를 확인해야 합니다.

그러나 가장 중요한 것은 소스 파일을 다른 이름을 가진 두 부분으로 나누는 것입니다(대부분 R에서 이 작업을 수행해야 할 것입니다).

첫 번째 파일 에서 6개 모델을 모두 빌드하고 평가 테스트를 확인하고 유효성을 검사합니다. 그런 다음 R 데이터 집합 필드에 두 번째 파일의 이름을 입력합니다. 그리고 다시 점수를 받습니다. 모든 점수가 일치해야 합니다!

이러한 추정값이 일치하지 않고 두 번째 파일에서 모델의 성능이 근본적으로 더 나쁘면 모델이 과적합되고 과적합이 노이즈(대상 변수와 관련이 없음) 예측 변수의 존재로 인해 발생함을 의미합니다. .


이것은 진실의 순간입니다. 특정 대상 변수와 관련된 예측 변수 집합이 있거나 없거나 둘 중 하나입니다. 그리고 이 슬픈 상황의 어떤 모델도 교정할 수 없습니다. 그런 다음 어리석은 작업은 한 쌍의 "목표 예측자"를 선택하는 데 시작됩니다. 모델은 전혀 흥미롭지 않습니다. 한 쌍을 찾으면 모델은 R의 씨앗일 뿐이며 하루에 12개를 수집하고 당신은 그들로부터 앙상블을 만들 것입니다.

그렇다면 R로 파일을 자르려면 어떻게 해야 합니까? 특별한 알고리즘을 사용해야 합니까? 마지막에 어떤 일이 벌어질지 지켜보는 것도 흥미롭다.

 
산산이치 포멘코 :


2. R EA를 사용하는 데 문제가 없습니다. 모든 것이 작동하고 매우 안정적입니다.

MT5에서도 작동하나요? 코드 샘플은 어디에서 볼 수 있습니까? 저는 편의상 인디케이터 같은 것에 관심이 있는데, 옵티마이저에서 어드바이저와 연결하면 쉽게 비교할 수 있고, 포레스트가 무엇인지 시각적으로 볼 수 있기 때문에 인디케이터를 통해 정보를 제출하는 것이 좋다고 생각합니다. 주어진 시간에 시장 상황에 대해 생각합니다.

 
유리 아사울렌코 :

R은 Python에 비해 많은 장점이 있는 훌륭한 환경입니다. 기본적으로 R은 모델링 환경입니다. Python과 비교할 때 R의 결과는 다음과 같습니다. 더 빠르고 쉽게 받았습니다.

Python은 모듈과 함께 고유한 장점이 있습니다.

그런데 RF에 관해서는 여기에서도 NS와 마찬가지로 예측변수의 열거-선택 없이 할 수 있고 그대로 정규화된 VR을 그대로 사용할 수 있는 것 같습니다.

어쩌면 정규화되지 않은

 
막심 드미트리예프스키 :

어쩌면 정규화되지 않은

작동하지 않습니다. VR 세그먼트는 예를 들어 0과 같은 특정 수준으로 명확하게 바인딩되어야 합니다.

 
알렉세이 비아즈미킨 :


나는 나무와 숲의 차이점을 이해합니다. (또는 그렇게 생각합니다) 숲은 데이터에 더 많은 불확실성이 있을 때 가장 잘 사용됩니다. 숲이 투표를 통해 결정을 내리기 때문에 덜 안정적인 패턴입니다. 이는 임의의(축소로 인해 독립적인) 트리에서 발생합니다. 아니면 제가 틀렸습니까?

몰라, 나는 결과로 판단한다.

그러나 나는 "adad"옵션이 보이지 않습니다. 화면에도 없습니다. 거기에 "Forest"가 있습니다. 그렇지 않습니까?

순서대로:


나무

'rpart' 패키지는 'rpart' 기능 을 제공합니다.


후원

# 익스트림 부스트

# `xgboost' 패키지는 극단적인 그래디언트 부스트 알고리즘을 구현합니다.


SVM

# 벡터 머신을 지원합니다.

# 'kernlab' 패키지는 'ksvm' 기능을 제공합니다.


선의

# 회귀 모델

# 회귀 모델을 구축합니다.


신경망

#신경망

# nnet 패키지를 사용하여 신경망 모델을 빌드합니다.

라이브러리(nnet, 조용히=TRUE)


그건 그렇고, 나는 당신을 위해 이 일을 했습니다 - 당신은 이 모든 것을 로그에서 직접 볼 수 있습니다. 다른 버전의 딸랑이가 있는 경우 목록이 다를 수 있습니다.


그렇다면 R로 파일을 자르려면 어떻게 해야 합니까? 특별한 알고리즘을 사용해야 합니까? 마지막에 어떤 일이 벌어질지 지켜보는 것도 흥미롭다.

색인별(예: [1:2000,], [2001:4000,]). 두 번째 파일이 자연 시간 순서를 위반하지 않는 것이 중요합니다.

 
알렉세이 비아즈미킨 :

MT5에서도 작동하나요? 코드 샘플은 어디에서 볼 수 있습니까? 저는 편의상 인디케이터 같은 것에 관심이 있는데, 옵티마이저에서 어드바이저와 연결하면 쉽게 비교할 수 있고, 포레스트가 무엇인지 시각적으로 볼 수 있기 때문에 인디케이터를 통해 정보를 제출하는 것이 좋다고 생각합니다. 주어진 시간에 시장 상황에 대해 생각합니다.

내 주문에 따라 라이브러리가 수정되었습니다. MT5의 테스터가 필요했습니다. 내가 보기엔 너무 게으른 것 같아, 어쩌면 내가 그것을 청소했을지도 모른다.

Vladimir Perervenko 의 기사 보기

네트워크에 관심이 있다면 그는 이 분야에 대한 최신 정보를 가지고 있습니다. R, 고문, 사이트에 사람이 있습니다.
 
알렉세이 비아즈미킨 :

아니요, 축소되었습니다. 즉, 하나의 변수에 많은 값이 있지만 조합의 수는 동일하게 유지됩니다. 구매를 위해 과거와 유사하지만 다른 보기에서 파일을 첨부합니다.

글쎄,이 방법과 방법 그리고 모든 사람을 위해 마음이 원하는대로 시도하십시오 :) 가장 중요한 것은 이론을 읽는 것을 잊지 않고 솔직한 말도 안되는 소리를하지 않으며 일종의 패키지를 사용하는 것이 어렵지 않습니다. , 그들 중 많은 수가 있고 심지어 온라인에서도 - 필요한 것을 설치할 수 없습니다. 이제 데이터 과학의 붐이 일어나고 "그것"은 어디에나 있습니다.

아카이브를 분석 할 시간이없는 동안 나는 끊임없이 무언가를 괴롭 힙니다.

사유: