트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 818

 
박사 상인 :

이를 위해 포리스트를 사용하는 것이 더 낫습니다. 이 모델은 다음과 같은 규칙 세트를 생성합니다.


1: DeltaLess350 <= 0.5
2: ZZ_D <= 0
결정 0

1: DeltaLess350 <= 0.5
2: ZZ_D > 0
3: DeltaMore350 <= 0.5
결정 0

1: DeltaLess350 <= 0.5
2: ZZ_D > 0
3: DeltaMore350 > 0.5
결정 1

DeltaLess350 > 0.5
결정 1


이 기사에는 R에서 이 작업을 수행하는 방법에 대한 설명이 있습니다.
https://www.mql5.com/ru/articles/1165

"모델" 탭에서 숲을 선택하고 설정에서 나무 수를 1로 설정하고 모델을 만든 다음 규칙 버튼을 클릭하면 다음 규칙 목록이 표시됩니다.

답변 해주셔서 감사합니다. 아마도 내가 올바르게 읽고 있지는 않지만 데이터 행 "=IF(OR(AND(B2=1;D2=1))의 첫 번째(및 후속 행)에 대한 공식과 같은 Excel에서 모델이 올바르지 않은 것 같습니다. ;AND(C2=1;D2=1));1;0)"

저것들. 명확한 논리를 위해 스캐폴딩을 사용하는 것이 더 낫습니까? 특징 추출과 동일하지 않습니까?

기사 감사합니다-다시 공부하겠습니다-오랫동안 읽었던 기억이 나지만 이제 지식이 조금 더 생겼고 아마도 더 명확해질 것입니다.

추가: 그림은 흥미롭지만 논리가 명확하게 추측되지 않습니다 ... 또는 그렇지 않습니까?
 

숲이 아닌 나무를 이용해서 포스트를 조금 수정했더니 더 편하더라구요. 공식은 두 경우 모두 다르게 보이지만 여전히 정답입니다.

입력 값의 올바른 조합으로 답을 찾을 수 있으면 포리스트가 잘 작동합니다. 나무의 덧셈과 곱셈의 종류는 어떤 연산도 할 수 없습니다.

 
알렉세이 비아즈미킨 :

데이터 "=IF(OR(AND(B2=1;D2=1);AND(C2=1;D2=1)가 있는 첫 번째(및 후속 행) 행에 대한 수식과 같은 Excel에서 모델이 올바르지 않은 것 같습니다. ));1;0)"

글쎄, 나는 모른다 .. 나는 그것을 Excel에서 확인했다. 숲의 공식은 총 두 번 잘못되었습니다. 트리 공식은 모든 경우에 동일했습니다.

 
박사 상인 :

숲 대신 나무를 사용하여 포스트를 조금 다시 작성했더니 더 편리해졌습니다. 공식은 두 경우 모두 다르게 보이지만 여전히 정답입니다.

입력 값의 올바른 조합으로 답을 찾을 수 있으면 포리스트가 잘 작동합니다. 나무의 덧셈과 곱셈의 종류는 어떤 연산도 할 수 없습니다.

글쎄요, 그가 내놓은 결과가 여기 있습니다. 하지만 조건을 한 줄로 축소하거나 함수를 수정하여 코드에 빠르게 적용할 수 있는 기회가 있습니까? 아니면 앉아서 논리의 각 차례를 스스로 설명하면서 동시에 결과 해석에 실수를하지 않아야합니까? 들어오는 값 집합이 수십 단위로 측정되면 이것은 매우 시간이 많이 걸리는 프로세스입니다 ...

 
박사 상인 :

글쎄, 나는 모른다 .. 나는 그것을 Excel에서 확인했다 - 숲의 공식은 총 두 번 잘못되었습니다. 트리 공식은 모든 경우에 일치했습니다.

예, 트리의 공식은 코드로 판단하여 제거를 거쳐 올바른 결정으로 판명되었습니다.

 

모든 것이 훨씬 더 간단합니다. 수식을 어지럽힐 필요가 없습니다. 훈련 후에 새 데이터에 대한 예측을 수행할 수 있는 일반 R 모델을 얻을 수 있습니다.

모든 예측은 하나의 기능으로 수행됩니다.

predict(model, newdata)

model은 이전에 생성된 모델입니다(나무, 숲, 뉴런 등, R에는 수백 가지 다른 모델이 있습니다). newdata - 예측을 위한 새 데이터가 있는 테이블

 
박사 상인 :

모든 것이 훨씬 더 간단합니다. 수식을 어지럽힐 필요가 없습니다. 훈련 후에 새 데이터에 대한 예측을 수행할 수 있는 일반 R 모델을 얻을 수 있습니다.

모든 예측은 하나의 기능으로 수행됩니다.

model은 이전에 생성된 모델입니다(나무, 숲, 뉴런 등, R에는 수백 가지 다른 모델이 있습니다). newdata - 예측을 위한 새 데이터가 있는 테이블

흥미롭긴 한데 아직 끝까지 명확하지가 않네요 - R로 작업해본 적이 없어서... 자세히 이해하려면 해봐야겠네요.

여기에서 한 가지 더 질문으로 괴로워합니다. 입력 데이터에 오류가 있는 데이터가 있는데, 이는 순전히 임의적입니다. 그러면 숲/나무가 이를 결정할 수 있습니까? 제외하기 위해 왼쪽 데이터를 검색하는 것을 포함하여 열거형 측면에서 열별로 입력 데이터의 자동 비활성화를 구성할 수 있습니까?

 

가장 일반적인 포리스트는 대상을 결정하는 데 사용할 최소 데이터 집합을 찾습니다. 그러나 그는 노이즈와 오류를 분석하지 않으며 예측 정확도를 높이는 데 도움이 되는 경우에도 사용합니다. 따라서 예를 들어 많은 Forex 지표를 수집하고 추세를 예측하려고 할 수는 없습니다.

숲에는 다양한 고급 수정 사항이 있으며 소음과 오류를 제거하려는 시도가 있으며 귀하가 작성한 모든 것이 있습니다. 예를 들어 R의 패키지 gbm, xgboost . 일반적으로 잘 작동하지만 Forex에는 다소 약합니다. 여기에는 다른 방법이 필요합니다.

 
알렉세이 비아즈미킨 :

"Calc" 열의 논리(뉴런)를 식별하는 데 사용할 수 있는 신경망 알고리즘은 무엇인가요? 조언 1번: 머신 러닝 없이 할 수 있다면 하세요 :)

1: 샘플 크기를 결정하십시오. 샘플이 매우 작습니다.

2. 단순 분류/회귀 모델(선형)을 연구하십시오. 가장 적합할 것입니다. 오류가 크면 더 복잡한(비선형) 모델로 전환해 볼 수 있습니다.

3. 절대 조언을 듣지 마세요. 특히 R로 전환하세요 :))) 이제 이 포럼에서 그들을 추방할 시간입니다.

4. 머신 러닝 없이 해결할 수 있는 문제라면 사용하지 않는 것이 좋습니다.

 
박사 상인 :

가장 일반적인 포리스트는 대상을 결정하는 데 사용할 최소 데이터 집합을 찾습니다. 그러나 그는 노이즈와 오류를 분석하지 않으며 예측 정확도를 높이는 데 도움이 되는 경우에도 사용합니다. 따라서 예를 들어 많은 Forex 지표를 수집하고 추세를 예측하려고 할 수는 없습니다.

숲에는 다양한 고급 수정 사항이 있으며 소음과 오류를 제거하려는 시도가 있으며 귀하가 작성한 모든 것이 있습니다. 예를 들어 R의 패키지 gbm, xgboost. 일반적으로 잘 작동하지만 Forex에는 다소 약합니다. 여기에는 다른 방법이 필요합니다.

나는 지표의 의미를 제시하고 싶지 않습니다. 제 목표는 논리적으로 설명된 관찰을 제시하는 것입니다(상황이 관찰되었는지 여부와 상관없이 - 뉴스 및 공간에서 서로에 대한 다른 지표의 관계가 될 수 있음) - 일반적으로 압축 결정을 내리기 위해 실제 거래에서 사용하는 정보), 이전에 이러한 지표를 기반으로 구축되었으며 잘못된 지표, 즉 입력 데이터는 0과 1이거나 입력당 조금 더 많은 숫자가 될 것입니다. (여기서 질문은, 요일의 영향을 보고 싶다면, 요일을 표시하는 입력 매개 변수 또는 1에서 5까지 하나의 매개 변수를 지정하는 것으로 충분합니까?).

내 예에서와 같이 답이 알려진 경우 효율성을 위해 다른 알고리즘을 비교했지만 더 복잡한 작업에 대해 누군가가 비교를 했습니까?

사유: