트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 365

 
도서관 :

입력을 개선하는 방법을 생각하면서 이미 상관 입력을 제거했습니다.

따라서 목표와 상관관계가 있어야 한다는 점에 동의합니다. 따라서 목표 입력과 가장 상관관계가 없는(예: Kcorr<0.5 또는 0.3)도 제거하고 싶습니다. 이렇게 하면 품질을 너무 저하시키지 않으면서 학습 프로세스의 속도를 높일 수 있습니다. 그러나 모든 입력을 제거해야 한다는 가정이 있습니다.)))

사용된 입력(해당 지표에서 가져온 임의의 입력)에서 지금까지 목표와 상관 관계를 찾지 못했습니다. 학습 오류 = 0.44, 즉 거의 동전. 음, 균형이 떨어지고 있습니다.


어떤 경우에도 대상과 상관관계가 있어서는 안 됩니다. 어디에 기록되어 있습니까? 그게 무슨 말이 됩니까? 목표와 상관관계가 1이면 미래를 알고 신경망이 필요하지 않습니다.
 
막심 드미트리예프스키 :

어떤 경우에도 대상과 상관관계가 있어서는 안 됩니다. 어디에 기록되어 있습니까? 그게 무슨 의미가 있니? 목표와 상관관계가 1이면 미래를 알고 신경망이 필요하지 않습니다.


모든 ML은 입력 변수가 출력 변수와 상관 관계가 있어야 한다는 사실에 기반합니다.

그렇지 않으면 모든 MO 모델에는 의미가 없습니다.

데이터 마이닝에서 모델에 대한 변수 선택의 모든 모델에서 입력 변수와 출력 변수의 최대 상관 메커니즘이 구현됩니다.

순방향 선택 절차(직접 선택),
역 배제 절차(역 배제),
단계적 절차,
절차 최상의 하위 집합(최상의 하위 집합).
 
드미트리 :


모든 ML은 입력 변수가 출력 변수와 상관 관계가 있어야 한다는 사실에 기반합니다.

그렇지 않으면 모든 MO 모델에는 의미가 없습니다.

데이터 마이닝에서 모델에 대한 변수 선택의 모든 모델에서 입력 변수와 출력 변수의 최대 상관 메커니즘이 구현됩니다.

순방향 선택 절차(직접 선택),
역 배제 절차(역 배제),
단계적 절차,
절차 최상의 하위 집합(최상의 하위 집합).

입력 및 출력 벡터(곡선)가 상관되어야 한다는 의미의 상관 또는 상관 관계는 일반적으로 입력에 대한 출력 변수의 종속성을 의미합니까?
 
막심 드미트리예프스키 :

입력 및 출력 벡터(곡선)가 상관되어야 한다는 의미의 상관 또는 상관 관계는 일반적으로 입력에 대한 출력 변수의 종속성을 의미합니까?


의존성은 상관관계의 특별한 경우입니다. 두 변수가 종속적이라면 상관관계가 분명히 있습니다. 상관관계가 있다고 해서 반드시 종속성이 있는 것은 아닙니다.

통계 모델에서 종속성을 감지하는 방법은 없습니다. 입력 변수 집합과 출력 변수 사이의 공개된 상관 관계가 종속성이라는 희망만 있습니다.

따라서 변수는 상관관계가 있어야 합니다.

 
드미트리 :


의존성은 상관관계의 특별한 경우입니다. 두 변수가 종속적이라면 상관관계가 분명히 있습니다. 상관관계가 있다고 해서 반드시 종속성이 있는 것은 아닙니다.

통계 모델에서 종속성을 감지하는 방법은 없습니다. 입력 변수 집합과 출력 변수 사이의 공개된 상관 관계가 종속성이라는 희망만 있습니다.

따라서 변수는 상관관계가 있어야 합니다.


역방향이 맞으면 더 이상 종속성이 아닙니다. 아니면 무엇입니까? ) NS는 이 접근 방식을 무디게 만들 것입니다.

할렐루야..입구에 지그재그로, 출구에 지그재그로 시프트 .. 상관관계가 거의 완벽하지만 요점이 뭔데? )

 
막심 드미트리예프스키 :

역방향이 맞으면 더 이상 종속성이 아닙니다. 아니면 무엇입니까? ) NS는 이 접근 방식을 무디게 만들 것입니다.


상관 계수가 0일 때 상관 관계가 없습니다.

들어오는 것과 나가는 것이 전혀 상관 관계가 없다면 어떻게 모델을 만들 수 있습니까?

 
드미트리 :


상관 계수가 0일 때 상관 관계가 없습니다.

들어오는 것과 나가는 것이 전혀 상관 관계가 없다면 어떻게 모델을 만들 수 있습니까?


예, 모델이 예측 변수 집합에서 패턴을 찾을 때 입력과 출력의 상관 관계가 전혀 중요하지 않기 때문에 ... 이것은 모순입니다. 서로 상관 관계가 있는 입력을 제거하지만 상관 관계가 있는 입력을 찾는 것입니다. 출력에 .. )) 즉. 적어도 하나의 입력은 출력과 상관관계가 있으므로 다른 모든 입력은 삭제해야 합니다. 그들은 또한 출력과 상관 관계가 있으며 따라서 나머지 입력과도 관련이 있습니다. .. 멋지죠?
 
막심 드미트리예프스키 :

예, 모델이 예측 변수 집합에서 패턴을 찾을 때 입력과 출력의 상관 관계가 전혀 중요하지 않기 때문에 ... 이것은 모순입니다. 서로 상관 관계가 있는 입력을 제거하지만 상관 관계가 있는 입력을 찾는 것입니다. 출력에 .. )) 즉. 적어도 하나의 입력은 출력과 상관관계가 있으므로 다른 모든 입력은 삭제해야 합니다. 그들은 또한 출력과 상관 관계가 있으며 따라서 나머지 입력과도 관련이 있습니다. .. 멋지죠?


아니, 멋지지 않아.

첫 번째 변수가 나가는 변수와 상관 관계가 있는 경우(예: 0.7), 두 번째 변수와 계수가 0.65인 경우 이 두 변수가 서로 강한 상관 관계가 있다는 의미는 아닙니다.

이제 첫 번째는 0.7이고 두 번째는 계수가 -0.69라고 상상해보십시오.

 
드미트리 :


아니, 멋지지 않아.

첫 번째 변수가 나가는 변수와 상관 관계가 있는 경우(예: 0.7), 두 번째 변수와 계수가 0.65인 경우 이 두 변수가 서로 강한 상관 관계가 있다는 의미는 아닙니다.

이제 첫 번째는 0.7이고 두 번째는 계수가 -0.69라고 상상해보십시오.


그리고 우리가 상관관계가 "유사성"을 매우 독특한 방식으로 정의한다고 상상한다면 ... 나는 그녀를 정말로 신뢰하지 않을 것입니다

우리는 정확한 첨단 신경망을 구축하고 있으며 예측 변수를 선택할 때 상관 관계에 의해 안내됩니다. 어떻게 든 조금 잘못되었거나 ..하지만이 모든 것이 "내 의견"입니다 ..)

 
막심 드미트리예프스키 :

그리고 우리가 상관관계가 "유사성"을 매우 독특한 방식으로 정의한다고 상상한다면 ... 나는 그녀를 정말로 신뢰하지 않을 것입니다


그런 다음 두 번째 옵션은 국회에 있는 모든 것을 고수하는 것입니다. 그러나 두 가지가 있습니다.

1. 상관관계가 없는 변수가 모델의 품질을 저하시키지 않기를 바랍니다(회귀에 대해 그런 것이 있습니다).

2. 차원과 시간을 희생한다.