트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 555

 
막심 드미트리예프스키 :

그래서 나는 이 삶에서 무엇을 믿어야 할지를 xs. .모든 것을 다시 확인해야 합니다.


벤치마크에서의 구원)))

다양한 변신과 컷. 상단 - 초기 데이터.

기차 = r.fetch with light sq. 테스트 = OOS. 시간 = 대략 시간. 초에


 
데이터 세트의 이상값과 관련하여 이 방법 은 시장에서 유용할 수 있습니다.
 

여기 이 포럼에서 가끔 놀랐습니다. 고요함과 부드러움 그리고 전반적인 멍함. 그리고 갑자기 Vladimir나 Vizard_나 가장 수상한 podotr 같은 사람들이 나타나 마스터 클래스를 보여주기 시작합니다. 그들은 누구인가? 여권과 학력증명서를 빠짐없이 제시해 주시길 부탁드립니다! :)))))

 
산산이치 포멘코 :

목표 변수와 관련이 있는 예측 변수만 사용하십시오. 이 경우 "선형" 또는 "비선형"은 중요하지 않으며 매우 정확하게 공식화된 "관련"과 관련이 없습니다.

글쎄, 이것과 텍스트의 모든 것이 명확하지만 초기 비선형 모델에서 대상과 기능의 상관 관계는 어디에 있습니까?

그리고 나는 회귀의 경우에 그것이 필요한 이유를 썼지만 분류에는 없었습니다. 목표가 전혀 없었지만 클래스 .. 내가 쓰고 있는 것에 대해 더 자세히 읽어보십시오. :)

 
막심 드미트리예프스키 :

글쎄, 이것과 텍스트의 모든 것이 명확하지만 초기 비선형 모델에서 대상과 기능의 상관 관계는 어디에 있습니까?

그리고 나는 회귀의 경우에 그것이 필요한 이유를 썼지만 분류에는 없었습니다. 목표가 전혀 없었지만 클래스 .. 내가 쓰고 있는 것에 대해 더 자세히 읽어보십시오. :)


나는 더 깊이 읽을 필요가 없습니다. 나는 당신을 완벽하게 이해하지만 당신은 나를 전혀 이해하지 못합니다.

나는 과적합(과적합) 에 대해 씁니다. 이것은 모든 분류 모델의 주요 적입니다. 과도하게 훈련된 모델의 동작은 미래에 정의되지 않습니다.

이 완전한 악과 싸우기 위해 두 가지 도구가 있습니다.

1. 노이즈에서 예측자의 입력 세트 제거

2. 정확한 테스트

이 모든 것은 내 자신의 계산에 기초하여 작성하며, 1년에 걸쳐 생산한 매우 많은 양을 보장합니다.

나는 누군가를 설득할 목표가 없기 때문에 검색하고 읽을 수 있는 psot를 형성하기에는 너무 게으르다.


추신.

당신은 소음 예측기의 무해함과 심지어 유용성을 계속 주장합니다. 당신은 처음이 아니며 그러한 사람들이 많이 있으며 점성가가 불립니다.

 
산산이치 포멘코 :

당신은 소음 예측기의 무해함과 심지어 유용성을 계속 주장합니다. 당신은 처음이 아니며 그러한 사람들이 많이 있으며 점성가가 불립니다.


내가 이것을 어디에 썼습니까?

 
막심 드미트리예프스키 :

내가 이것을 어디에 썼습니까?

게시물 다시 읽기

ну это и все далее по тексту понятно, но причем здесь корреляция признака с целевой в изначально нелинейной модели

а я написал зачем она (корреляция) нужна в случае регрессионной, а в классификации нет, потому что там вообще не целевая а классы



내가 추측했고 내 의견으로는 우리의 불일치가 다음을 기반으로합니다.

당신은 상관 관계에 반대하고 예측 변수와 목표 변수 사이의 상관 관계에 대해 쓴 적이 없습니다.

"말하다"라고 합니다.

나는 항상 다음과 같이 썼습니다. 예측자는 대상 변수 와 관련 되어야 합니다. " 관계 "라는 단어의 의미에서 나는 상관 관계, 선형, 비선형 회귀를 의미하지 않았습니다. 또한 분류 알고리즘이 제공하는 예측 변수의 "중요성"에 대한 모든 알고리즘도 저에게 적합하지 않습니다.


내 예를 참조하십시오. target: 남성/여성 클래스가 있는 성별 및 예측 변수: 스커트/바지 값이 있는 옷.

 
산산이치 포멘코 :

게시물 다시 읽기



내가 추측했고 내 의견으로는 우리의 불일치가 다음을 기반으로합니다.

당신은 상관 관계에 반대하고 예측 변수와 목표 변수 사이의 상관 관계에 대해 쓴 적이 없습니다.

"말하다"라고 합니다.

나는 항상 다음과 같이 썼습니다. 예측자는 대상 변수 와 관련 되어야 합니다. " 관계 "라는 단어의 의미에서 나는 상관 관계, 선형, 비선형 회귀를 의미하지 않았습니다. 또한 분류 알고리즘이 제공하는 예측 변수의 "중요성"에 대한 모든 알고리즘도 저에게 적합하지 않습니다.


내 예를 참조하십시오. target: 남성/여성 클래스가 있는 성별 및 예측 변수: 스커트/바지 값이 있는 옷.


예, 때때로 그들은 표적과의 부호가 정확히 상관되어야 한다고 씁니다. 선형 관계가 있어야합니다

글쎄, 나는 회귀 모델 의 경우 적어도 하나의 기능이 대상과 선형으로 관련되어 있는 것이 합리적일 수 있다고 썼습니다.

나는 "관계"에 대해 확실히 동의합니다 :)

 
마법사_ :

벤치마크에서의 구원)))

다양한 변신과 컷. 상단 - 초기 데이터.

기차 = r.fetch with light sq. 테스트 = OOS. 시간 = 대략 시간. 초



앞으로의 좋은 결과조차도 항상 카드로의 후속 이익 인출의 선구자는 아닙니다. :)

그러나 일반적으로 교차 검증은 이미 위에서 언급했습니다. 저에게는 동일합니다.

 
과적합 - 다중공선성의 결과인 큰 가중치(~10^18)가 있을 때 발생하여 모델 A(x, w)의 불안정성을 초래합니다.


과적합은 모델 훈련의 조기 중단, 가중치 증가 제한(L1(Lasso) 및 L2의 정규화), 네트워크 연결 제한(Dropout), 페널티 함수(ElacticNet, Lasso) 사용도 가능합니다.

또한 L1 정규화는 가중치 계수를 무효화하기 때문에 기능 선택으로 이어집니다.

"노이즈" 기능 제거 - 이것이 기능 선택입니다. 이를 위한 방법이 있습니다. 이것이 모델에 항상 유익한 것은 아니므로 L2 정규화가 때때로 사용됩니다(다중 공선성 문제를 해결하는 데 도움이 됨).


SanSanych Fomenko , 표지판과 표적 사이의 관계에 대한 귀하의 진술은 다소 자신감이 있습니다. 아직 입증되지 않은 것을 어떻게 주장할 수 있습니까? 그것이 MO 모델이 만들어진 이유입니다. 구성되고 작동하는 모델은 "이러한" 정확도와 관계가 있다는 사실에 대한 추정치를 제공합니다.

바지와 치마의 예는 연구 대상 지역에 대한 연구원 지식의 부족을 반영합니다. 왜냐하면 그러한 모델에서는 거주지, 계절, 거주 지역의 위도 및 경도 등에 대한 귀중한 표시를 버리기 때문입니다. .


악마는 천재와 마찬가지로 세부 사항에 있기 때문에 모델을 구축하기 전에 연구 대상 영역을 이해해야 합니다.


추신. 논쟁은 좋다. 그들은 관점을 연마하고, 논문에 대한 좋은 논거를 제시하는 방법을 가르치고, 공통의 진리로 이끄는 데 도움을 줍니다.

사유: