트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2745

 
JeeyCi #:


회귀 계수에 대한 통계적 검정은 무엇을 위한 것인가요? 또는 평균과 분산의 동등성에 대한 가설을 테스트하는 것인가요? (PCA에서 여전히 1차 PC가 허용 가능한 분산 점유율을 설명하는 것으로 나타나면(잔차 분산이 매우 작으면) 이를 수용하고 회귀 계수의 유의성 확인을 확인합니다...).

이상적으로- 100% 확률을 가지려면 상관 관계가 아닌 함수 관계를 사용해야한다는 것은 분명하지만 확률 적 프로세스를 연구하면 결과는 많은 수의 테스트 데이터에서만 그리고 새로운 드라이버가 시장에 나타날 때까지만 확률적이고 확인할 수 있습니다.... [그런데 여기서는 강력한 분석뿐만 아니라 사실적/논리적 인식도 매우 중요합니다.]

과거 데이터에 의존하는 한 역사에 대한 적합성은 항상 존재합니다..... 하지만 분산 감소가 나머지 설명되지 않은 분산보다 훨씬 크면 새로운 회귀가 확인된 것입니다. (닥터 슬로프와 함께)... 그리고 그것은 미래의 한 순간까지만 그리고 큰 숫자에서만 작동합니다... 음, 또는 액터의 상태를 전환합니다(DL을 사용하는 경우)... 하지만 드라이버는 기다리는 것보다 더 잘 알고 있습니다... 하지만 현재 샘플이 수집될 때까지 기다렸다가 확인하는 것보다 드라이버를 아는 것이 더 낫습니다.

기능 엔지니어링 논리적으로 만들면 "이론적으로"논리적으로 (모든 통계 처리에는 지상의 물리적-논리적 법칙과 인간의 지식이 있으며 패턴은 공중에서 떨어지지 않습니다) -- [그러나 누군가는 무지가있을 수 있습니다] -- 모델링 과정에서 FS는 모델러 나 개발자를별로 괴롭히지 않습니다..... 그리고 역사 없이는 어디에도 갈 수 없으며, 무엇이 언제 운전자가되었고 무엇이 그렇지 않은지 알기 위해 고등 수학에서 많은 지능이 필요하지 않으며 돈과 상품 시장, 민간 및 국가 부문의 법칙에 대한 이해 만 있으면됩니다. 그렇지 않으면 우리는 세상을 바꾼 뉴스가 이미 한 번 들었음을 배우기 위해 "나중에"만 응용 고등 수학의 장치를 사용할 것입니다..... 시장 반응을 포함한 시장 반응이 일반적으로 지연되고 있다는 것입니다.

추신.

단어와 문자를 알 수없는 사람은 문자에 집착하지 않도록 알 수없는 문자의 알 수없는 주제를 읽지 말고 FS 용 VM 머신을 찾으십시오.... 그런 다음 결과의 통계적 유효성을 증명하고 적중률 % % (항상 편견이없는 것은 아닙니다)), 대화가 달라질 것입니다.... 하지만 지금은 모든 사람이 자신의 용어를 가지고 있습니다....

모든 것은 사람들이 협동하고 싶다는 사실에서 시작되었습니다 )) 정리하기 시작했고 모든 사람이 다른 사람들이하는 모든 것을 부정한다는 것이 밝혀졌습니다. 또한 그들은 새로운 정의를 발명합니다. 결국 아무도 아무것도 이해하지 못했습니다. 저는 일반적으로 Sanych의 접근 방식을 좋아하기 때문에 구체적인 내용을 요청했습니다. 그리고 지정의 경우에도 상관 관계는 아니더라도 관계와 연결이 있다는 것이 문제입니다.

그는 자신의 노하우를 소중히 여기고 세부 사항을 밝히지 않는 것이 분명합니다.
 
Maxim Dmitrievsky #:
이 모든 것은 협동을 원하는 사람들로부터 시작되었습니다.))이 조사하기 시작했고, 모든 사람들이 다른 사람들이 하는 모든 것을 부정한다는 것을 알게 되었습니다. 게다가 그들은 새로운 정의를 만들어 냅니다. 결국 아무도 아무것도 이해하지 못했습니다. 저는 일반적으로 산치의 접근 방식이 마음에 들어서 구체적인 내용을 물어봤어요. 그리고 명칭에 있어서도 상관관계가 아니라면 관계와 연결이란 무엇인가 요.

분명히 그는 자신의 노하우를 소중히 여기고 세부 사항을 공개하지 않습니다.

제가 보기에 상관관계에는 두 가지 유형이 있습니다.

첫 번째는 인과 관계로, 어떤 계산이 아니라 주어진 주제 영역의 지식에서 연구 대상에 대한 선험적 정보에 의해 결정됩니다.

두 번째 유형은 확률적 의존성으로, 대상의 행동을 관찰하여 얻은 일부 데이터로부터 사후적으로 계산할 수 있습니다. 두 번째 유형에는 상관관계, 결정론적 의존성(극단적인 경우) 등이 포함되며, 코퓰라 및 기타 방법으로 설명할 수 있습니다. 이 유형을 연구하는 기초는 예측자와 대상에 대한 공동 분포가 있다는 가정입니다.

 
Aleksey Nikolayev #:

제 생각에는 두 가지 유형의 커뮤니케이션이 있습니다.

첫 번째는 인과관계로, 어떤 계산에 의해서가 아니라 주어진 주제 분야의 지식에서 연구 대상에 대한 선험적 정보에 의해 결정됩니다.

두 번째 유형은 확률적 의존성으로, 대상의 행동을 관찰하여 얻은 일부 데이터로부터 사후적으로 계산할 수 있습니다. 두 번째 유형에는 상관관계, 결정론적 의존성(극단적인 경우) 등이 포함되며, 코퓰라 및 기타 방법으로 설명할 수 있습니다. 이 유형을 연구하는 기초는 예측자와 대상에 대한 공동 분포가 있다는 가정입니다.

맞습니다. 선험적 가정이 없기 때문에 두 번째 유형이 사용됩니다. 산치는 어떻게 보는지 궁금합니다. 예를 들어, 타깃을 구성하는 방식은 어떤 특성에든 간단히 맞출 수 있고 그 반대의 경우도 마찬가지입니다.

제 접근 방식은 이러한 조작을 위해 완전히 맞춤화되어 있으며, 아마도 개선할 수 있는 부분이 있을 것입니다.
 
mytarmailS #:

타겟을 고려한 PCA가 있으며, 타겟을 특징짓는 구성 요소를 강조 표시합니다,

절대 그렇게 하지 않습니다. 대상과의 관계를 고려하지 않습니다. - 최대 분산을 설명하는 특징 공간에 직교 투영을 생성할 뿐입니다..... (회전을 수동으로 수행해야 하는지 [통계 패키지에 뭔가 버튼이 있는 것 같습니다] 아니면 자동으로 알아낼 수 있는지 확실하지 않습니다. 다른 라이브러리에는 이미 회전이 내장되어 있을 수 있습니다).


mytarmailS #:

하지만 슬픈 점은 대상이 주관적인 변수이고 추적이 끝나자마자 "부유"한다는 것입니다.... 선생님과 함께하는 일반적인 학습과 어떻게 다른가요?

예, 슬프게도이 방법의 목적과 사용 방법 및 목적에 대한 자신 만의 해석이 있습니다.... 그런 견해로 어떻게 도움이 될 수 있을지 모르겠습니다 ... - 그러니 더 이상 저에게 물어볼 필요가 없습니다.
 
JeeyCi #:
1) 절대 그렇게 하지 않습니다 - 타겟에 대한 링크를 고려하지 않습니다!!!!. - 최대 분산을 설명하는 기능 공간에 투영을 생성할 뿐입니다.... (회전을 수동으로 수행해야하는지 [통계 패키지에 뭔가 있다고 생각합니다 - 일부 버튼] 또는 자동으로 알아낼 수 있는지 확실하지 않습니다 - 다른 라이브러리에는 이미 회전이 내장되어있을 수 있습니다).


2) 예, 슬프게도이 방법의 목적과 사용 방법 및 목적에 대한 자신 만의 해석이 있습니다 ... 나는 그것이 그것에 대한 그러한 견해로 어떻게 당신을 도울 수 있는지 모르겠습니다..... - 그래서 당신도 더 이상 저에게 물어볼 필요가 없습니다.

1) 나는 대상을 고려한 RSA가 있다고 말하고 있습니다.

2) 저는 아무것도 묻지 않았고 주장했습니다.

 

mytarmailS #:

1)타겟팅을 고려한 SA가 있다고 말씀 드린 것입니다.

2) 저는 질문한 것이 아니라 주장한 것입니다.

이들은 이미 PC를 타겟에 인위적으로 연결하는 알고리즘입니다 - 다른 알고리즘 (때로는 다른 라이브러리에서 다르게 구현되는 소프트웨어)... 타겟을 기능에 바인딩하는 방법은 각자의 비즈니스이며 PCA = "교사와 함께"라는 요점을 만들지 않습니다 (교사는 실제로 원하는 방식으로 별도로 바인딩됩니다) -- 다시 요점에서 벗어나 "취향과 색상..."(라이브러리)이라는 주제로 넘어갑니다. (라이브러리).

라이브러리가 로테이션을 하는지, 아니면 직접 코딩해야 하는지 잘 모르겠습니다... 그래서 검증되지 않은 불완전하고 부정확 한 진술은 여기 누구에게도 관심이 없으며, 특히 현상 / 사물의 의미와 본질을 바꾸고 그 후에 단어를 이해하지 못한다고 외치는 경우.... 당신은 분명히 자신의 말을 정확하게 이해하지 못합니다.

 
JeeyCi #:

라이브러리가 로테이션을 하는지, 아니면 직접 코딩해야 하는지 잘 모르겠네요....

혼자 판단하지 마세요.

(로테이션을 수동으로 수행해야하는지 [통계 패키지에 그것에 대한 무언가가 있다고 생각합니다 - 일부 버튼] 또는 자동으로 알아낼 수 있는지 여부가 확실하지 않습니다.

JeeyCi #:

따라서 확인되지 않고 불완전하거나 부정확 한 진술은 여기 누구에게도 관심이 없습니다.

그리고 확실하지 않다면 확인 된 것을 주장 할 권리가 없습니다 . 무엇이 아닌지, 누가 관심이 있는지, 누가 아닌지.... 물론 머리가 순서대로되어 있다면


추신 그리고 매트릭스에 회전이 있는지 여부는 이해가 있는지 확인하기 쉽지만 분명히 문제가있는 것 같습니다.....

 

그러니 사람들에게 자신을 던지기 전에 확인해보세요,

- 처음부터 이해가 되지 않는다면, 극단적인 방법을 찾는 대신 코드와 결과물에 구리안/부정확한 톤을 쏟아 부으세요.

 
LDA와 어떻게 다른가요? 따옴표에서는 새로운 데이터에는 작동하지 않는 타이트 핏을 얻을 수 있습니다. 하지만 훈련된 모델의 오류를 거의 0에 가깝게 줄여줍니다. Sanych의 접근 방식에서도 비슷한 상황이 발생할 수 있습니다. 파리를 커틀릿에 맞추는 원리는 동일합니다.

그러나 슬라이딩 창은 통계가 수집되면 약간의 기쁨을 가져다 줄 것입니다. 아직 상상할 수 없습니다.
 

게시물이 급증하고 있습니다!


다시 한 번.

저는 예측 능력에 따라 예측자의 순위를 매깁니다.

수많은 패키지의 알고리즘이 너무 느리기 때문에 저는 정확도는 떨어지지만 매우 빠른 저만의 알고리즘을 사용합니다.

예측 능력은 상관관계가 아니며 모델이 생성하는 예측자 선택의 결과가 아닙니다.

예측 능력은 정보의 상관관계이지 예측의 결과가 아닙니다:

1. 상관관계는 한 고정 계열과 다른 계열의 '유사성'이며, 항상 어떤 값은 있고 '관계 없음' 값은 없습니다. 상관관계에는 항상 어떤 종류의 값이 있으므로 상관관계를 사용하여 교사와 커피 찌꺼기 사이의 관계를 쉽게 찾을 수 있습니다.

2. 피시 셀렉틴은 모델을 구축할 때 피시를 사용하는 빈도입니다. 선생님과 관련이 없는 예측 변수를 사용해도 여전히 피시 순위를 얻을 수 있습니다.

제가 이해하는 "예측력"과 유사한 예로 각 무게 중심 클래스에 대해 마하라노비스 샘플링 거리 를 정의하는 caret::classDist()를 들 수 있습니다. 또는 woeBinning. R에는 많은 접근 방식과 많은 패키지가 있습니다. 정보 이론에 기반한 더 많은 것들이 있습니다.