트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2569

 
mytarmailS # :
추세 결정론 테스트가 있는지 누가 알겠습니까..
그들은 이것이 실제로 추세인지 무작위 변동인지 알아야 합니다.

같은 허스트가 아닐까요?


즉시 사용 가능한 다양한 유형의 트렌드 테스트

R님 최고!!!!

R에는 멋진 트렌드 패키지가 있습니다. 선형 추세의 경우 sens.slope()가 거기에서 잘 작동합니다.

 
mytarmailS # :

금융 수학 및 MO에서 이해해야 할 사항은 무엇입니까? 시장과 그 참여자의 역학을 알아야 합니다.

몹은 카운터 에이전트가 "큰 플레이어"이기 때문에 대부분의 시간을 잃을 수밖에 없습니다.

1) 소매의 구매자와 판매자의 불균형을 볼 필요가 있습니다. 예를 들어 판매자가 많은 경우 거래의 다른 쪽 끝에 "주요 플레이어"(구매자)가 있습니다.

예를 들어 지금 유대인에는 많은 판매자가 있습니다.

2) 군중에 대한 순간에 거래도 있습니다. 이것은 이미 시장 조성자를 거래하고 있습니다.

가격은 항상 군중의 위치의 역학에 반하여 움직이는 것을 볼 수 있습니다(역상관)

군중이 구매하고 성장을 믿는 동안 가격은 떨어지고 그 반대도 마찬가지입니다.

그게 다 시장이야..


ps. 영상 잘 보고 갑니다

이것에도 문제가 있고 상당한 문제가 있습니다. 우리는 시장의 작은 부분에만 접근할 수 있으며, 이는 얼마나 유용하고 신뢰할 수 있는지 알려져 있지 않습니다. 두 번째 그림(일반 감정)은 일반적으로 쓸모가 없습니다. 첫째, 반전이 정기적으로 극단적으로 발생하며, "대중 반대" 추세가 계속되어야 하는 것처럼 보입니다. 둘째, 감정은 단순히 가격을 반복합니다(거꾸로 및 마이너스 추세) - 오실레이터를 뒤집고 매우 유사한 그림을 얻습니다. 뭐, 지표가 가격을 반복하기 때문에 가격 차트 자체보다 예측하기가 쉽지 않죠? 첫 번째 그림(DOM 및 오픈 포지션)과 이익 비율의 값은 이론상 더 많은 가치를 갖지만 이 또한... 매우 의심스럽습니다.


 
Alexey Nikolaev # :

얼마나 정확하게 코딩되는지 (조합의 관점에서) 큰 차이가 없습니다. 본질은 동일합니다. 각 줄에는 표시로 어떤 규칙을 따르고 어떤 규칙을 따르지 않는지 기록됩니다. 이것은 항상 2^N 옵션이며, 여기서 N은 규칙의 수입니다. 그런 다음 각 규칙이 최종 세트에 포함되는지 여부가 선택됩니다. 이는 이미 2 ^ (2 ^ N) 옵션입니다. 이러한 옵션 집합을 형식적으로 단순히 정렬하는 것은 비현실적임이 분명합니다. 따라서 어떻게든 합리적으로 분류하는 것이 합리적입니다. 예를 들어, 먼저 하나의 규칙으로만 설명되는 모든 옵션을 선택한 다음 두 개만 사용하는 식입니다. 글쎄, 또는 그런 것.

제가 잘 설명하고 있지는 않지만 여기서 다시 한 번 강조하고 싶은 것은 CatBoost 학습 알고리즘 내에서 한 번 양자화되는 초기 샘플로 작업하고 있다는 것입니다. 1000개의 예측 변수가 있고 각각을 10개의 세그먼트로 양자화하여 결과적으로 10000개의 세그먼트가 있다고 가정해 보겠습니다. 그러면 CatBoost 알고리즘이 예측 변수를 무작위로 추출하고 경계를 따라 실행합니다. 중간에 있는 3개의 부등식을 작성하거나 8개의 잎을 생성해야 하며 7개의 잎은 쓰레기에 대해 이야기하고 1장은 귀중한 정보에 대해 이야기해야 합니다. 알고리즘이 그러한 트리를 만들 것인지 여부도 사실이 아닙니다. 무작위성에 대한 사랑이 있고 인접한 양자가 시트에 들어갈 수 있기 때문입니다. 그리고 한 그루의 나무로 두십시오. 내 방법에서는 하나의 부등식으로 충분합니다 - 2 장. 모든 예측 변수가 사용되고 각각에 1개의 유용한 세그먼트가 있더라도 모델을 생성할 때 조합의 수는 훨씬 적습니다. 그러나 새로운 트리를 구축하는 데 필요한 안정화를 위해 샘플의 잘못된 분할이 많지 않기 때문에 노이즈가 적은 것이 중요합니다(부스팅 원리).

Alexey Nikolaev # :

예를 들어 조만간 다른 많은 플레이어도 찾을 수 있을 것입니다.

그러면 이 이론을 어떻게든 테스트해야 하지 않을까요? 이점의 반복 빈도가 최소인 경우는 증가 후 계속 존재하는 것보다 사라질 가능성이 더 큽니다.

예를 들어, 우리는 반년마다 측정하고 1.5년의 이점이 있습니다. 우리는 반년 동안 여전히 작동할 것이라고 믿으며 이미 2.5년이면 더 이상 복용하는 것이 의미가 없습니다. 작동을 멈출 가능성이 더 커집니다.

나는 과학 공식에 약하지 않습니다. 그런 계산을 수행하고 가설을 테스트하는 방법을 알려주시겠습니까?

 
Alexey Nikolaev # :

R에는 멋진 트렌드 패키지가 있습니다. 선형 추세의 경우 sens.slope()가 거기에서 잘 작동합니다.

고맙습니다

vladavd # :

이것에도 문제가 있고 상당한 문제가 있습니다. 우리는 시장의 작은 부분에만 접근할 수 있으며, 이는 얼마나 유용하고 신뢰할 수 있는지 알려져 있지 않습니다. 두 번째 그림(일반 감정)은 일반적으로 쓸모가 없습니다. 첫째, 반전이 정기적으로 극단적으로 발생하며, "대중 반대" 추세가 계속되어야 하는 것처럼 보입니다. 둘째, 감정은 단순히 가격을 반복합니다(거꾸로 및 마이너스 추세) - 오실레이터를 뒤집고 매우 유사한 그림을 얻습니다. 뭐, 지표가 가격을 반복하기 때문에 가격 차트 자체보다 예측하기가 쉽지 않죠? 첫 번째 그림(DOM 및 오픈 포지션)과 이익 비율의 값은 이론상 더 많은 가치를 갖지만 이 또한... 매우 의심스럽습니다.

당신은 많은 면에서 실수하고, 이 정보를 너무 피상적이고 생각 없이 인식합니다.

 
Aleksey Vyazmikin # :

제가 잘 설명하고 있지는 않지만 여기서 다시 한 번 강조하고 싶은 것은 CatBoost 학습 알고리즘 내에서 한 번 양자화되는 초기 샘플로 작업하고 있다는 것입니다. 1000개의 예측 변수가 있고 각각을 10개의 세그먼트로 양자화하여 결과적으로 10000개의 세그먼트가 있다고 가정해 보겠습니다. 그러면 CatBoost 알고리즘이 예측 변수를 무작위로 추출하고 경계를 따라 실행합니다. 중간에 있는 3개의 부등식을 작성하거나 8개의 잎을 생성해야 하며 7개의 잎은 쓰레기에 대해 이야기하고 1장은 귀중한 정보에 대해 이야기해야 합니다. 알고리즘이 그러한 트리를 만들 것인지 여부도 사실이 아닙니다. 무작위성에 대한 사랑이 있고 인접한 양자가 시트에 들어갈 수 있기 때문입니다. 그리고 한 그루의 나무로 두십시오. 내 방법에서는 하나의 부등식으로 충분합니다 - 2 장. 모든 예측 변수가 사용되고 각각에 1개의 유용한 세그먼트가 있더라도 모델을 생성할 때 조합의 수는 훨씬 적습니다. 그러나 새로운 트리를 구축하는 데 필요한 안정화를 위해 샘플의 잘못된 분할이 많지 않기 때문에 노이즈가 적은 것이 중요합니다(부스팅 원리).

하나의 의사 결정 트리를 예로 들어 접근 방식을 설명해야 할 수도 있습니다. 그럼에도 불구하고 부스트 자체는 트리의 정제 시퀀스인 다소 복잡한 구조를 구축합니다. 그리고 당신은 그녀와   다른 일을 하다)

Aleksey Vyazmikin # :

그러면 이 이론을 어떻게든 테스트해야 하지 않을까요? 이점의 반복 빈도가 최소인 경우는 증가 후 계속 존재하는 것보다 사라질 가능성이 더 큽니다.

예를 들어, 우리는 반년마다 측정하고 1.5년의 이점이 있습니다. 우리는 반년 동안 여전히 작동할 것이라고 믿으며 이미 2.5년이면 더 이상 복용하는 것이 의미가 없습니다. 작동을 멈출 가능성이 더 커집니다.

나는 과학 공식에 약하지 않습니다. 그런 계산을 수행하고 가설을 테스트하는 방법을 알려주시겠습니까?

반감기가 있는 방사능 공식과 유사한 것) 사람들의 활동이 유사한 간단한 공식으로 설명될 수 있다고 생각하지 않습니다) 귀하의 "이점 주파수"는 매우 예측할 수 없는 방식으로 변경될 가능성이 큽니다.

 
Alexey Nikolaev # :

하나의 의사 결정 트리를 예로 들어 접근 방식을 설명해야 할 수도 있습니다. 그럼에도 불구하고 부스트 자체는 트리의 정제 시퀀스인 다소 복잡한 구조를 구축합니다. 그리고 당신은 그녀와   다른 일을 하다)

네, 그 방법을 바로 이해하기가 쉽지 않은 것으로 압니다. 더 자세히 설명할 계획입니다. 그리고 데이터는 CatBoost에 공급되기 전에 처리되지만 분할할 때 "쇠퇴"의 역학 변화를 고려한 나만의 알고리즘을 만들고 싶습니다.

Alexey Nikolaev # :

반감기가 있는 방사능 공식과 유사한 것) 사람들의 활동이 유사한 간단한 공식으로 설명될 수 있다고 생각하지 않습니다) 귀하의 "이점 주파수"는 매우 예측할 수 없는 방식으로 변경될 가능성이 큽니다.

아마도 아무것도 없지만 확인하는 방법은 무엇입니까?

 
mytarmailS # :

고맙습니다

당신은 많은 면에서 실수하고, 이 정보를 너무 피상적이고 생각 없이 인식합니다.

네, 저는 이 도구로 수년 동안 작업했지만 전혀 생각해본 적이 없습니다.

구체적으로 무엇에 동의하지 않습니까?

 
Aleksey Vyazmikin # :

예, 그렇게 말합시다.

아니요, 이제 우리는 불평등 규칙의 이행을 하나로 간주하고 규칙이 샘플에 의해 트리거될 때 대상의 평균 값(예: 이진 분류)을 살펴봅니다. 예를 들어 초기 평균 값이 0.45인 경우 표본이고 응답에 의해서만 평가된 후에 0.51이 된 후 예측자(섹션/양자)가 0.06의 예측력을 갖는 것으로 간주합니다. 즉, 6%.

우리는 이미 독립적인 이진 예측 변수인 섹션이 있는 이러한 예측 변수 집합을 수집하고 이를 기반으로 모델을 구축합니다.

그러한 모든 양자를 모두(예측력이 있거나 없는)와 결합하는 것은 실제로 빠른 일이 아니지만 예측력이 있는 양이 식별된 기본 예측자로 수행되는 경우 비합리적이지 않을 수 있습니다.

그러나 이론상으로도 전체 샘플보다 가능한 조합이 더 적기 때문에 이 과적합은 적습니다.

그러한 양자 법칙이 7년 동안 작동하다가 갑자기 멈출 수 있는 이유를 이해하는 것이 남아 있습니다.

당신이하고있는 일을 올바르게 이해 했습니까? :


1) 우리는 1개의 나무를 얻습니다.
2) 각 노드는 최대 10개의 분기를 제공할 수 있습니다(발견된 그림에서는 적게, 각각 10개라고 상상). 각 분기는 1개의 퀀텀에 의해 생성됩니다(퀀텀은 10%의 예측 변수의 일부입니다: 백분위수 또는 10% 사용된 양자화 방법에 따라 진폭).
3) 첫 번째 분할 후 3개의 퀀타가 발견되어 나중에 성공적인 목록으로 이어집니다.
4) 후속 부서에서 성공적인 이직으로 이어지는 더 좋은 분할/양을 찾습니다.
5) 성공적인 떠날 때까지 성공적인 양을 기억하십시오.
6) 예측 변수로 선택된 양자만을 사용하는 새로운 트리를 구축합니다.

이를 위해 첫 번째 트리를 양자화한 것과 동일한 방법을 사용하여 스크립트로 예측자를 양자화합니다. 100개의 예측자 중 1000개를 얻었고 이미 이진 0 또는 1입니다. 예측자 값이 이 범위에 있으면 = 1, 그렇지 않으면 = 0입니다.
우리는 성공적인 경로/양자만 선택하고 있으므로 선택한 모든 양자 값은 = 1입니다. 모든 예측 변수가 1이면 새 트리는 학습할 수 없습니다. 답은 이미 알려져 있습니다.

아니면 더 이상 새로운 트리를 만들 필요가 없습니까? 예측 변수의 값이 선택한 퀀텀에 해당하면 즉시 조치를 취해야 합니까?

 
vladavd # :

네, 저는 이 도구로 몇 년 동안 작업했지만 전혀 생각해 본 적이 없습니다.

구체적으로 무엇에 동의하지 않습니까?

어떤 도구로?

 
mytarmailS # :

어떤 도구로?

글쎄, 사진에 무엇이 있습니까? 유리와 감성.

사유: