트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩

Aleksey Vyazmikin 2023.10.26 18:00 #33231

Andrey Dik #:

예, 문제는 항상 새로운 데이터에 대한 모델의 견고성을 보장하는 것입니다. 그렇기 때문에 그러한 기준을 찾는 것이 가장 중요하고 어려운 일 중 하나라고 말씀드렸습니다.

트레이딩과 머신러닝에서 사용하는 결과 평가 지표는 결과 모델/튜닝/근사치의 품질을 평가하는 데 일부일 뿐이라는 뜻입니다.

중요한 것은 어떤 조건에서 이를 달성했는가 하는 것입니다. 이를 달성하는 데 얼마나 많은 정보가 필요했는지. 시간 경과에 따른 관측의 안정성을 평가해야 합니다. 각 예측 변수의 기여도.

많은 수의 예측자와 결정 규칙(트리든 뉴런이든)이 있는 복잡한 모델의 문제점은 전체적으로 반복될 가능성이 낮은 복잡한 패턴을 생성하므로 클래스 중 하나에 할당될 확률이 편향된다는 것입니다. 앞서 '나무가 윙윙거리는 모습'을 담은 사진을 올렸는데, 대부분의 나뭇잎이 새로운 데이터에 대해 활성화되지 않는다는 것을 보여줬습니다.

이 모든 것은 우리가 근사치를 구하기 위해 완전히 탐색할 수 없는 '함수'(실제로는 그 합)를 다루고 있다는 사실에서 비롯된 것입니다. 즉, 우리는 더 많이 이해되거나 알려진 것들에만 특별한 주의를 기울여야 합니다. 과거의 단일 사례에 대해 작동하는 것보다 상황에 익숙하지 않은 새로운 데이터에 대해 모델이 "침묵"하게 두는 것이 좋습니다.

따라서 확실하지 않은 경우 모델을 침묵하게 하고, 유리한 이벤트의 확률이 높을 경우 확신을 주는 방법이 필요합니다.

이미 만들어진 모델을 수정하는 방법이 필요합니다. 이러한 방법은 훈련 후 모델에 영향을 주거나 두 가지 클래스, 즉 부스팅 유형과 가장 가까운 이웃 유형의 모델을 적용하여 구현할 수 있습니다.

[ARCHIVE!] 포럼을 어지럽히 지 Price VR에서 고정 VR 상트페테르부르크 현상. 확률 이론의

Andrey Dik 2023.10.26 18:11 #33232

Aleksey Vyazmikin #:

트레이딩과 머신러닝에서 사용하는 결과 평가 지표는 결과 모델/튜닝/근사치의 품질을 평가하는 일부에 불과하다는 것이 제 요점입니다.

중요한 것은 어떤 조건에서 이를 달성했는가 하는 것입니다. 이를 달성하는 데 얼마나 많은 정보가 필요했는지. 시간 경과에 따른 관측의 안정성을 평가해야 합니다. 각 예측자의 기여도.

많은 수의 예측자와 결정 규칙(트리든 뉴런이든)이 있는 복잡한 모델의 문제점은 전체가 반복될 가능성이 낮은 복잡한 패턴을 생성하므로 클래스 중 하나에 할당될 확률이 편향된다는 것입니다. 앞서 "나무들이 윙윙거리는 것"에 대한 사진을 올렸는데, 대부분의 나뭇잎은 새로운 데이터에 대해 활성화되지 않는다는 것을 보여주었습니다.

이 모든 것은 우리가 근사치를 구하기 위해 완전히 탐색할 수 없는 '함수'(실제로는 그 합)를 다루고 있다는 사실에서 비롯된 것입니다. 즉, 우리는 더 많이 이해되거나 알려진 것들에만 특별한 주의를 기울여야 합니다. 과거의 단일 사례에 대해 작동하는 것보다 상황에 익숙하지 않은 새로운 데이터에 대해 모델을 "침묵"으로 유지하는 것이 좋습니다.

따라서 확실하지 않은 경우 모델을 침묵하게 만드는 방법과 유리한 이벤트의 확률이 높을 경우 확신을 주는 방법에 대한 질문이 생깁니다.

이미 만들어진 모델을 수정하는 방법이 필요합니다. 이는 훈련 후 모델에 미치는 영향을 통해 구현할 수도 있고, 부스팅 유형과 가장 가까운 이웃 유형이라는 두 가지 클래스의 모델을 적용하여 구현할 수도 있습니다.

저는 시간이 지남에 따라 단순히 거래 신호 제공을 중단하는 이전 모델을 만들었습니다. 그리고 이것은 새로운 데이터에서 정답 확률을 50/50으로 바꾸는 것보다 낫습니다. 요점은 좁은 범위의 숫자에서 그리드의 답을 얻기 위해 훈련 할 때 시간이 지남에 따라 답이 범위를 벗어나기 시작하고 신호가 사라집니다. 이것은 매우 노동 집약적 인 프로세스이며 교육 및 추가 거래를 자동화하지 못했습니다.

이것은 접근 방식 중 하나이며 아마도 다른 접근 방식이있을 수 있으므로이 주제를 연구해야합니다.

Ivan Butko 2023.10.26 18:31 #33233

Andrey Dik #:

본질 - 좁은 범위의 숫자에서 그리드 답을 맞추기 위해 훈련하는 동안 시간이 지남에 따라 답이 범위를 벗어나기 시작하고 신호가 사라집니다. 이것은 매우 노동 집약적 인 프로세스이며 교육 및 추가 거래를 완전히 자동화하지 못했습니다.

MT5 옵티마이저의 도움으로 이 아이디어를 구현했습니다:

의사 뉴런에 조건을 설정했습니다: "세트의 결과가 Close[1] +/- 0.00050핍 범위의 숫자를 제공하면 매수 개시."
입력 - 하나의 숫자만 - Close[2];

최적화 프로그램은 수익성 있는 거래를 열심히 검색하기 시작하지만 대신 거래 수에 따라 세트를 정렬합니다.

최적화 프로그램이 완료되면 거래 수가 가장 많은 가장 소모적인 세트를 선택합니다 - 이는 당연히 전문가 조언자가 미래 가격의 최대 수를 추측했음을 의미합니다.

그런 다음 조건이 이미 변경된 테스트 모드로 전환합니다."세트의 결과가 Close[1]보다 큰 숫자가 N 포인트 이상이면 매수 개시"

짜잔 : 선물은 1년 안에 수익성이 있습니다.

한 가지 문제 : 오전 2시에 한 시간 캔들에서만 작동했습니다. 종가 - 다음 시간이 시작될 때.

나는 어떻게 든 그런 패턴을 발견했습니다. 다른 아침 시간에 EURUSD, USDCHF 및 EURGBP에서 작동했습니다.

가격 증분 분배 OpenCL: MQL5의 내부 구현 디지털 필터를 기반으로 한

Aleksey Vyazmikin 2023.10.26 18:35 #33234

Andrey Dik #:
좁은 범위의 숫자 그리드 응답

NS 또는 다른 그리드에 대해 이야기하고 있습니까?

안드레이 딕 #:
시간이 지남에 따라 응답이 범위를 벗어나기 시작하고 신호가 사라집니다.

예측 변수의 총합이 변경 되었기 때문입니까, 아니면 "원하는"결과가 표시되지 않았을 수도 있습니까?

일반적으로 무언가가 고장난 이유에 대한 질문은 추가 아이디어에 매우 중요할 수 있습니다.

Andrey Dik 2023.10.26 18:45 #33235

Aleksey Vyazmikin #:

1. NS를 말하는 건가요, 아니면 다른 그리드를 말하는 건가요?

2. 예측 변수의 총 점수가 변경되었기 때문인가요, 아니면 예측 변수 중 하나만 "원하는" 결과가 표시되지 않았나요?

일반적으로 문제가 발생한 이유에 대한 질문은 향후 아이디어에 매우 중요할 수 있습니다.

1. 예, 물론입니다.

2. 아마도 내가 올바른 방법으로 넣지 않았을 것입니다. 아니요, 새로운 데이터에서 거래가 점차 사라지는 긍정적인 효과일 뿐입니다. 단위 시간당 거래 횟수가 일정 수준 이하로 감소하면 다시 트레이닝을 해야 합니다. 즉, 재훈련의 신호로 OOS에서 거래 효율이 감소하는 것이 아니라 거래 횟수가 감소하는 것입니다.

즉, OOS에서 거래 손실을 가져오는 말도 안되는 말을하는 대신 NS는 익숙하지 않은 데이터에 대해 침묵을 제공합니다.

Aleksey Vyazmikin 2023.10.26 18:48 #33236

Aleksey Nikolayev #:
링크에서 패킷을 더 쉽게 찾을 수 있는 교차 유효성 검사에 '프로필'을 연결하는 방법에 대해서도 설명합니다.

여기서 연결이 보이지 않습니다. 어떤 단어에서 나온 말인가요?

Aleksey Vyazmikin 2023.10.26 18:50 #33237

Forester #:

이 작업은 실험적입니다. 다음은 http://www.ccas.ru/frc/papers/students/VoronKoloskov05mmro.pdf 에서 인용한 내용입니다.

모든 실험이 패키지로 만들어지지는 않을 것입니다.

아, 그리고 이 실험은 인위적입니다. 클래스별로 명확하게 구분된 데이터 세트에 노이즈가 추가되었습니다. 그리고 명확한 분리는 오직 하나의 특징, 즉 Y 축에만 해당됩니다. 노이즈(0.2~0.8의 모든 데이터)를 제거하면 다른 클래스와의 거리가 0.6 이상인 예제만 남는다는 것을 알 수 있습니다. 그림에서 가장 복잡한 세 번째 변형을 의미합니다:

실제 생활로 이동하여이 단일 작업 피시에 노이즈가 될 5000 개의 예측자를 추가하십시오. 클러스터링에서는 이 5001 차원 공간에서 점 사이의 총 거리를 계산합니다. 이 혼돈 속에서 0.6 작동은 결코 발견되지 않습니다.

나는 어떤 분류기가 더 잘할 것이라고 생각합니다. 동일한 트리가이 단일 기능을 찾아서 먼저 0.5로 나눈 다음 0.2와 0.8의 분할에 도달 한 다음 순도 100 %의 잎으로 나눌 것입니다.

이 알고리즘으로 카글에서 1 위를 차지할 수 있었다고 주장하는데, 간단한 작업이 있었다고 생각하지 않습니다....

알아 내려고 노력할까요? 나는 공식을 이해하지 못합니다-큰 유감입니다.

Aleksey Vyazmikin 2023.10.26 18:52 #33238

mytarmailS #:
블라디미르 페레르벤코의 기사 중 하나가 이 방법을 설명했고, 물론 코드가 포함된 예제가 있었습니다.

비디오에서이 알고리즘에 대해 배웠고 슬레이드에 몇 가지 공식이 있지만 코드라고 부르기는 어렵습니다.

예제 코드는 어디에서 보셨나요?

Aleksey Vyazmikin 2023.10.26 18:53 #33239

Andrey Dik #:

1. 예, 물론입니다.

2. 제가 그렇게 표현하지 않았을 수도 있습니다. 아니요, 새로운 데이터에서 거래가 점차 사라지는 긍정적인 효과였을 뿐입니다. 단위 시간당 거래 횟수가 일정 수준 이하로 감소하면 다시 트레이닝을 해야 합니다. 즉, 재훈련의 신호로 OOS에서 거래 효율이 감소하는 것이 아니라 거래 횟수가 감소하는 것입니다.

즉, OOS에서 거래 손실을 가져 오는 말도 안되는 말을하는 대신 NS는 익숙하지 않은 데이터에 대해 침묵을 제공합니다.

그것이 제가 깨달은 것입니다. 원인을 파악했는지 묻는 것뿐입니다. 무엇이 고장 났는지가 아니라 신호가 누락 된 이유에 대해.

mytarmailS 2023.10.26 18:54 #33240

Aleksey Vyazmikin #:

비디오에서 이 알고리즘에 대해 배웠는데, 슬레이드에 몇 가지 공식이 있지만 코드라고 부르기는 어렵습니다.

코드의 예는 어디서 보셨나요?

이거 트롤링인가요?

트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3324