트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2606

 
막심 드미트리예프스키 # :

다음과 같은 질문이 있습니다.

2개의 모델이 사용됩니다. 하나는 매수 또는 매도를 예측하고 다른 하나는 거래 여부를 예측합니다.

먼저 첫 번째 것이 훈련된 다음 예측이 잘 안되는 곳을 보고 이러한 예를 "거래 안함"으로 표시하고 나머지는 "거래"로 표시하고 이에 대한 두 번째 모델을 훈련합니다.

첫 번째 모델은 훈련 사이트뿐만 아니라 추가 모델에서도 테스트되고 두 번째 모델은 두 사이트에서 모두 훈련됩니다.

이를 여러 번 반복하여 동일한 데이터 세트에서 두 모델을 재교육합니다. 결과는 샘플에 대해 점차적으로 향상됩니다. 그러나 항상 대조 샘플에 있는 것은 아닙니다.

이와 병행하여 불량 거래의 로그는 모든 패스에 걸쳐 누적된 상태로 유지되고 "거래 안함"에 대한 모든 "불량" 거래는 두 번째 모델을 훈련하기 위해 여기에 수집되고 더 많은 사본과 같은 몇 가지 원칙에 따라 필터링됩니다. 모든 패스에 대해 나쁜 거래가 있을수록 "거래 안 함"으로 표시할 확률이 높아집니다.

예를 들어, 모든 교육 반복에 대한 각 날짜에 대해 특정 수의 불량 거래가 누적되었으며 이 수가 임계값(평균, 평균)을 초과하는 경우 해당 거래는 "거래 안함"으로 레이블이 지정됩니다. 나머지는 건너뜁니다. 그렇지 않으면 학습 반복이 많은 경우 모든 트랜잭션을 제외할 수 있습니다.

계수를 사용하면 출구에서 트랜잭션 수 를 조정할 수 있습니다. 낮을수록 더 많은 트랜잭션이 필터링됩니다.

...이 시점에서 나는 이미 쓰기에 지쳤습니다 ...

새로운 독립 사이트에서 결과를 개선하기 위해 이러한 모델 조합을 어떻게 개선할 수 있습니까?
이것이 작동할 수 있는 어떤 철학이 있습니까? 모델이 각 라운드의 재교육에서 자연스럽게 서로를 향상시킨다는 사실(오류가 떨어짐)을 제외하고는 적합성을 제거하는 방법은 무엇입니까?

흥미로운 개념!

1. 핏을 없애는 방법. 나는 반복에 대해 많이 이해하지 못한다. 필터링(두 번째) 모델을 한 번만 훈련하고 첫 번째 모델의 작업을 개선/향상하지 않는지 평가할 수 없는 이유는 무엇입니까? 이 경우 신호 1을 2로 간단히 필터링하거나 출력 2를 입력 1에 공급할 수 있습니다.

2. 개선 방법.
2.1. 트랜잭션 마크업에서 클러스터링된 마크업을 만들 수 있습니다. 확실히 나쁜 신호가 쌓여가고 있습니다. 그리고 좋은 것들. 우리는 클러스터를 표시합니다. 거래 방식(입력/촛불 기반 기능), 목표 - 우리는 좋은 클러스터 또는 나쁜 클러스터에 있음을 배울 수 있습니다. 그리고 클러스터 컨텍스트(클러스터 컨텍스트의 기능, 훈련 샘플의 한 객체는 클러스터), 대상 또는 동일한 방식(좋은 클러스터 또는 나쁜 클러스터의 다음 캔들) 또는 다음과 같이 학습할 수 있습니다. 다음 클러스터는 좋거나 나쁩니다(음, 실제로는 같을 수도 있습니다).
2.2. 기능 설명은 아마도 이러한 모델에 대해 달라야 합니다. 그렇지 않으면 두 번째 모델의 한계 효용이 낮아질 것 같습니다.


3. 개념 이면의 철학. 그러나 누가 그것을 필요로 하는지, 모델의 효율성, 이익 - 그것이 척도입니다. 철학이 아니라 실험이 지배한다.)

 
Replicant_mih # :

흥미로운 개념!

1. 핏을 없애는 방법. 나는 반복에 대해 많이 이해하지 못한다. 필터링(두 번째) 모델을 한 번만 훈련하고 첫 번째 모델의 작업을 개선/향상하지 않는지 평가할 수 없는 이유는 무엇입니까? 이 경우 신호 1을 2로 간단히 필터링하거나 출력 2를 입력 1에 공급할 수 있습니다.

2. 개선 방법.
2.1. 트랜잭션 마크업에서 클러스터링된 마크업을 만들 수 있습니다. 확실히 나쁜 신호가 쌓이고 있습니다. 그리고 좋은 것들. 우리는 클러스터를 표시합니다. 거래 방식(입력/촛불 기반 기능), 목표 - 우리는 좋은 클러스터 또는 나쁜 클러스터에 있음을 배울 수 있습니다. 그리고 클러스터 컨텍스트(클러스터 컨텍스트의 기능, 훈련 샘플의 한 객체는 클러스터), 대상 또는 동일한 방식(좋은 클러스터 또는 나쁜 클러스터의 다음 캔들) 또는 다음과 같이 학습할 수 있습니다. 다음 클러스터는 좋거나 나쁩니다(음, 실제로는 같을 수도 있습니다).
2.2. 기능 설명은 아마도 이러한 모델에 대해 달라야 합니다. 그렇지 않으면 두 번째 모델의 한계 효용이 낮아질 것 같습니다.


3. 개념 이면의 철학. 그러나 누가 그것을 필요로 하는지, 모델의 효율성, 이익 - 그것이 척도입니다. 철학이 아니라 실험이 지배한다.)

나는 첫 번째 모델(그리고 두 번째 모델도)의 일반화 능력을 향상시키고 싶습니다. 신호를 두 번째 모델로 간단히 필터링하면 첫 번째 모델의 분류 오류가 내부적으로 감소하지 않습니다. 따라서 우리는 데이터 세트에 대해 두 개의 훈련된 모델을 일종의 실행하고 오류가 더 낮아지도록 첫 번째 훈련에서 잘못된 예제를 버립니다. 그리고 두 번째 오류도 떨어집니다. 그래서 우리는 여러 번 반복합니다. 매번 더 좋아져야 합니다. 하지만 매번 시험 샘플에 더 잘 나왔으면 하는 바램이 있지만 큰 흩어짐이 있습니다.

나는 거기에서 무엇을 더 조일지 생각하고 있습니다. 아마도 몇 가지 생각도 할 것입니다. :)

 
막심 드미트리예프스키 # :

나는 첫 번째 모델(그리고 두 번째 모델도)의 일반화 능력을 향상시키고 싶습니다. 신호를 두 번째 모델로 간단히 필터링하면 첫 번째 모델의 분류 오류가 내부적으로 감소하지 않습니다. 따라서 우리는 데이터 세트에 대해 두 개의 훈련된 모델을 일종의 실행하고 오류가 더 낮아지도록 첫 번째 훈련에서 잘못된 예제를 버립니다. 그리고 두 번째 오류도 떨어집니다. 그래서 우리는 여러 번 반복합니다. 매번 더 나아져야 합니다. 하지만 매번 시험 샘플에 더 잘 나왔으면 하는 바램이 있지만 큰 흩어짐이 있습니다.

나는 거기에서 무엇을 더 조일지 생각하고 있습니다. 아마도 몇 가지 생각도 할 것입니다. :)

2개의 모델이 필요하고 OOS에서 결과가 향상될 것이라고 확신하십니까?
첫 번째 모델의 경계를 0.5가 아니라 0.3과 0.7, 심지어 0.1과 0.9까지 가져갈 수 있습니다. 이렇게 하면 확률이 낮은 트랜잭션이 제거되고 트랜잭션이 줄어들고 모델은 1만 됩니다.
 
Alexey Nikolaev # :

오해하지 마세요... 그러므로 저는 검증 가능한 진술 을 선호합니다.

나를 오해 하지마. 나는 방금 당신의 논리적 구성이 부정확하다는 것을 알아차렸습니다. "장기간 실행되는 알고리즘은 시장에 없습니다. 그렇지 않으면 조만간 시장에 남아 있을 뿐입니다." 그들이 정확히 어떤 틈새 시장에 존재하는지 보여줍니다. 왜 그것들은 따로 존재하며 전체 시장을 장악하지 못하는가? 그리고 검증된 예를 드셨습니다.

Об авторе | QuantAlgos
  • www.quantalgos.ru
Приветствую вас в моем блоге. Меня зовут Виталий, занимаюсь написанием биржевых роботов c 2008 года. В 2009 и 2010 гг. участвовал в конкурсе ЛЧИ (лучший частный инвестор) под ником robot_uralpro, проводимом биржей РТС  (сейчас Московская биржа). Использовались HFT роботы, написанные на C#.  Результаты были следующие: В настоящее время продолжаю...
 
도서관 # :
2개의 모델이 필요하고 OOS에서 결과가 향상될 것이라고 확신하십니까?
첫 번째 모델의 경계를 0.5가 아니라 0.3과 0.7 또는 0.1과 0.9로 간단히 가져올 수 있습니다. 이렇게 하면 확률이 낮은 트랜잭션이 제거되고 트랜잭션이 더 적어지고 모델은 1만 됩니다.

유연성이 2가 증가하면 이러한 확률은 다음과 같습니다. 트랜잭션 수가 감소할 뿐 안정성이 보장되지 않습니다.

 
막심 드미트리예프스키 # :

유연성이 2가 증가하면 이러한 확률은 다음과 같습니다. 트랜잭션 수가 감소할 뿐 안정성이 보장되지 않습니다.

당신은 또한 2로 안정성이 없습니다 ...
 
의사 # :

나를 오해 하지마. 나는 방금 당신의 논리적 구성이 부정확하다는 것을 알아차렸습니다. "장기간 실행되는 알고리즘은 시장에 없습니다. 그렇지 않으면 조만간 시장에 남아 있을 뿐입니다." 그들이 정확히 어떤 틈새 시장에 존재하는지 보여줍니다. 왜 그들은 별도로 존재하고 전체 시장을 포착하지 못합니다. 그리고 검증된 예를 드셨습니다.

주어진 진술의 실제 존재 확인은 그 내용의 확인을 의미하지 않습니다.

누군가가 매년 일관되게 수입을 올리는 것이 입증되었다고 가정하더라도(여기에는 종종 문제가 있을 수 있음), 이것이 동일한 알고리즘에 의해 수행된다는 증거가 어떻게 보일 수 있는지 완전히 이해할 수 없습니다. '한마디', '이게 내가 하는 말'보다 더 의미 있는 선택지가 나왔으면 좋겠다.

 
Maxim Dmitrievsky # :

유연성이 2가 증가하면 이러한 확률은 다음과 같습니다. 트랜잭션 수가 감소할 뿐 안정성이 보장되지 않습니다.

셋이서 더 좋다

;)

 
elibrarius # :
당신은 또한 2로 안정성이 없습니다 ...

많은 옵션, 비교하기 어려운

 
Maxim Dmitrievsky # :

많은 옵션, 비교하기 어려운

이미 2개의 모델로 구성된 작업 묶음의 예가 있습니다. 첫 번째 모델의 변형(0.1-0.9 또는 0.2-0.8을 통한 컷오프 포함)은 만들기 쉽고 환경 보호에 대한 저항을 비교할 수 있습니다.
사유: