트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1248

 

재훈련이 노이즈로 인해 시장을 암기한 결과라면 시장을 암기하기 위해서는 의사결정나무의 숲과 부스팅, 그리고 하나의 트리와 적은 수의 뉴런은 더 적게 재훈련해야 합니다. 그러다가 전체 샘플(훈련, 테스트, 통제)의 1% 또는 10%의 부피가 무엇인지 한 장으로 설명할 수 없는 중요한 양의 데이터가 있음이 밝혀졌습니다. 그것이 문제입니다. 그렇다면 아마도 이 데이터를 저장하는 데 필요한 메모리 양의 관점에서 데이터를 평가하고 이 임계 볼륨보다 한 차원 작은 모델을 만들어야 합니까? 이 작업을 수행하는 방법을 모르겠습니다. 아마도 아카이빙과 유사한 것이 있을 것입니다. 아카이버가 10mb에서 1mb까지 선택을 누르면 모델은 102.4kb를 넘지 않아야 합니다. 그런 다음 모델이 샘플을 기억할 뿐만 아니라 패턴을 발견했다는 것을 알면 독립 샘플에 대한 테스트에 덜 중요하고 재훈련에 대한 결론이 아니라 훈련을 위한 샘플의 데이터 부족에 대해 결론을 내릴 수 있습니다. 시장의 현재 상태를 설명하는 상황이 없었기 때문에 사용 가능한 예측 변수를 사용하여 그러한 패턴을 찾는 것이 단순히 불가능했음을 의미합니다.

 
지금은 받은 시트를 바탕으로 손으로 모델을 만들고 있는데, 2014년부터 2018년까지 매년 구매용 20매 정도, 필터용 5매 정도면 수익을 낼 수 있는 것으로 밝혀져 재교육은 할 수 없다고 생각합니다. 그리고 어떻게든 잎사귀에 맞추기에는 부족합니다... 그래서 2019년에 성능이 떨어지는 패턴인가요?
 
막심 드미트리예프스키 :

패턴에는 몇 가지 기본적인 전제 조건이 있어야 합니다. 예를 들어 시장의 일부 주기는 기본적이거나 뉴스에 대한 반응, 일중 변동성 .. 모든 것

패턴이 어디에서 빨려나갔는지 명확하지 않으면 다음에 어떤 일이 일어날지 명확하지 않습니다.

나무에 대한 모델은 패턴 식별 문제를 다루고 예측자는 이벤트에 대해 알려주며 특정 이벤트 집합은 패턴을 제공합니다. 이 패턴은 물리적 현상의 분야가 아니며 알 수 없는 요인(사용 가능한 예측 변수에 의해 설명되지 않은 현상)이 영향을 미칠 수 있기 때문에 일정할 수 없습니다.

일반적으로 통계적으로 빈번하게 반복되는 이벤트는 분류 과정에서 ML 방식으로 파악하고, 지표 옵티마이저를 그냥 시장에 맞추는 것보다, 말 그대로 이게 더 낫다는 게 포인트다.
 
막심 드미트리예프스키 :

여름에 짧은 치마의 수와 시민의 재정적 복지의 상관관계는 90%일 수 있지만 의존성을 의미하는 것은 아니며 패턴은 훨씬 적습니다.

글쎄, 사건과의 인식 할 수없는 연결로 "정규"라는 단어를 "기호"로 바꾸자.

막심 드미트리예프스키 :

최적화 프로그램도 MO입니다.

저것들. 이 두 가지 방법 앞에 등호를 넣습니까?

 
막심 드미트리예프스키 :

나는 그것을 넣지 않았지만 사실이다. 옵티마이저는 f번째를 최소화하고, 신경망 옵티마이저는 f번째 가중치를 최적화한다

TS 필터의 최적화에 대해서만 이야기한다면 같은 행동에 부분적으로 동의할 수 있지만, 진입점/출구점도 최적화된다면 상황은 일반적인 MO와 다소 다릅니다.

 
막심 드미트리예프스키 :

이와 관련하여 데이터 마이닝 1 크리불카도 우둔함의 극치이지만 일부 정보를 추출할 수 있기 때문에 가능하면 데이터 마이닝 및 시장에의 응용에 대해 연구할 필요가 있음)

다른 분야에 적용할 목적으로 공부합니까?

 
막심 드미트리예프스키 :

데이터에서 유용한 것을 올바르게 추출하는 방법을 이해하기 위해

그래서 이전에 제가 유용한 것을 배웠다고 언급했습니다. 아마도 금 한 알의 정보일 수도 있고, 아니면 사고일 수도 있습니다. 누가 알겠습니까 ... 그리고 확실히 알 수 있는 방법은 없습니다.

 
시장이 모두 동일하고 가격 행동 패턴이 유사하다고 가정하면 12개의 상품을 하나의 샘플로 결합하고 모든 시장에 대한 공통 "기호"를 찾는 것이 어떻습니까?
 
마법사_ :

그래서 일반화되었습니다. "패턴" - 다른 샘플에서 발견된 패턴 ... 즉, 방금 기차 샘플로 조정했으며 이제 우리의 두뇌를 알릴 것입니다))) 그러나 동일하게 데이터를 의도적으로 준비해야 합니다. 아이디어 ... 우리가 바보를 운전할 수는 있지만 가능성은 거의 없습니다 ...

2016-2017년 교육을 받은 후 2014-2018년 시트를 확인하고 매년 수익을 내고 기타 여러 기준(일반적인 성장/큰 하락 아님)을 충족하는 시트를 선택했습니다. 여기서도 그런 모델을 비즈니스에서 시작하는 것이 가능한지 생각합니다.

다른 도구의 조합과 관련하여 여기에 많은 사람들이 예측 변수를 가지고 있습니다. 다른 시간 간격에 대한 포인트 증가이며 다른 도구에서는 작동하지 않습니다...

 
막심 드미트리예프스키 :

시장은 모두 다르고 패턴도 자연스럽습니다.

어떤 것을 가정하기 위해서는 그러한 대략적인 가정의 기초로 무엇인가를 가정해야 합니다.

그래서 나는 주제가 모든 곳에서 동일하다는 사실에서 출발합니다 - 상인, 그리고 왜 그는 도구에 따라 행동을 바꿀 것입니까? 그는 기술적 분석이나 다른 방법을 사용하지만 그는 어디에서나 이 방법을 사용합니다. 또 다른 것은 그가 다른 시간에 일련의 방법을 사용할 수 있으므로 한 도구에 한 방법을 맞추는 것이 더 쉽다는 것입니다. image)가 다른 방법으로 전환되면 모델이 중단됩니다.

사유: