트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1322

 
유리 아사울렌코 :

얘들 아, 주제는 거래 스타일과 중지에 관한 것이 아니라 MO에 관한 것입니다. 그들은 왜 여기에 있습니까?

그래서 국회의 틀 안에서 논의를 하고 싶었지만, 막상 가보니 아직 아무도 없다.

 
유리 아사울렌코 :

어제까지만 해도 대화는 정현파 예측으로 바뀌었고 저는 제 예전 주제를 기억했습니다.

맥심, 당신은 여전히이 주제에 부딪쳤습니다. 나는 복수심을 품고 모든 것을 기록한다.)

나는 그들이 헛되이 왔다고 말해야 만합니다. 그러나 주제는 사라졌고 결코 요점에 도달하지 못했습니다. 아마도 좋지 않기 때문일 것입니다. 명확한 문구.

사실 어떤 문제도 풀 필요가 없습니다. 우리는 주제에 있는 것과 같은 특정 기능을 취하거나 더 좋게는 더 복잡합니다. 우리는 이 기능으로 인공 기기를 만들고 이미 작동 중인 전략에 따라 테스터에서 실행합니다. 이론적으로 작동 차량에서 이익은 규모를 벗어납니다. 예, 잊어버렸습니다. 먼저 기능을 정규화하여 TS가 튜닝된 악기와 대략적으로 일치하도록 합니다. 그런 다음 노이즈를 추가하고 어떤 일이 발생하는지 확인할 수 있습니다.

나는 예측을 하지 않고, 그런 기성차가 없기 때문에 가까운 장래에 확인할 수 없습니다. 그러나 멀리, 나는 계획합니다.

이제 이 모든 것이 필요한 이유에 대해 설명합니다.

NN(또는 다른 MO) 예측을 가르쳐야 한다고 가정해 보겠습니다. 일반적으로 NN의 초기 가중치는 무작위로 초기화되며, 훈련 중 NN이 min-max가 되면 매우 좋습니다. 큰 질문.

우리는 다음을 수행합니다.

1. 시장 TS에 가까운 non-random 함수를 생성하고 무작위로 초기화된 NN을 훈련합니다. 확인하고 그 모든 것. 이제 NS는 필요한 설정에 가깝지만 실제 문제를 아직 해결할 수는 없습니다.

2. 실제 VR에서 NN(항목 1 참조)을 훈련합니다. 동시에, 우리는 이미 NN의 예비 설정이 최소-최대 영역 근처 어딘가에 있다는 것을 이미 보장하고 있으며, 추가 훈련 중에 임의의 최소-최대가 아닌 필요한 위치에 도달할 것입니다. .

어떤 주제에 대한 간단한 문제를 먼저 풀고 그 다음에는 복잡한 문제를 해결하도록 가르치는 학생과의 비유. 복잡한 문제를 즉시 해결하도록 강요하는 것보다 모범생을 가르치는 것이 더 효과적입니다.

일반적으로 방법은 발견이 아니라 문헌 어딘가에서 찾아볼 수 있는데 책이 많이 있는데 하나도 기억나지 않는다. 어쨌든 구현에 대해 생각했습니다. 음, 일반적으로 분석 기능을 예측하기 위해 완성된 TS를 시도하는 첫 번째 실험은 단계적 실험으로 필요합니다.



이것이 범람하지 않았다면 2 페이지 전에 f-her의 예를 보았을 것입니다.

스케일 초기화 등에 대해 생각했습니다. 이해하지 못했습니다. 그러면 추가 교육 그리드가 필요하고 예측해야 하는 것과 전혀 일치하지 않는 항목에 대한 교육의 요점은 무엇입니까?

강화 학습의 기본을 설명하려고 하는 것 같습니다.

 
막심 드미트리예프스키 :

ushlepok이 범람하지 않았다면 2페이지 전에 f-her가 포함된 예를 보았을 것입니다.

스케일 초기화 등에 대해 생각했습니다. 이해하지 못했습니다. 그러면 추가 교육 그리드가 필요하고 예측해야 하는 것과 전혀 일치하지 않는 항목에 대한 교육의 요점은 무엇입니까?

강화 학습의 기본을 설명하려고 하는 것 같습니다.

아니요, 튜토리얼이 필요하지 않습니다.

1. 가깝고 명확하게 예측 가능한 데이터에 대한 사전 교육. 스플라인, 다항식, 푸리에 등의 실제 항목에서 요리할 수 있습니다.

2. 이미 실제 데이터에 대해 1절에 따라 이 네트워크에 대한 추가 훈련(비무작위 초기화 포함).

예측을 위해 나는 이것을 하는 방법을 보았고 결과를 향상시킬 수 있다고 생각합니다. 분류를 위해 - 나는 그것에 마음을 두지 않을 것입니다.

함수가 있는 예제는 이에 관한 것이 아닙니다. 흙과 같은 예.

 
막심 드미트리예프스키 :

Alexey는 최악의 catboost와는 거리가 멀고 오늘날 연구에 가장 적합한 것 중 하나를 선택했습니다. 예를 들어 CERN에서 양자 무작위성을 다루는 충돌기(..)의 결과를 분석하는 데 사용됩니다.

Pts 흥미로운 infa.) CERN XGBoost 우연히 발견했습니다.

당연하게도 CERN은 이것이 Large Hadron Collider의 신호를 분류하는 최선의 접근 방식임을 인식했습니다. CERN이 제기한 이 특정 문제는 연간 3페타바이트의 속도로 생성되는 데이터를 처리하고 복잡한 물리적 프로세스에서 매우 드문 신호와 배경 잡음을 효율적으로 구별할 수 있는 확장 가능한 솔루션이 필요했습니다. XGBoost는 가장 유용하고 간단하며 안정적인 솔루션이 되었습니다. (2018년 9월 6일)

__________________________________

CatBoost는 LHC(Large Hadron Collider) 연구 기간 동안 CERN(European Center for Nuclear Research)에서 구현하여 LHCb 검출기의 다양한 부분에서 얻은 정보를 입자에 대한 가장 정확하고 종합적인 지식으로 결합했습니다. 과학자들은 CatBoost를 사용하여 데이터를 결합함으로써 최종 솔루션의 질적 특성을 개선할 수 있었고 CatBoost의 결과는 다른 방법을 사용하여 얻은 결과보다 더 나은 것으로 나타났습니다[6][7].

_____________________________________________________

모두 거의 일대일입니다. 그렇다면 Catboost와 XGBoost 중 어느 것입니까? ) 누가 누구에게서 복사했는지 궁금합니다. ))

 
알렉세이 비아즈미킨 :

미래가 정해져 있지 않고 패턴이 나타났다가 사라지는 것이 정상이지만 반드시 단기적이어야 한다는 사실은 의심스럽다. 내 표본은 추세 전략을 사용하기 때문에 그리 크지 않기 때문에 더 줄이는 것은 무리라고 생각합니다.

그러나 훈련과 관련된 다양한 비율의 훈련 및 테스트 샘플에 대한 훈련의 효과에 대한 실험을 수행하기로 결정했습니다. 단계는 10%가 됩니다. 90%의 시작 부분에서 훈련하고 10%를 테스트한 다음 테스트는 점차적으로 10%씩 증가합니다. 각 버전에는 200개의 모델이 있습니다. 어떤 일이 일어나는지 봅시다. 또 다른 질문은 평균 또는 절대 기준에 따라 이러한 조합을 가장 잘 비교하는 방법입니다. 아이디어가 수락됩니다.

단기 패턴에 따르면 - 10-15분에서 최대 1시간까지 매우 좋은 것을 변경하는 중요한 이벤트의 확률. 특히 중요한 이벤트에 대해 이미 거래를 체결했기 때문에 특히 그렇습니다. 한 시간 이상 동안 - 그곳에서 무슨 일이 일어날지, 적어도 나는 전혀 모릅니다. 이것은 당신을 반대하는 것이 아니라 당신의 의견을 정당화하기 위한 것입니다.)

나는 주제에 대한 내 자신의 수정과 비전을 가지고 당신의 길을 따르기로 결정했습니다. 또한 필요한 모든 예측 변수가 이미 있습니다. XGBoost에서 시도하기로 결정한 동안 CatBoost 도크가 인상적이지 않았거나(XGBoost, IMHO, 더 명확함) 다른 것 같았습니다. 규제가 뭔지 아직 파악하지 못했다. C NS, 거기에서 모든 것을 정상화하기 위해 기절하게 될 것입니다.

 
유리 아사울렌코 :

모두 거의 일대일입니다. 그렇다면 Catboost와 XGBoost 중 어느 것입니까? ) 누가 누구에게서 복사했는지 궁금합니다. ))

그리고 이를 기반으로 모델을 만들어 시장 혼란에 빠뜨리기 전에 이것을 이해하는 것이 좋을 것입니다.

반년 전에 여기에서 CatBoost를 테스트하려고 했는데 XGBoost와 달리 구구단에서도 배울 수 없었던 걸로 기억합니다.

모르겠어, 아마도 이제 그들은 그가 간단한 것을 뽑지 않으면 복잡한 것을 즉시 시도해야한다고 결정했습니다. 그렇지 않으면 정말 멋진 사람일 것입니다.

그리고 이를 판단하기 위해 위에서 제안한 합성 VR을 사용하는 것이 가능할 것이다.

 
이반 네그레쉬니 :

그리고 이를 기반으로 모델을 만들어 시장 혼란에 빠뜨리기 전에 이것을 이해하는 것이 좋을 것입니다.

반년 전에 여기에서 CatBoost를 테스트하려고 했는데 XGBoost와 달리 구구단에서도 배울 수 없었던 걸로 기억합니다.

모르겠어, 아마도 이제 그들은 그가 간단한 것을 뽑지 않으면 복잡한 것을 즉시 시도해야한다고 결정했습니다. 그렇지 않으면 정말 멋진 사람일 것입니다.

그리고 이를 판단하기 위해 위에서 제안한 합성 VR을 사용하는 것이 가능할 것이다.

최소한 XGBoost의 문서가 훨씬 더 좋습니다. CatBoost 에는 Yandex 자체의 재료 외에도 다른 Pt가 거의 없습니다.

 
유리 아사울렌코 :

단기 패턴에 따르면 - 10-15분에서 최대 1시간까지 매우 좋은 것을 변경하는 중요한 이벤트의 확률. 특히 중요한 이벤트에 대해 이미 거래를 체결했기 때문에 특히 그렇습니다. 한 시간 이상 동안 - 그곳에서 무슨 일이 일어날지, 적어도 나는 전혀 모릅니다. 이것은 당신을 반대하는 것이 아니라 당신의 의견을 정당화하기 위한 것입니다.)

이것은 내 전략의 일부로 확률 변동성을 보는 방식이 아닙니다. 모델이 입력하라는 신호를 보낸 경우 지금 바로 (즉, 훈련 중에 얻은 통계에 따라) 유리한 조건이 개발되었지만 내 출구는 TS의 다른 버전에서 다릅니다. TP / SL 또는 SL로만 가능합니다. 결과적으로 예측은 포지션이 마감될 때까지 취소되지 않으며 최대 3시간 동안 유효합니다. 저것들. 정확한 시간이 아니라 x바 전 가격으로 돌아갈 확률, 즉 지역 아파트의 끝을 예측합니다.

그러나 나는 완전히 다른 것, 즉 확인된 패턴이 시간적으로 반복되는 빈도에 대해 썼습니다. 패턴/기호가 3년 동안 만나고 예측 가능한 이벤트로 이어진 경우, 그 작업을 계속할 가능성이 더 커집니다. 4년차, 훈련 시간의 작은 부분에서 드러난 규칙성은 상위 기간의 상황에 대한 설명일 수 있습니다(주간 차트의 추세).

어쨌든 이것들은 나의 이론적 조작이며, 이제 나는 실험 결과를 처리하고 상황이 더 투명해지기를 바랍니다.

유리 아사울렌코 :

나는 주제에 대한 내 자신의 수정과 비전으로 당신의 길을 따르기로 결정했습니다. 또한 필요한 모든 예측 변수가 이미 있습니다. XGBoost에서 시도하기로 결정한 동안 CatBoost 도크가 인상적이지 않았거나(XGBoost, IMHO, 더 명확함) 다른 것 같았습니다. 아직 규제에 문제가 있는지 파악하지 못했습니다. C NS, 거기에서 모든 것을 정상화하기 위해 기절하게 될 것입니다.

Catboost에는 더 많은 설정이 있습니다. XGBoost 아이디어 개발의 연속입니다. 동시에 주요 플러스와 마이너스는 수가 많지 않은 경우 재교육을 방지하는 고정 차원 트리입니다.

가장 순수한 형태의 분류를 위해 정규화할 필요는 없습니다. 그러나 예측자에서 전처리를 수행 하여 값의 범위를 줄이고 범위 자체를 경험적으로 그룹으로 분해합니다. 아마도 이러한 변환이 없으면 결과가 더 나을 것입니다. 확인하지 않았습니다. 한편으로 개발자는 아무 것도 변환 할 필요가 없다고 말하고 다른 한편으로 알고리즘에 따라 숫자를 변환하는 다른 설정이 있으며 별도의 파일에서 분석을 사용할 수 있습니다. 이것은 catbust에 적용되지만 논리는 어디에서나 동일하다고 생각합니다.

 
이반 네그레쉬니 :

그리고 이를 기반으로 모델을 만들어 시장 혼란에 빠뜨리기 전에 이것을 이해하는 것이 좋을 것입니다.

반년 전에 여기에서 CatBoost를 테스트하려고 했는데 XGBoost와 달리 구구단에서도 배울 수 없었던 걸로 기억합니다.

모르겠어, 아마도 이제 그들은 그가 간단한 것을 뽑지 않으면 복잡한 것을 즉시 시도해야한다고 결정했습니다. 그렇지 않으면 정말 멋진 사람일 것입니다.

그리고 이를 판단하기 위해 위에서 제안한 합성 VR을 사용하는 것이 가능할 것이다.

CatBoost 와 XGBoost는 트리 깊이가 다르므로 트리 수를 추가할 때 CatBoost가 작업에 성공적으로 대처한 것으로 기억합니다.

트리를 사용하여 다양한 기능을 검색하는 경우 NN을 사용하여 검색하고 결과를 분류용 예측 변수로 제출하는 것이 좋습니다. 어쨌거나 나는 맨몸으로 가격을 책정하는 것을 지지하지는 않지만, 더 자주 재교육이 필요하긴 하지만 맥심은 이에 성공했다.

 

기능을 설명하는 NN의 능력을 의심하는 사람들을 위해


사유: