트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3049

 
Aleksey Nikolayev #:

트레이딩 업무에는 RL이라는 개념이 중복되지 않나요? 에이전트에 대한 환경의 영향은 있지만 에이전트가 환경에 미치는 영향도 있나요? 이 두 번째 영향력을 인위적으로 도입할 수는 있지만 의미가 있을까요?

이 기사의 두 가지 (또는 세 가지) 아이디어는 우리에게 전혀 불필요하지 않습니다. 손실 함수는 우리가 필요로하는 것을 정확히 반영해야하며 매끄럽고 단조로워 야 한다는 것입니다. 우리의 경우에는 수익이어야 하며 모델 매개변수에 따라 부드럽고 단조롭게 의존해야 합니다.

수익의 일부 아날로그의 부드러움은 아마도 (예를 들어 커널 평활화와 같은 방법으로) 어떻게 든 달성 할 수 있습니다. 하지만 단조로움에 대해서는 매우 의심스럽습니다.

거래의 재무적 결과의 기본은 가격 변동, 즉 고정되지 않은 무작위 프로세스입니다.

우리는 몇 가지 트릭을 통해 비고정적 랜덤 프로세스를 부드럽고 단조로운 프로세스로 바꾸려고 하는 것일까요? 어쩌면 우리는 넓게 걷고 있는 것일까요? 특히 훈련 세트 밖에서 분류 오류를 20%(!) 미만으로 줄이는 것은 매우 어렵다는 점을 고려하면 더욱 그렇습니다. 분류 오류를 줄이는 작업부터 시작해야 할까요?

 

글을 읽어보세요.

이 기사가 우리에게 어떤 도움이 될까요?

완전히 모호합니다.

그 이유는 다음과 같습니다.

인공지능(MO)이 미래를 예측한다는 논문은 기억이 나지 않습니다. 그들은 모델에게 손으로 쓴 편지를 쓰도록 가르칩니다. 그런 다음 이 손글씨를 인식하려고 합니다. 하지만 이 모델은 원칙적으로 다음에 어떤 글자가 쓰일지 예측하도록 학습되지 않습니다.

이것이 바로 우리가 가진 문제입니다.

우리는 MO(캔들스틱 조합에서 했던 것과 동일한 작업)를 사용하여 예측 변수에서 정확한 예측을 제공할 몇 가지 패턴을 찾으려고 노력하고 있습니다. 그러나 발견된 패턴이 미래에 올바른 예측을 제공한다는 보장은 없습니다. "올바른" 패턴은 오류를, "잘못된" 패턴은 올바른 것을 예측할 수 있습니다. 그 이유는 분류 알고리즘 자체에 있으며, 분류 알고리즘은 클래스의 값이 아니라 클래스의 유효성을 제공합니다. 우리는 0.5라는 가장 원시적인 정규화를 사용하여 클래스를 나눕니다. 그리고 훈련 중에 "올바른" 패턴의 확률이 0.5000001이라면 이 확률을 클래스 값으로 사용하는 이유는 무엇일까요?

이를 피하기 위해 우리는 채소밭을 가꾸기 시작하지만 패턴을 찾는 예측자의 값은 고정되어 있지 않거나 의사 고정되어 있지 않으며 가격과 먼 관계가 있습니다!

 
Aleksey Nikolayev #:

에이전트에 대한 환경의 영향이 있지만 에이전트가 환경에 미치는 영향도 있을까요? 아마도 이 두 번째 영향을 인위적으로 도입할 수 있을 것 같지만, 이것이 합리적일까요?

그것은 모두 당면한 작업에 달려 있습니다.

압도적 다수가 그렇듯이 이미 만들어진 목표를 예측한다면 환경에 영향을 미치지 않으므로 RL이 필요하지 않습니다.

그러나 예를 들어 포지션 관리, 정지, 테이크아웃과 같은 작업이라면...

자산 관리는 우리(에이전트)가 관리하는 환경입니다.


에이전트는 주문을 할 것인지 말 것인지를 결정합니다.

어떤 가격에

언제 인출하거나 이동할지,

현재 포지션의 손실이 n 핍을 초과하면 어떻게 할 것인가,

연속으로 5개의 손실이 발생하면 어떻게 할 것인가?


이것은 분류에 대한 원시적 인 업 / 다운이 아니라 많은 상태 (출력)가있는 완전히 다른 수준의 작업입니다.


더 간단하게 설명하자면, 우리는 시장을 관리할 수는 없지만 포지션과 리스크는 관리할 수 있기 때문입니다!


알렉세이 니콜라예프 #:

일부 아날로그 수익의 평활화는 아마도 커널 스무딩과 같은 방법으로 어떻게 든 달성 할 수 있습니다 (예 : 커널 스무딩). 하지만 단조로움에 대해서는 매우 의심스럽습니다.

"부드러움"이 무엇을 의미하는지, 왜 "부드러움"이 필요한지 잘 모르겠습니다....

다중 기준 최적화를 사용하여 이에 대한 최상의 솔루션을 찾을 수 있습니다.

 
mytarmailS #:

모든 것은 당면한 작업에 따라 다릅니다.

대다수의 사람들처럼 기성품 목표를 예측하면 환경에 영향을 미치지 않으며 RL 자체가 필요하지 않습니다....

그러나 예를 들어 위치 관리, 정지, 테이크 아웃 작업과 같은 경우 ...

자산 관리는 우리 (에이전트)가 관리하는 환경입니다 ...


에이전트는 주문을 하거나 하지 않기로 결정합니다.

어떤 가격에,

언제 꺼내거나 옮길지 결정합니다,

그리고 현재 포지션의 현재 손실이 N 포인트를 초과하면 어떻게 할 것인가,

그리고 연속으로 다섯 번을 잃으면 어떻게 할 것인지...


이것은 분류에 대한 원시적인 업/다운이 아니라 많은 상태(출력)가 있는 완전히 다른 수준의 작업이라는 것을 알 수 있습니다.


더 간단히 말하자면, 시장을 관리할 수는 없지만 포지션과 리스크는 관리할 수 있습니다.


"부드러움"에 무엇이 들어가며 왜 필요한지 잘 모르겠습니다....

검색에 다중 기준 최적화를 적용할 수 있을 것 같습니다.

에이전트를 평균화할 수 있습니다.
 
Valeriy Yastremskiy #:
상담원이 평균을 낼 수 있습니다.
https://www.mql5.com/ru/code/22915
 
СанСаныч Фоменко #:

거래의 재무적 결과의 기초는 고정되지 않은 무작위 프로세스인 가격 변동입니다.

우리는 몇 가지 트릭을 통해 비고정적 랜덤 프로세스를 부드럽고 단조로운 프로세스로 바꾸려고 하는 것일까요? 어쩌면 우리는 넓게 걷고 있는 것일까요? 특히 훈련 세트 밖에서 분류 오류를 20%(!) 미만으로 줄이는 것은 매우 어렵다는 점을 고려하면 더욱 그렇습니다. 분류 오류를 줄이는 작업부터 시작해야 할까요?

저는 모델 학습을 통해 최소화되는 손실 함수의 속성에 대해 이야기하고 있었습니다. 더 정확하게는 이상적인 형태에 대해 이야기한 것입니다.

 
mytarmailS #:

부드러움에 무엇이 들어가는지, 부드러움이 왜 필요한지 잘 모르겠습니다.

최적화의 기본입니다. 부드러움은 그라데이션을 통해 최적화를 가능하게 합니다. 그렇지 않으면 무차별 대입 알고리즘만 남습니다.

 
Aleksey Nikolayev #:

최적화의 기본은 다음과 같습니다.

예, 저도 알고 있지만 최근에는 자본 곡선 자체의 매끄러움에 대해 이야기하고 있었기 때문에 이러한 논의에 대해 자세히 알아보지 않았기 때문에 무슨 뜻인지 물어보는 것입니다.

 

주제에서 벗어났습니다.

역대 최고의 거래 중 하나입니다.

gold

위험/보상 24분의 1

 
mytarmailS #:

오프토픽...

역대 최고의 거래 중 하나입니다.

gold

위험/보상 24분의 1

"수체"는 훌륭한 상품입니다)
사유: