트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2586

 
mytarmailS # :

))))

나는 모든 것을 합친다)

힌트를 드리겠습니다. 일반화의 관점에서 보면 아무것도 바뀌지 않습니다.
 
막심 드미트리예프스키 # :
Logloss는 내가 이해하는 한 기능과 대상 간의 상호 정보의 양을 보여줍니다. 이것은 의존의 형태에 대한 설명 없이 가장 객관적인 f-I입니다. 모델은 이러한 정보의 손실을 최소화하도록 훈련되며, 특히 이러한 방식으로 작업을 부스팅합니다. 사용자 정의 항목 위에 무엇을 추가합니까? 교육 중에 중지됩니다.

로그 손실은 이항 분포에 대한 최대 가능도 원칙을 기반으로 파생된 것 같습니다. Mathstat에서 최대 가능성 원칙은 M-추정의 형태로 확장되고 일반화되며, 이는 실험에 대한 이론적 정당성이 될 수 있습니다(물론 성공을 보장하지는 않음).

 
Alexey Nikolaev # :

로그 손실은 이항 분포에 대한 최대 가능도 원칙에 따라 파생된 것 같습니다. Mathstat에서 최대 가능성 원칙은 M-추정의 형태로 확장되고 일반화되며, 이는 실험에 대한 이론적 정당성이 될 수 있습니다(물론 성공을 보장하지는 않음).

아마도 교차 엔트로피와 혼동될 수 있지만 다중 클래스에 더 자주 사용됩니다. 어쨌든 내 기능을 통해 추가 평가를 수행하는 데 문제가 없다고 생각하지만 이미 순수하게 대차 대조표에서
 
막심 드미트리예프스키 # :
아마도 교차 엔트로피와 혼동될 수 있지만 다중 클래스에 더 자주 사용됩니다.

logloss minimum의 이론적인 값이 엔트로피와 일치하는 것이 있는 것 같습니다.

막심 드미트리예프스키 # :
어쨌든 내 기능을 통해 추가 평가를 수행하는 데 문제가 없다고 생각하지만 이미 순수하게 대차 대조표에서

아마 그렇게 될 것입니다. 주제에 대한 기사가 많이 없다는 것만 큼 당황 스럽습니다) 그들은 아마도 낚시터를 공개하는 것을 두려워 할 것입니다)

 
Alexey Nikolaev # :

logloss minimum의 이론적인 값이 엔트로피와 일치하는 것이 있는 것 같습니다.

아마 그렇게 될 것입니다. 주제에 대한 기사가 많이 없다는 것만 큼 당황 스럽습니다) 그들은 아마도 낚시터를 공개하는 것을 두려워 할 것입니다)

Prado는 자신의 기사 웹사이트에서 이 주제에 대해 흥미로운 내용을 많이 가지고 있습니다. 백버너에 올려놓았지만 나중에 즐겁게 읽어보겠습니다. 가장 건전한 작가 중 한 명)
 
막심 드미트리예프스키 # :
Prado는 자신의 기사 웹사이트에서 이 주제에 대해 흥미로운 내용을 많이 가지고 있습니다. 백버너에 올려놓았지만 나중에 즐겁게 읽어보겠습니다. 가장 건전한 작가 중 한 명)

예, 당신은 그의 기사를 봐야합니다. 하지만 그는 꽤 많이 가지고 있습니다.)

표준 메트릭과 사용자 정의 메트릭을 결합하는 당신의 아이디어와 관련하여 나는 교차 엔트로피에 따라 구축되고 오류 빈도에 따라 가지 치기가 수행되는 나무로 아이디어를 기억했습니다. 아마도 빈도 대신 측정 항목을 시도 할 수 있습니다.

 
Renat Fatkhullin # :
다음 정보를 공유할 수 있습니다.
1) 파이썬 MT5 라이브러리를 사용합니까?
2) MT5 외부 또는 내부에서 사용
3) 라이브러리에 어떤 기능이 빠져 있습니까? 지표에 대한 액세스?

빠른 매트릭스 작업을 추가하여 MQL5 업그레이드를 준비하고 있습니다. 이렇게 하면 정기적인 대규모 계산이 가능합니다.

다음으로 분석 패키지용 커넥터를 개발하고 표준 WinML 통합을 소개합니다.

1. 가끔.

2. 내부, 외부.

삼.

3.1. 이벤트 구독. MQL5에서와 동일한 이벤트가 특정 핸들러 메소드를 트리거하도록 합니다.

3.2. 백테스터에서 실행할 수 있도록 파이썬으로 전략을 작성하는 기능(응용 프로그램 유형으로).

3.3. 일부 미리 만들어진 MQL5-Python 상호 작용 메커니즘. Python은 mt5와 양방향으로 상호 작용할 수 있고 MQL5는 양방향으로 상호 작용할 수 있으며 MQL5는 터미널이 있는 단일 장치이며

거래 기능 등으로 작업하지만 데이터 과학 분야에서 업계 최고의 솔루션으로 편리하게 작업하는 방법을 모릅니다. Python은 pandas, numpy, TensorFlow, Keras, PyTorch 등 데이터 과학의 산업 표준이지만 플랫폼에 대한 "상인" 통합은 훨씬 적습니다. 이 두 가지 힘을 통합하기 위한 표준 도구를 갖는 것이 멋질 것입니다. 예를 들어 mt5에 Python 스크립트를 걸고 스크립트에 모델이 대기 중이거나, 스팀 또는 모델 풀, 데이터 전처리와 관련된 기능 등을 기다리고 있습니다. 그리고 필요한 경우 목발 없이 신속하게 이 스크립트에서 ML 기능에 액세스하는 전략인 MQL5 애플리케이션이 있습니다.

 

Quantstrat 전략을 백테스트하기 위해 R 패키지를 사용하는 사람이 있습니까?

그는 속도면에서 어떻습니까?

 
Alexey Nikolaev # :

솔직히 많이 이해가 되지 않았습니다. 문제는 시간이 지남에 따라 확률이 변하는가 하는 것입니다. 이를 탐색하기 위해 시간 경과에 따라 로지스틱 회귀를 실행하고 0이 아닌 계수의 중요성을 테스트할 수 있습니다.

시간 외에 확률에 영향을 미치는 다른 요인을 연구하면 로지스틱 회귀에 추가하려고 시도할 수도 있습니다.

도서관 # :

또는 예측 변수를 하나 더 만드는 것이 더 쉬울 수도 있습니다. 즉, 현재 데이터 라인에서 데이터 라인의 거리입니다. 숲 자체는 8개월보다 오래된 데이터가 현재 예측에 적합하지 않다고 계산할 수 있습니다. 그리고 간단한 분할이 있을 것입니다: 최대 8개월(더 나은 잎사귀 포함) 및 8개월 후 더 나쁜 잎사귀.
글쎄, 기차에서 그들은 모두 확실히 잘 배운다. 테스트/교차 검증에서 확인이 필요합니다. 하지만 어떻게? 불명. 이것은 예측 변수의 중요성이 아니라 분할의 중요성입니다.

오늘 나는 현재 막대로부터의 거리 예측기를 추가했습니다. 숫자일 수도 있고 시간일 수도 있습니다. 나는 시간을 했다.

나는 실험적으로 1개월의 훈련 데이터 세트에 대한 히스토리의 길이가 가장 좋은 포워드를 제공한다는 것을 발견했습니다.

데이터의 첫 번째 행에서 거리 예측자를 추가하는 것이 도움이 될 것이라는 가정은 잘못된 것으로 판명되었습니다. 실제로 포워드는 1개월 데이터와 2, 10 데이터로 악화되었습니다.

2개월 길이의 데이터를 제출했고 트리가 1개월 분할을 발견했으며 분기 중 하나가 실험적으로 선택된 1개월 기록 길이와 동일한 데이터에 대해 훈련되었다고 가정해 보겠습니다. 그리고 다른 달도 데이터에서 배웠습니다. 그리고 나는 나쁘게가 아니라 잘 배웠습니다(처음에는 그렇게 생각했습니다). 그는 공격수에게 좋지 않을 것이지만 그는 기차에서 배울 것입니다. 결과적으로 모델은 두 달 동안의 결과를 평균화하고 포워드는 1개월 동안만 훈련한 경우보다 더 나쁜 것으로 판명되었습니다.

결론: 글로벌 시간 또는 라인 번호를 제공할 수 없습니다. 순환 시간 옵션: 요일의 숫자, 시, 분을 유용하게 사용할 수 있습니다. 확인이 필요합니다.
각 대상(및/또는 예측 변수 집합)에 대한 교육 기록의 길이를 선택/최적화해야 합니다.

 

"순환 시간 옵션: 요일 , 시, 분이 유용할 수 있습니다. 확인해야 합니다."를 선택했습니다.

분은 거의 효과가 없으며 변경 사항은 0.5% 이하입니다.
시간과 요일이 영향을 받습니다. 변화는 약 3-5%입니다.

저는 동시에 2개의 모델을 만듭니다: 1개는 구매, 2개는 판매합니다.
구매 모델은 시간이 지남에 따라 4-5% 더 잘 작동하고 판매 모델은 시간이 지나면 4-5% 더 잘 작동합니다. 5%처럼 일정에 따라 판매되고 다른 원칙에 따라 구매됩니다.

사유: