트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1917

 
mytarmailS :

예, 모든 것이 다른 사람과 같다고 가정합니다.) 바로 그 아이디어는 기능을 수정하고, 모델을 훈련하고, 새 데이터에서 어떤 일이 일어나는지 확인하는 것입니다.


그리고 기존 모델로 어떻게 작업합니까? 우리는 x1, x2, x3, .... x20을 제공하면 됩니다.


내가 마지막 스크립트에서 한 것은 - 0.82

31개의 지표를 모두 예측 변수로 사용했습니다.

그런 다음 나는 그들의 예측을 2차 예측 변수로 취한 다음 예측에서 예측을 하는 식으로 오류가 떨어질 때까지 11번 반복했는데 0.7이 아닌 0.82로 밝혀졌습니다.


그러나 실제 거래 시뮬레이션에서 비슷한 컷을 얻지 못했습니다. 어디서 망했는지 모르겠어

아이디어는 절대적으로 정확하여 본질적으로 예측자를 생성할 수 있지만 두 가지 뉘앙스가 있습니다.

1. 결과의 재현성 - 말하자면 추가 변환이 필요합니다. 처리 후 무엇을 얻습니까? - 새 테이블은 무엇입니까?

2. 샘플링 기간의 패턴을 확인하는 것이 필요합니다. 올바른 분류가 다른 영역에 있고 이것이 제가 알고 있는 어떤 훈련 모델에도 구현되지 않도록 하는 것인데, 이는 매우 나쁩니다.

내 예측 변수의 주요 부분은 기본적으로 범주형 분위수이므로 && 이전에 결합된 통계적으로 유의한 예측 변수 범위를 통해 결합하여 예측 변수를 생성하려고 합니다.

오류와 관련하여 이전에 알려지지 않은 샘플에 속했습니까, 아니면 테스트 샘플에 속했습니까? 새 규칙을 생성할 때 스크립트에서 테스트 샘플의 판독값을 고려했을 수 있습니까?

많은 시간이 흘렀습니다. 결국 방법이 작동합니까?

 
mytarmailS :

나는 NN 훈련에 대한 일반적인 데이터가 3d)에서 어떻게 보이는지 보기로 결정했습니다))

데이터는 31개의 지표, 목표는 지그재그

pca, t-sne, umap의 세 가지 알고리즘을 사용하여 차원을 3차원으로 축소했습니다 (마지막 두 개는 가장 현대적인 것으로 간주됨).


일반적으로 무엇입니까 - https://en.wikipedia.org/wiki/Dimensionality_reduction

도움이 되는 방법 - https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%BA%D0%BB%D1%8F%D1%82%D0%B8% D0%B5_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8


따라서 31개 지표의 데이터는 목표 지그재그, 첫 번째는 PCA

나 같은 바보들도 자신의 선택에 따라 아름다운 사진을 볼 수 있도록 스크립트를 게시 할 수 있습니까?

 
mytarmailS :

저는 여기서 토론이 아니라 대상 기능에 대해 토론하기 위한 스레드를 만들고, 오히려 서로 다른 유형의 대상 및 통계, 작동하는 것과 작동하지 않는 것에 대한 데이터베이스를 만들겠다는 아이디어를 가지고 있었습니다.

누군가 필요하다고 생각합니까?

아이디어는 좋지만 아이디어와는 별개로 MQL에서 열린 코드는 그곳에서 유용할 것입니다. 결과는 라이브러리가 될 것입니다.

코드가 아니라면 최소한 단어로 된 알고리즘은 재생산을 위한 것입니다.


1. 일중 데이터(회귀)에서 당일 고가 예측

지난 날 또는 하루 종일의 내부 데이터에 따르면 - 후자의 경우 하루가 끝날 때까지 오류가 단순히 감소합니다.

특정 시점에 샘플이 작을 것입니다.


2. 어느 수준의 분석에서 초과 변동성이 있을 것인가(회귀 + 분류)

초변동성이 뭔지도 모르겠는데 그냥 트렌드에 불과한 걸까, 아니면 그냥 그런 게 아닌 것 같아?

레벨이 많으면 클래스도 많아지며 이는 이진 분류보다 오류가 훨씬 더 높음을 의미합니다.

여기서 레벨별로 자신만의 모델만 사용한다면...


2. 일중 데이터를 사용 하여 일별 반전이 언제일지 예측(분류)

사실, 그것은 높은 가격을 예측하는 것과 유사합니다 - 동일한 문제.


3. 첫 번째 촛불이 검은색이면 세 번째 촛불은 흰색이 될까요? (분류)

기본적으로 구현되어야 하는 것 같습니다. 시도해 볼 수 있습니다.


4. 지지선과 저항선을 표시하고 어느 수준에서 반등/하락 가능성이 있는지 예측(분류)

두 번째 문장과 같은 문제.


5. 각 특정 순간에 지표에 대한 최적의 기간을 예측합니다. 시간(회귀)

물론 지표를 사용하는 목적을 뒤집는 것도 흥미롭다.

 
알렉세이 비아즈미킨 :

많은 시간이 흘렀습니다. 결국 방법이 작동합니까?

예, 나 자신도 이해하지 못했습니다. 예와 같이 비슷한 것을 엉키게 해보십시오.


x1, x2, x3 기호와 대상 "Y"가 있습니다.

특징을 기반으로 예측

"Y_x1[i+1]" ~ x1+x2+x3

"Y_x2[i+1]" ~ x1+x2+x3

"Y_x3[i+1]" ~ x1+x2+x3

그리고 모델에 추가

x1, x2, x3 "Y_x1" + "Y_x2" + "Y_x2" 및 대상 "Y"

이제 6개의 표시가 있습니다.


알렉세이 비아즈미킨 :

나 같은 바보들도 자신의 선택에 따라 아름다운 사진을 볼 수 있도록 스크립트를 게시 할 수 있습니까?

네 이미 지웠어요 시각화 하기 좋고 탐닉 하기엔 .. 그래서 xs 는 아예 필요 .. 필요 하면 다시 쓸 수 있는데 필요한가요 ?


알렉세이 비아즈미킨 :

아이디어는 좋지만 아이디어와는 별개로 MQL에서 열린 코드는 그곳에서 유용할 것입니다. 결과는 라이브러리가 될 것입니다.

코드가 아니라면 최소한 단어로 된 알고리즘은 재생산을 위한 것입니다.

예, 저는 예측할 수 있는 방법이 여전히 수백만 개 있다는 것을 보여주기 위해 이 모든 옵션을 썼습니다. 그렇지 않으면 모두가 하나 또는 이진(위/아래) 또는 증분에 고정되어 있습니다. 그게 전부입니다!! 이미 아프다 ... 둘 다 작동하지 않지만 모두 강간)

 
mytarmails :

예, 나 자신도 이해하지 못했습니다. 예와 같이 비슷한 것을 엉키게 해보십시오.


x1, x2, x3 기호와 대상 "Y"가 있습니다.

특징을 기반으로 예측

"Y_x1[i+1]" ~ x1+x2+x3

"Y_x2[i+1]" ~ x1+x2+x3

"Y_x3[i+1]" ~ x1+x2+x3

그리고 모델에 추가

x1, x2, x3 "Y_x1" + "Y_x2" + "Y_x2" 및 대상 "Y"

이제 6개의 표시가 있습니다.

네, 제 나름의 방법으로 해보겠지만 어쨌든 아주 천천히 하게 될 것 같습니다. 많은 조합이 있습니다.

R에서 얼마나 많은 작업이 수행되고 샘플 크기는 얼마입니까?

mytarmails :

네, 이미 지웠습니다. 시각화에 멋져 탐닉 ... 그래서 xs는 전혀 필요하지 않습니다 .. 필요하면 다시 쓸 수 있습니다, 필요한가요?

보는 것이 흥미로울 것입니다. 라이브러리를 설치하는 방법과 몇 가지를 더 작성하십시오. 글쎄, 스크립트에 더 많은 설명이 있습니다. 대상에서 사용자 정의 가능한 구분 기호 및 열 선택 및 제외 열 :)

그건 그렇고, 한주기에서 다른 열 그룹을 버리고 이러한 시각적 모델이 어떻게 변경되는지 확인한 다음 이미지 저장을 구현해야합니다 ...

mytarmails :

예, 저는 예측할 수 있는 방법이 여전히 수백만 개 있다는 것을 보여주기 위해 이 모든 옵션을 썼습니다. 그렇지 않으면 모두가 하나 또는 이진(위/아래) 또는 증분에 고정되어 있습니다. 그게 전부입니다!! 이미 아프다 ... 둘 다 작동하지 않지만 모두 강간)

수백만인가...

내 방법을 시도하십시오 - 1 또는 -1 - ZZ 벡터와 반대인 Donchian 채널이 벡터 변경점을 넘었습니다. 우리는 벡터가 변경되면 반대 채널을 따라 트롤을 입력하고 0 - 시장에 진입 하지 않음 - 평면을 입력합니다. 클래스 1 및 -1의 40% 분류 정확도로 수익이 발생합니다.

간단한 것들 중에서, 나는 1k3 포인트 또는 주어진 하나의 위험으로 올바른 항목을 표시하는 원시 목표를 구현하고 싶습니다. 다른 위험을 가진 앙상블은 총체적으로 좋은 결과를 줄 수 있지만 이것은 이론적입니다.

그래서 물론, 우리는 다른 목표에 대해 생각할 필요가 있습니다.

 
알렉세이 비아즈미킨 :

네, 제 나름의 방법으로 해보겠지만 어쨌든 아주 천천히 하게 될 것 같습니다. 많은 조합이 있습니다.

R에서 얼마나 많은 작업이 수행되고 샘플 크기는 얼마입니까?

벡터화로 빨리, 그리고 내가 이미 체커를 작성하여 하나의 막대로 계산했을 때 이미 느렸지만 여전히 모든 것이 매우 수용 가능합니다.

알렉세이 비아즈미킨 :

보는 것이 흥미로울 것입니다. 라이브러리를 설치하는 방법과 몇 가지를 더 작성하십시오. 글쎄, 스크립트에 더 많은 설명이 있습니다. 대상에서 사용자 정의 가능한 구분 기호 및 열 선택 및 제외 열 :)

확인. 귀하의 특성과 대상이 포함된 파일을 r-ku에 업로드할 형식으로 보내주십시오. 모든 것이 즉시 작동하도록 노력할 것입니다.

큰 파일이 아니라 눈당 1000줄

이것은 단지 시각화를 위한 장난감일 뿐임을 명심하십시오. 모델/기능을 확인하려는 경우 테스트에서 오류를 어리석게 보는 것이 10000%가 더 좋습니다)
 
mytarmailS :

벡터화로 빨리, 그리고 내가 이미 체커를 작성하여 하나의 막대로 계산했을 때 이미 느렸지만 여전히 모든 것이 매우 수용 가능합니다.

흠, 흥미롭습니다. 가능하다면 스크립트를 재설정하는 것이 좋습니다. 정말 좋은 생각이 될 수 있습니다. 이제 나는 매우 큰 규모의 새로운 예측 변수 풀을 만들고 있으며 어떻게든 그들 사이의 연결을 찾아야 합니다. 시너지 효과, 아마도 대부분을 버려야 할 것입니다 ...

mytarmailS :

확인. 귀하의 특성과 대상이 포함된 파일을 r-ku에 업로드할 형식으로 보내주십시오. 모든 것이 즉시 작동하도록 노력할 것입니다.

큰 파일이 아니라 눈당 1000줄

문제의 사실은 형식이 변경될 수 있다는 것입니다. 따라서 주석에 인색하지 마십시오. :)

자주 사용하는 옵션을 첨부합니다.

파일:
 
mytarmailS :

시간이 고려되거나 무시됩니까?

최종 결과가 있는 마지막 열뿐만 아니라 무시합니다. 시간은 예측 변수에 포함됩니다.

 
알렉세이 비아즈미킨 :

최종 결과가 있는 마지막 열뿐만 아니라 무시합니다. 시간은 예측 변수에 포함됩니다.

그래 그래 난 이미 봤어

 

대상을 희생시키면서 영상에서 말했듯이 입력 데이터를 변경할 수 있는 방법이 없을 때 변경해야 한다고 생각합니다. 데이터가 수집되고 이를 변경할 방법이 없는 경우. 그렇지 않으면 다양한 입력 변수를 사용하여 표준 대상을 선택하고 이미 입력 데이터를 조사해야 합니다.

목표가 의도적으로 오류를 포함하고 학습 결과를 개선하는 것으로 판명되면 모델도 목표에 따라 오류를 생성한다는 것을 잊지 마십시오. 임호

사유: