트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 131

 

jPrediction 삼항 분류기 10번째 버전 출시

교차 검증은 새 버전에서 구현됩니다.

교차 검증으로 인해 OOS의 일반화 능력은 9번째 버전에 비해 특히 비정상 데이터에서 크게 향상되었습니다. 동시에 9판과 10판에서 모델의 특성으로 발표된 샘플의 다른 부분에 대한 테스트 결과를 바탕으로 한 일반화 능력은 변함이 없다.

변경 사항이 사용자 인터페이스에 영향을 미치지 않았기 때문에 9번째 버전 사용자를 위한 지침은 계속 유효합니다. 최신 버전의 jPrediction 및 해당 소스 코드에 대한 다운로드 링크 는 지침 에서 찾을 수 있습니다.

 

송곳 작가 :
1) 단순히 두 시계열을 절대값으로 비교합니다. 수직 축을 따라 이동 및 스케일 의 사전 정규화가 필요하며 많은 것이 특정 구현에 따라 다릅니다.

2) 예를 들어, 여기 https://www.mql5.com/ru/code/10755 2개의 고정 길이가 비교용으로 사용됩니다.

3) 그리고 그 중 하나는 더 길고 다른 하나는 더 짧을 수 있다는 점은 고려되지 않습니다.

4), 계산량 등을 대폭 줄일 수 있다. DTW 관련 매개변수에 따라 클러스터링에 대해 이야기할 수 있습니다. 두 조각의 "유사성 정도"뿐만 아니라 수평 스케일의 비율도 계산할 수 있습니다.

1) 글쎄, DTW 알고리즘으로 두 행의 유사성을 비교하기 전에 일반 정규화는 자연스럽게 수행됩니다 .. 우리는 가격의 절대 값을 범위, 예를 들어 0에서 1까지 바꿉니다. 무엇을 의미합니까 시프트 및 스케일 정규화? 명확히 해주세요

2) 링크 주셔서 감사합니다, 나는보고 그냥 미쳤습니다. 가볍게 말하면, 나는 저자와 정확히 같은 아이디어를 생각해 냈고, 정확히 같은 연구를했고, 그가 한 것과 똑같은 진화 경로를 거쳤습니다. DTW와의 상관관계, 이미 소름이 돋는 ... 우리는 같은 일을 하고 있었고, 다른 장소에서 다른 시간에 같은 것을 생각하고 있었습니다.

3) 네, 고려하지 않는 것이 맞습니다. 고려하는 것이 맞겠지만, 작성자가 왜 구현하지 않았는지 짐작할 수 있습니다. 사실은 "이를 구현하는 방법"과 같이 더 깊이 생각하기 시작하면 사실입니다. , 그러면 답이 없는 질문이 잔뜩 나옵니다...

결국 이것은 더 이상 수정 사항이 있는 영역에서 DTW와의 유사성을 검색하는 것이 아닙니다. 클러스터링에 있는 내 또는 그의 알고리즘에 있는 기사 작성자인 한 모든 것이 훨씬 더 복잡합니다 ...

여기에 몇 가지 질문이 있습니다

1. 과거 패턴과 현재 가격 패턴의 유사성을 비교하고 유사성을 찾아야 할 뿐만 아니라 현재 패턴과 각 비교와 비교하는 역사적 패턴을 모두 동적으로 확장/축소해야 하는 경우 ?

2. 칼슘 부족을 처리하는 방법. 저는 개인적으로 2구간 고정된 길이에도 DTW에 대한 충분한 전력이 없으며 옵션 (1.)을 사용하면 부하가 수천 배 증가합니다.

4) 어떻게???

 
mytarmails :

1. 계열의 값을 [0, 1] 범위로 가져올 수 있지만 각 요소에서 평균값(MA)을 빼서 상수 성분을 제거하고 각 요소를 표준으로 나누는 것이 좋습니다. 일탈. 기생충과 같은 브라우저는 텍스트의 일부를 파괴했습니다.

3-4. 알고리즘의 본질, 행렬이 채워지는 방법을 살펴보면 많은 것이 분명해질 것입니다. 시작과 끝이 고정된 동일한 길이의 두 세그먼트가 비교됩니다. 우리는 시작 부분만 수정하고 끝 부분을 부동 상태로 만들고 0.5에서 2까지의 스케일 팩터 제약 조건을 알고리즘에 도입할 수 있습니다. 제약 조건이 있는 DTW를 얻습니다. 작업의 결과는 더 이상 하나의 숫자가 아니라 두 개의 숫자가 될 것이며 이것은 우리에게 추가적인 예측 변수를 제공할 것입니다. 계산량을 줄이는 방법 - "특이점"(극단값)을 찾아 서로 당겨서 대부분의 행렬 영역을 버립니다. 자세한 내용 은 링크 를 참조하십시오. Wikipedia 동적 시간 왜곡, 참조 섹션도 참조하십시오.

 
알렉세이 버나코프 :

여러분, 제 새로운 임무:

다음은 .R 형식의 데이터세트입니다. https://drive.google.com/open?id=0B_Au3ANgcG7CcjZVRU9fbUZyUkE

이 세트에는 약 40,000개의 행과 101개의 열이 있습니다. 가장 오른쪽 열은 대상 변수입니다. 왼쪽 - 100개 입력.

처음 20,000개의 관측치에 대해 나머지 100개 열을 기반으로 101번째 열의 값을 예측하는 회귀 모델을 구축하는 것이 좋습니다.

나머지 20,000개 이상의 관찰에서 구성된 모델은 R^2가 0.5보다 나쁘지 않아야 합니다.

그런 다음 데이터 생성 방법을 공개하고 솔루션을 제공합니다.

힌트는 시계열 데이터입니다. 입력은 100개의 판독값이고 예측은 1보다 앞서 있습니다. 이는 가격이나 시세 또는 파생 상품이 아닙니다.

알렉세이

누가 시도 했습니까? 제 동료와 저는 합성곱 신경망을 훈련시키고 싶습니다. 기능 매핑이 진행됩니다. 우리는 희망한다.

방법의 비표준 응용 프로그램 인 것 같습니다. 반면에 우리는 단순히 1차원 "그림"을 입력으로 제시하고 거기에서 인접 "픽셀"과 이들의 다양한 상호 작용을 매핑할 수 있습니다.

 
알렉세이 버나코프 :

누가 시도 했습니까? 제 동료와 저는 합성곱 신경망을 훈련시키고 싶습니다 . 기능 매핑이 있습니다. 우리는 희망한다.

방법의 비표준 응용 프로그램 인 것 같습니다. 반면에 우리는 단순히 1차원 "그림"을 입력으로 제시하고 거기에서 인접 "픽셀"과 이들의 다양한 상호 작용을 매핑할 수 있습니다.

그래서 동료가 시도, 또는 약하게?
 
알렉세이 버나코프 :

제 동료와 저는 합성곱 신경망을 훈련시키고 싶습니다. 기능 매핑이 있습니다. 우리는 희망한다.

흥미롭다, 기대된다...
 
mytarmailS :


1. 과거 패턴과 현재 가격 패턴의 유사성을 비교하고 유사성을 찾아야 할 뿐만 아니라 현재 패턴과 각 비교와 비교하는 역사적 패턴을 모두 동적으로 확장/축소해야 하는 경우 ?


왜 그런 필요가 있습니까? 패턴이 역사적으로 유추를 가지고 있다면 지속 시간도 일치해야 합니다. 적어도 나는 패턴 검색을 할 때 그에 상응하는 영역을 찾고 있었습니다.
 
유리 타셰키 :
왜 그런 필요가 있습니까? 패턴이 역사적으로 유추를 가지고 있다면 지속 시간도 일치해야 합니다. 적어도 나는 패턴 검색을 할 때 그에 상응하는 영역을 찾고 있었습니다.

1) 글쎄, 적어도 시장에 절대적으로 동일한 패턴이 없기 때문에,

2) 그리고 dtw가 그런 좋은 기회를 주기 때문에

3) 동일한 크기의 패턴을 검색한 결과가 당신을 포함하여 우리 모두에게 친숙하기 때문에 ... 아니면 나를 놀라게 하시겠습니까? :)

 
이벤트 :
그래서 동료가 시도, 또는 약하게?
그리고 당신의 말의 의미는 무엇입니까, 승객? 당신은 시도하고 싶지 않거나 당신의 방식대로. 나는 나 자신의 일을 하고 있고 관심이 있다.
 
mytarmailS :
흥미롭다, 기대된다...
또 무슨 말을 할 수 있겠습니까? 결과가 기대되시나요?
사유: