트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 255

 
mytarmailS :

1. 왜 수동으로 정규화합니까? scale()이 있습니다

2. -1과 1이 상관관계가 좋은 이유는 무엇입니까? 1이 좋은 경우에만 -1은 매우 나쁨, 아이디어를 올바르게 이해하면 -1은 동일한 역 상관 관계

3. 학습된 모델의 오류를 슬라이딩 창에서 모니터링하려고 시도했으며 적합하지 않은 경우 모델을 다시 학습하고 어떻게되는지 확인하십시오.

4. 모든 것이 제대로 작동하지 않는 이유, 시장이 고정되어 있지 않은 이유, 기능 형성을 위한 다른 개념을 개발해야 하는 이유, 논리적 규칙의 패러다임으로 완전히 이동할 수 있는 이유 숫자에서 거의 완전히 벗어나거나 스펙트럼 분석을 연구)) )))

1) 나는 여전히 scale()을 할 수 없었습니다. 그것은 잘못된 위치에서 크기를 조정하고 중앙에 위치합니다. 이상적으로는 전처리를 위해 캐럿 패키지를 사용하는 것이 더 좋으며 모든 것을 아름답게 축척/중앙에 배치하지만 다른 패키지를 사용하는 것은 이러한 간단한 예에서 너무 번거로울 것입니다.

2) 상관 관계가 0에 가깝다는 것은 부재를 의미하며 이것이 최악의 옵션입니다. 이 경우 테스트의 이익은 새 데이터의 잠재적 이익에 대해 전혀 말하지 않습니다.
-1은 훈련의 높은 정확도가 새로운 데이터에 대해 일관되게 좋지 않은 결과를 줄 때입니다. 그러나 동시에 훈련의 낮은 결과는 새로운 데이터에 대한 더 나은 결과를 의미합니다 :) 이것은 모델이 데이터에 매우 쉽게 조정되고 다시 훈련되고 훈련 결과가 낮으면 단순히 데이터를 기억하는 시간, 그리고 플러스에서 약간의 기적에 의해 거래. 예를 들어 훈련 데이터의 정확도는 0.9에서 1 사이일 수 있으며, 이 경우 0.9는 "낮음"이 되고 새 데이터의 정확도는 0.5에서 0.6 사이가 됩니다. 여기서 0.6은 "높음" 결과가 됩니다. 저것들. 더 나쁜 결과를 가진 모델은 재학습되지 않고 더 나은 일반화 논리를 가지며 결과적으로 새 데이터에 대한 결과도 더 좋습니다.
말로는 다 아름답지만 실제로는 안정적인 음의 상관관계를 본 적이 없습니다. +1 방향으로 가는 것이 더 편리하고 쉽습니다.

3) 모델이 나에게 적합하지 않다는 것을 이해할 때까지 - 시간이 지나면 너무 많이 병합되어 일반 모델이 작동하지 않을 것입니다. 데모 계정 에서 먼저 새 모델을 거래할 수 있지만 모델이 수익성을 보여주고 실제 거래에 적용할 때쯤이면 구식이 될 것입니다. 시도하지 않았습니다. 전체 학습 알고리즘이 작동하고 지속적으로 수익성 있는 모델을 제공하는지 미리 확인하고 내가 신뢰하는 거래를 실제로 설정하겠습니다.
모델 훈련 알고리즘이 적합하다면 새 데이터로 이전 작업 모델을 다시 훈련하는 것이 매우 좋으며 매번 처음부터 모델을 만드는 것보다 빠릅니다.

4) 피처 엔지니어링이 좋다. 예를 들어, 나는 베어 가격이 아닌 mt5의 지표를 사용합니다.

 
트레이더 박사 :
그리고 당신의 좋은 모델은 새로운 실제 데이터에서 촛불 궤적의 색상을 얼마나 정확하게 예측합니까? 당신은 일일 상인입니까?
 
mytarmailS :
그리고 당신의 좋은 모델은 새로운 실제 데이터에서 촛불 궤적의 색상을 얼마나 정확하게 예측합니까? 당신은 일일 상인입니까?

나는 H1이 있고 목표는 다음 촛불의 색입니다. 예측의 정확도는 55% -60%에 불과하지만 이 정도면 충분합니다. 추세에서도 가격은 항상 오르지 않고 다음 막대에서 끊임없이 위아래로 움츠러들기 때문에 이러한 트위치는 정확도를 눈에 띄게 손상시킵니다. 가장 중요한 것은 모델 자체가 흔들리지 않고 거래에 들어갔기 때문에 추세가 끝날 때까지 그 자리에 있을 것이라는 것입니다.

 
트레이더 박사 :

다음 막대에서 지속적으로 위아래로 경련하므로 이러한 경련은 정확도를 눈에 띄게 손상시킵니다. 가장 중요한 것은 모델 자체가 흔들리지 않고 거래에 들어갔기 때문에 추세가 끝날 때까지 그 자리에 있을 것이라는 것입니다.

어떻게든 대상을 부드럽게 할 수 있습니까?
 
mytarmailS :

시장을 이해하고 있다고 생각하기 시작할 때의 그 느낌...

다음 버거가 왔을 때의 그 느낌 ((:)
 

매우 흥미로운 비디오.... 기능 선택, 알고리즘 및 시장에 대한 약간의 정보

https://www.youtube.com/watch?v=R3CMqrrIWOk

 
mytarmailS :

매우 흥미로운 비디오.... 기능 선택, 알고리즘 및 시장에 대한 약간의 정보

https://www.youtube.com/watch?v=R3CMqrrIWOk

정말 흥미로운. 특히 "유가를 예측하기 시작하면 아마 저를 죽일 것입니다"와 같은 시장에 대해 꽤 많이 언급된 것은 유감입니다.

비디오의 처음 30분 - 여기 Alex가 주제에 대해 썼습니다. R 코드도 포함되었습니다. 지금은 찾지 못했습니다. 처음 수십 페이지를 넘겨야 하고 메시지에 Habr이 이에 대한 기사로 연결되는 링크가 있었습니다.
불행히도, Forex에 대한 예측 변수를 선택하는 이 방법은 저에게 도움이 되지 않았고, 모든 예측 변수가 너무 정보가 없었습니다. 이 알고리즘은 더 고정된 데이터에 적합한 것 같습니다. 또는 더 많은 새로운 예측 변수가 필요합니다.

 

여러분, m1[1000,1000] m2[1000,1000] 등과 같은 배열을 사용하여 입력에서 작동하는 신경망의 예를 누군가에게 알려주십시오. 그렇다면 어리석은 점에 대해 사과드립니다.

나는 아직 뉴런과 함께 일한 적이 없습니다, 나는 연습하고 싶습니다. 나는 매개 변수가 어떻게 설정되는지 정말로 이해하지 못합니다. 나는 매우 감사할 것입니다.

아마도 누군가가 예측자 수정 방법을 고려했을 것입니다.

 
Top2n :

m1[1000,1000] m2[1000,1000] 등과 같은 배열이 있는 입력에서

네트워크에 각각 1000개의 훈련 예제와 1000개의 입력이 있는 두 개의 배열을 네트워크에 공급하시겠습니까? 이것은 작동하지 않으며 하나로 결합해야합니다. 아니면 다른 것을 말씀하시는 건가요?
 
트레이더 박사 :
네트워크에 각각 1000개의 훈련 예제와 1000개의 입력이 있는 두 개의 배열을 네트워크에 공급하시겠습니까? 이것은 작동하지 않으며 하나로 결합해야합니다. 아니면 다른 것을 말씀하시는 건가요?

각 배열[][]은 단일 품질 정보의 집합입니다. 즉, 각 입력에 대해 별도의 배열[][]입니다. 저는 많은 어레이를 제출하고 싶습니다. 4개는 지금 준비되어 있습니다. 저는 계획에서 더 많이 만들 것입니다. 각 어레이는 가격 상태를 설명합니다. 다른 각도에서 다음과 같이 나타납니다.

각 배열은 1000개의 행과 1000개의 열을 포함합니다. 음, 일반적으로 저는 3차원 배열을 가지고 있습니다. K번째 차원은 새로운 2차원입니다.