트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 48

 
트레이더 박사 :

RNeat로 조금 더 실험을 해보니 일반 신경망과 같은 방식으로 작업하는 것은 불가능하다는 결론에 도달했습니다.

공유해 주셔서 감사합니다. 매우 흥미로운...

홍채로 귀하의 예를 가져와 내 데이터에 맞게 다시 만들었으며 이해하지 못하는 오류가 발생했습니다. 알려주세요. 홍채 외에도 데이터를 대체하기 위해 확실히 시도했는데 일반적인 네트워크와 비교하여 결과가 어땠습니까?

 
분류 모델 평가에 대한 흥미로운 기사 입니다.
 
트레이더 박사 :

RNeat로 조금 더 실험을 해보니 일반 신경망과 같은 방식으로 작업하는 것은 불가능하다는 결론에 도달했습니다.

1) RNeat 훈련은 기존 모델과 달리 원시 데이터를 사용하지 않습니다. 모델은 무작위로 생성되고 개선되며 마지막에만 원본 데이터에 대해 테스트됩니다. 일반적으로 모델은 초기 데이터를 사용하여 논리를 구축한 다음 유효성 검사 세트에서 모델의 논리가 올바른지 아니면 단순히 원본 예제를 암기했는지 확인할 수 있습니다. 다른 것들과 달리 RNeat는 원본 데이터에 대해 알지 못하기 때문에 원본 데이터를 전혀 기억할 수 없으며 모델이 알고 있는 모든 것은 필요한 결과와 원본 데이터에 얼마나 가까운지뿐입니다.

2) 교차 검증은 전면 테스트의 결과를 개선하는 데 도움이 되지 않습니다. 우리 모두는 일반 모델을 훈련하고, 몇 가지 교차 검증을 수행하고, 모델의 최종 적합성 평가를 위해 모든 샘플의 오류를 어떻게든 처리하는 것이 가능하다는 데 동의하는 것 같습니다. RNeat는 원본 데이터를 모르기 때문에 데이터가 훈련 또는 테스트 중 어느 샘플에 있는지는 중요하지 않으며 어떤 경우에도 논리를 원하는 결과로 조정합니다. 이론적으로 피트니스 기능에 사용되는 모든 샘플에 대해 "학습"(더 정확하게는 변경 :))합니다. 가능한 모든 것은 모델을 필요한 정확도로 훈련하고 과도하게 훈련되지 않기를 바라는 것입니다. 이는 외환에 대한 다소 위험한 접근 방식입니다. 교차 검증은 훈련 후에만 전면 테스트에서 가능한 결과에 대한 최종 평가로 사용할 수 있으며 어떤 경우에도 이 검증 세트를 피트니스 함수 내에서 사용해서는 안 됩니다.

교차 검증에서 훈련 매개변수가 선택됩니다. 이 NS에 매개변수가 있습니까? 있어야합니다.
 
mytarmailS :

알려주세요. 홍채 외에도 데이터를 대체하기 위해 확실히 시도했는데 일반적인 네트워크와 비교하여 결과가 어땠습니까?

모델이 하루 동안 연구한 Forex의 대체 데이터(연도의 경우 eurusd d1)는 자체 최고의 추정치 = 0.017을 보여줍니다(더 좋을수록, 붓꽃의 경우 0.7). 지금까지 실제로 결과가 없었습니다. 훈련 데이터의 모델에서도 50%의 오류가 표시됩니다. 저는 며칠 더 훈련하도록 놔둘 것입니다.

알렉세이 버나코프 :
교차 검증에서 훈련 매개변수가 선택됩니다. 이 NS에 매개변수가 있습니까? 있어야합니다.

모델은 점점 더 복잡해지며 점점 더 많은 뉴런이 추가됩니다. 성장을 제한하는 최대 뉴런 수에 대한 매개변수가 있습니다. 그리고 두 번째 매개 변수는 유전학에서 개인의 수를 결정합니다. 일반적으로 둘 다 좋을수록 메모리와 시간을 절약하기 위해 제한이 도입되며 선택하지 않고 자신에게 허용되는 최대 값을 사용하는 것이 좋습니다.

모델에서는 설명으로 알 수 있듯이 각 뉴런에 대한 가격과 이들 간의 연결이 있으므로 자체적으로는 가능한 한 적은 수의 뉴런을 사용하는 경향이 있습니다. 훈련이 성공하면 모델은 최대 뉴런 수에 도달하기 전에 필요한 정확도에 도달합니다.

 
Dr.Trader :

모델이 하루 동안 연구한 Forex의 대체 데이터(연도의 경우 eurusd d1)는 자체 최고의 추정치 = 0.017을 보여줍니다(더 좋을수록, 붓꽃의 경우 0.7). 지금까지 실제로 결과가 없었습니다. 훈련 데이터의 모델에서도 50%의 오류가 표시됩니다. 저는 며칠 더 훈련하도록 놔둘 것입니다.

많은 예측 변수?
 
산산이치 포멘코 :
분류 모델 평가에 대한 흥미로운 기사 입니다.

예측 변수의 하위 집합에 대한 모델을 평가하기 위해 3가지 다른 메트릭을 시도했습니다. 이 기사에서와 같이 정확도; R^2 모델; 및 단지 평균 모델 오차 mean(abs(yx)/(max(y)-min(y))), 여기서 X는 예측 결과의 벡터이고 Y는 원하는 결과입니다).

휘트니스 함수의 정확도는 꽤 괜찮았는데 샘플에 예시가 별로 없어서 정확도가 매우 계단식으로 나온다는 문제가 있었습니다. 두 개의 유사한 품질 모델이 동일한 결과를 제공했습니다. 그러나 훈련 및 검증 사례가 많다면 이는 좋은 지표가 될 것입니다. 나는 기사의 나머지 지표에 대해 아무 말도 할 수 없습니다.

R^2는 일반적으로 이상하게 행동했으며 결과의 50% 이상이 정확했음에도 불구하고 음수일 수도 있습니다. 일반적으로 저는 마음에 들지 않았습니다.

평균 오차가 가장 적합했습니다. 클래스 0 또는 1로 반올림하기 전에도 수식에서 회귀 결과를 대체하기 때문에 정확도에서 스테핑이 존재하지 않습니다. 두 모델이 클래스에 대해 동일한 결과를 제공하더라도 방법 측면에서 가장 좋은 모델을 결정할 수 있습니다. 회귀 결과는 "원하는 결과에 더 가깝습니다.

mytarmailS :
많은 예측 변수?

약 400

 
적어도 다소간 푸리에 스펙트럼 분석을 이해하는 사람들이 있습니다. 도움이 필요하다
 
mytarmailS :
적어도 다소간 푸리에 스펙트럼 분석을 이해하는 사람들이 있습니다. 도움이 필요하다
그리고 이해할 수 없는 것은 무엇입니까? 주기 함수를 고조파로 분해하고 스펙트럼을 얻습니다.
 
유리 레셰토프 :
그리고 이해할 수 없는 것은 무엇입니까? 주기 함수를 고조파로 분해하고 스펙트럼을 얻습니다.

그렇긴 한데 다른 일이 있어서...

VR에서 서로 가까운 영역에 대한 유사점을 찾아야 하고 근접성은 상관관계, 유클리드 메트릭 등으로 측정할 수 있습니다. 내 실험에 따르면 그러한 메트릭이 내 작업에 적합하지 않다는 것을 깨달았습니다. 진폭, 위상, 주파수를 통한 근접성 검색은 매우 좋습니다. 하지만 이것이 어떻게 수행되는지 전혀 모릅니다. 그래서 누군가가 어떻게, 예, 무엇을, 무엇이 옳은지, 무엇이 그렇지 않은지, 어떻게 되어야 하는지 알고 있는지 묻고 있습니다.

추신 당신은 또한 개인적으로 할 수 있습니다. 그래서 익사하지 않도록 원칙적으로 대화는이 스레드의 주제가 아니며 누구에게도 관심이 없을 것입니다

 
유리 레셰토프 :
그리고 이해할 수 없는 것은 무엇입니까? 주기 함수를 고조파로 분해하고 스펙트럼을 얻습니다.
왜 정기간행물인가?
우리는 또한 전혀 주기적이지 않은 단일 충동을 확장할 수 있습니다)