Neurotraders, 지나치지 마세요 :) 조언이 필요합니다 - 페이지 9

 
Figar0 :

여기에서 포인트별로:

세르게이 감사합니다. 알겠습니다.

입력 전처리

특별한 것은 없습니다. 여러 수준이 있으며, 각각은 엿보기 없이 Hodrick-Prescott 필터에 의해 별도로 처리됩니다.

3) 국회의 수학.

여러 실험에서 특정 한계 내의 네트워크 매개변수가 결과에 거의 영향을 미치지 않는 것으로 나타났습니다. 너무 적으면 과적합이 되고 너무 많으면 과포화가 발생합니다.

에코 네트워크 주제에 대해 이야기할 준비가 되었습니다. 나는 아직 코드를 게시하지 않을 것입니다, 특정 계획이 있습니다.

4) 국회 업무의 "조직적" 문제.

훈련 방법/시기/재훈련

그건 그렇고, 변경하려고하지 않았습니다

, 기간/간격

진지한 연구가 이루어지지 않았습니다. 영향이 있을 거라고 생각합니다. 악기에 따라 기간이 다를 수도 있습니다.

, 네트워크 배기 인터프리터의 작업 논리

아직 본격적인 연구가 된 것은 아니지만, 제가 달라진 점에서 큰 영향은 없을 거라고 생각합니다만... 다시 확인이 필요할 것 같습니다.

, MM

나는 그것을 망칠 요점을 보지 못한다. EF는 잠재적 수익성을 쉽게 평가할 수 있습니다.

- 왜 여전히 "에코"입니까? 당신은 그것에서 요리를 해왔고 장단점에 대해 알려주십시오.

음, 첫째, 네트워크 매개변수가 있는 파레바가 적습니다. 예를 들어 은닉층이 입력보다 작다면 이것은 이미 데이터 압축이며 네트워크가 작동하지 않을 가능성이 높다고 생각하지 마십시오. 다른 네트워크에 있는 많은 작은 것들을 고려할 필요가 없습니다.

요컨대, 지금 나는 이와 같은 네트워크로 작업하고 있습니다. 어리석게도 뉴런, 연결(특정 수, 특정 유형)을 던졌습니다.

적응. 나는 사용한다. 나는 내부에서 무슨 일이 일어나는지 별로 신경 쓰지 않는다. 나는 본질적으로 편리한 블랙박스를 얻는다.

MLP로 해결되는 거의 모든 문제는 에코 네트워크로 해결됩니다.


둘째 - 항상 최적의(토폴로지 및 입력 및 출력 비율 기반) 솔루션을 얻습니다.

셋째, 네트워크의 적응 시간(나는 의도적으로 "훈련"이라는 단어를 피함)이 매우 정확하게 예측됩니다. 이를 위해 LSM이 사용되며 수렴 등이 없습니다.


나는 지금까지 단 하나의 마이너스를 보았습니다. 피트니스 기능의 한계입니다. 저것들. 이론적으로 FF 등의 평균 제곱 오차가 가장 작은 솔루션에 대한 검색만 사용할 수 있습니다. 물론 이것은 유전 학습의 도움으로 우회할 수 있지만 네트워크 에코의 모든 아름다움은 손실됩니다.

아니요, 하나 더 있습니다. 확실하지 않지만 제 생각에는 (제가 틀릴 수 있음) 교육 시간이 3차적으로 증가하므로(미분 행렬의 형성만큼 교육이 많지 않음) 숫자로 네트워크를 교육합니다. 예를 들어, 1000개의 뉴런은 상당한 시간이 걸립니다.


도대체 어떻게 파셨나요?

같은 포럼에 감사드립니다 :) gpwr 동지로부터 그에게 많은 감사를 드립니다 :)

두 번째 유형의 TS는 일반적으로 교활한 IMHO에서 나옵니다.

IMHO, 두 번째 유형을 사용하면 작업 및 결과 분석이 훨씬 쉽습니다. 예를 들어, 논의된 프로젝트의 TS는 처음에 두 번째 유형에 완전히 맞습니다.

입력/출력을 개선할 수 없다고 정말 확신합니까?

당연히 아니지

b) 전처리: 어떻게 보입니까? 예를 들어, 입력 값의 분포에 대한 분석이 있었습니까?

정규화는 어떤 형태로 존재하지만 데이터 분포에 대한 심각한 분석은 없습니다.

 
renegate :

그리고 네트워크 입력에 공급하는 칠면조에 대해 휘발화(기사에서 사용 가능)를 수행하지 않았습니까?

친숙한-흥미로운. 사용 경험을 공유할 수 있습니까? 결과, 개선 사항, 기능, 함정은 무엇입니까?

칠면조를 무기력하게 만들 수도 있습니다.

음, 여기에 의심이 있지만 그래도 짧은 설명을 듣고 싶습니다.
 

분석된 데이터 영역(패턴)을 파란색 사각형으로, 예측 데이터 영역을 빨간색 사각형으로 조건부로 표현해보자. 현재 구현에서 빨간색 영역의 수직 크기는 배율 인수를 통한 파란색 영역의 크기에 따라 달라집니다(그리고 영역 크기가 아니라 파란색 영역의 데이터 내용에 따라 달라야 함). 다음은 불일치를 볼 수 있는 두 가지 예입니다.

그리고

첫 번째 화면에서는 빨간색 사각형의 크기가 파란색보다 작고 두 번째 화면에서는 더 큰 것을 알 수 있습니다.

신호는 수직 치수를 기준으로 정규화됩니다.

그래서 역시 마찬가지지만, 예제의 크기가 아니라 전체 훈련 샘플의 크기로 정규화해야 할 필요가 있는 것 같습니다. 분명히 이것 때문에 그리드의 예측 능력이 감소합니다.

이와 관련하여 한 가지 불편한 점이 있습니다(그래서 이러한 정규화 방법을 선택한 것입니다). 그러나 탈출구가 없는 것 같습니다. 최대값과 최소값을 측정하려면 훈련 샘플에 대해 한 번 추가로 실행해야 합니다.

각 패턴의 값이 1이고 값이 -1이기 때문에 현재 구현에서 패턴의 신호 분포가 최소값과 최대값 영역에서 심하게 편향되어 있음이 분명합니다.

제 생각에는 이러한 변화부터 시작해야 합니다.

 
다른 방법으로 설명해주셨어요 :) . 이제 동의합니다.
 
TheXpert :
다른 방법으로 설명해주셨어요 :) . 이제 동의합니다.

아니, 아니, 그렇지 않으면. 말로는 표현하기 어렵고, 사진으로 표현하면 쉽다고 해요. 말하는 사람도 듣는 사람도. ;)

추신 그리고 이익을 위한 훈련을 위한 예측 영역을 희생시키면서 - 이것은 여전히 유효합니다. 저는 그렇게 하고 있습니다.

 

다음 알고리즘에 따라 가격을 실험했습니다.

1) Close에서 일련의 첫 번째 차이(RDD)를 얻습니다.

2) RPR 모듈에서 이동 계산(나는 25주기를 걸었다)

3) RPR을 이동 평균으로 나눕니다.

우리는 더 고정적인 RPR을 얻습니다. 누적 합계를 사용하여 의사 가격 시리즈로 돌아갈 수 있습니다.


나는 당신이 RPR을 사용하지 않는 것을 봅니다. 가격 시리즈에 추세 제거를 사용합니까? 아니면 단순히 가격 범위를 주어진 범위로 정규화합니까?

 

renegate :

가격 시리즈에 추세 제거를 사용합니까?

여기에서도 더 자세히 알아볼 수 있습니다.

아니면 단순히 가격 범위를 주어진 범위로 정규화합니까?

이제 패턴 설명 내에서 정규화가 발생합니다.

이제 전체 패턴 세트에 대해 정규화를 수행합니다. 이것은 이론상 어렵지 않아야 합니다.

나는 휘발을 붙이려고 노력하고 싶지만 여기에서는 더 어려울 것입니다. 나는 생각할 것이다.

 

이렇게 하려면 가격 시리즈가 추세, 순환, 노이즈 구성 요소로 구성된다는 공리를 받아들여야 합니다.

가격 범위에서 추세 구성 요소를 뺍니다. 오프핸드 3가지 방법:

1) 주성분(부르주아의 경우 AGK 또는 PCA)을 분석하고 첫 번째 주성분을 재설정합니다.

2) 가격 범위에서 이동 평균을 뺍니다. 눈 또는 최적화 또는 스펙트럼 분석을 통해 기간을 선택합니다.

3) 전체 가격 시리즈 의 선형 회귀 를 찾아 가격에서 뺍니다.

그 후 순환 및 노이즈 구성 요소만 있는 시리즈를 얻습니다. 주어진 범위로 정규화하는 것이 편리합니다.

 
그래서 사실 이 주요 구성 요소가 필요합니다. :)
 
renegate :

다음 알고리즘에 따라 가격을 실험했습니다.

1) Close에서 일련의 첫 번째 차이(RDD)를 얻습니다.

트릭 질문이 없습니다. 왜 이 단계를 거치나요?