트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3084

 
Viktor Kudriavtsev #:

안녕하세요 여러분. 이 사이트의 신경망에 관한 많은 기사 시리즈에서 가져온 전문가 조언자를 훈련 시키려고합니다. 나는 그들이 훈련 할 수 없다는 인상을받습니다. 기사 아래에서 작성자에게 질문하려고했지만 불행히도 그는 실질적으로 대답하지 않습니다...(

따라서 포럼 회원에게 질문-신경망을 얼마나 훈련시켜야 (무작위가 아닌) 결과를 제공하기 시작할 수 있는지 알려주세요.

기사 27에서 마지막 기사까지 모든 EA를 시도했지만 결과는 동일합니다-무작위입니다. 저자가 지적한 대로 300회에서 1000회까지 훈련했습니다. 전문가 고문이 반복 만있는 경우 100,000에서 20,000,000 반복에서 2-3 개의 접근 방식으로 여전히 무작위로 수행했습니다.

얼마나 훈련해야합니까? 충분한 훈련 샘플의 크기는 얼마인가요(미리 생성된 경우)?

추신 : Google의 신경망에 대한 간단한 정보는 일반적으로 신경망으로 익숙합니다. 모두는 약 100-200 개의 에포크를 작성하고 이미 결과가 있어야합니다 (그림, 그림, 분류에).

훈련을위한 샘플에 결과가 없습니까?

이러한 기사의 주기는 즉시 사용 가능한 기성 솔루션이 아닙니다. 아무도 기계 학습에서 가장 가치있는 것, 즉 예측자를 밝히지 않을 것입니다. 따라서 여기에 제안된 방법을 시도하기 전에 가격 행동을 잠재적으로 설명할 수 있는 예측자 집합을 개발해야 합니다.

 
Viktor Kudriavtsev #:

안녕하세요 여러분. 이 사이트의 신경망에 관한 많은 기사 시리즈에서 가져온 전문가 조언자를 훈련 시키려고합니다. 나는 그들이 훈련 할 수 없다는 인상을받습니다. 기사 아래에서 작성자에게 질문하려고했지만 불행히도 그는 실질적으로 대답하지 않습니다...(

따라서 포럼 회원에게 질문-신경망을 얼마나 훈련시켜야 (무작위가 아닌) 결과를 제공하기 시작할 수 있는지 알려주세요.

기사 27에서 마지막 기사까지 모든 EA를 시도했지만 결과는 동일합니다-무작위입니다. 저자가 지적한 대로 300회에서 1000회까지 훈련했습니다. 전문가 고문이 반복 만있는 경우 100,000에서 20,000,000 반복에서 2-3 개의 접근 방식으로 여전히 무작위로 수행했습니다.

얼마나 훈련해야합니까? 충분한 훈련 샘플의 크기는 얼마인가요(미리 생성된 경우)?

추신 : Google의 신경망에 대한 간단한 정보는 일반적으로 신경망으로 익숙합니다. 모두는 약 100-200 개의 에포크를 작성하고 이미 결과가 있어야합니다 (그림, 그림, 분류에).

그리고 그들이 임의의 결과를주지 않아야한다는 것은 어디에 쓰여져 있습니까? ) 동일한 기사가 많다는 것은 이미 잘못된 방향을 제시하고 있습니다.

강화 학습은 이러한 작업을 위해 설계된 것이 아니며 적용 분야가 상당히 다릅니다. 당신은 그것을 가지고 놀 수 있습니다.
 
Lilita Bogachkova #:

예,

하지만 동일한 값을 가진 큰 숫자는 데이터의 전반적인 품질에 의문을 갖게 합니다.
예: seq = ([5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5]) = [5,5,5,5,5,5,5][5]; [5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5,5][5] ....
그런 훈련 데이터를 모델에 공급하는 것이 무슨 의미가 있는지 모르겠습니다;

그래서 저는 여전히 고유하지 않은 모든 데이터를 걸러내고 있습니다.

제가 틀릴 수도 있지만 모델에 다음 훈련 데이터도 공급하는 것은 잘못된 것 같습니다:

[1,2,3,4,5] [5];

[1,2,3,4,5] [6];

[1,2,3,4,5] [7];

[1,2,3,4,5] [8];

...

엉터리입니다.

 
Aleksey Vyazmikin #:

교육 샘플에 대한 결과도 없으신가요?

이러한 일련의 기사는 머신 러닝에서 가장 가치 있는 것, 즉 예측자를 즉시 사용할 수 있는 기성품 솔루션이 아닙니다. 따라서 여기에 제안된 방법을 시도하기 전에 가격 행동을 설명할 수 있는 예측자 집합을 개발해야 합니다.

예는 훈련 샘플에서도 작동하지 않습니다. 어디에서도 작동하지 않습니다. 이 경우 예측 변수는 무엇일까요? 저자는 차트에서 캔들스틱, 시간, 4개 지표의 형태로 매개 변수를 가져오는 방법을 설명합니다. 신경망 모델도 있습니다.
 
Maxim Dmitrievsky #:

무작위 결과를 제공해서는 안 된다고 적혀 있는 곳은 어디인가요? ) 동일한 기사가 많다는 것은 이미 잘못된 방향을 제시하고 있습니다.

강화 학습은 이러한 작업을 위해 설계된 것이 아니며 적용 분야가 상당히 다릅니다. 당신은 그것을 가지고 놀 수 있습니다.
저자는 각 기사의 마지막에 전략 테스터의 그래프와 통계를 제공합니다. 글쎄, 통계가 허구라면 예....
 
Viktor Kudriavtsev #:
교육 샘플에서도 작동하지 않습니다. 어디에서도 작동하지 않습니다. 이 경우 예측 변수는 무엇일까요? 저자는 차트에서 캔들 스틱, 시간 및 4 가지 지표의 형태로 매개 변수를 가져 오는 방법을 설명합니다. 신경망 모델도 있습니다.

훈련 샘플에서 작동하지 않는다면 아마도 문제가 있는 것입니다. 신경망은 트리 모델과 달리 훈련하는 데 시간이 오래 걸립니다.

예측자는 안정적인 확률적 결과로 가격에 영향을 미치는 모든 요소가 될 수 있으며, 예, 옵션 인 지표가 될 수 있습니다.

글쎄, 작성자는 코드에 몇 가지 오류가있었습니다 (비 인텔 카드의 경우 중요) - 사람들의 요청에 대한 규칙의 두 가지 버전.
 
Aleksey Vyazmikin #:

훈련 샘플에서도 작동하지 않는다면 사용자 측에 문제가 있는 것일 수 있습니다. 신경망은 트리 모델과 달리 훈련하는 데 시간이 오래 걸립니다.

예측자는 안정적인 확률적 결과로 가격에 영향을 미치는 모든 요소가 될 수 있으며, 예, 옵션으로 지표가 될 수 있습니다.

글쎄요, 작성자는 코드에 몇 가지 오류 (비 인텔 카드에 중요)가있었습니다 (사람들의 요청에 대한 몇 가지 버전의 규칙).

글쎄, 나는 최신 기사 (GoExplore 이후)를 가지고 있으며 27에서 35까지 정상적으로 컴파일되고 실행되는 것 같습니다. 36-38이 작동하지 않는 것은 테스터가 훈련 된 것입니다. 엔비디아 GTX 660 Ti의 카드가 있습니다.

내 쪽에서 문제가 될 수있는 것은 무엇입니까? 내 소브트 닉이 컴파일, 실행, 학습 프로세스 (그래프의 오류 및 진행 상황)가 계속됩니다. 그리고 그것은 얼마나 많은 빚입니까? 기사의 저자도 많은 글을 쓰고 예제 수집과 훈련을 반복해야하지만 적어도 대략적인 수치는 어디에도 쓰지 않습니다. 예를 들어, 나는 500 개의 시대를 훈련했고 첫 번째 거래는 마이너스가되기 시작했습니다. 적어도 수치에 대한 구체성이 있습니다. 그렇지 않으면 내가 많이 가르치고 뭔가 잘못되었거나 충분히 가르치지 않았고 아무것도 기대하기에는 너무 이르다는 것이 전혀 명확하지 않습니다.

 
Viktor Kudriavtsev #:
저자는 각 기사의 마지막에 전략 테스터의 그래프와 통계를 제공합니다. 글쎄, 통계가 허구라면 예....
짧은 기간 동안 매우 겸손한 테스트가 있으며 명확한 결론을 도출하는 것은 불가능합니다. 훈련에서도 작동하지 않으면 큰 혼란을 일으켰다는 의미입니다 :) 이러한 훈련 과정은 제어하기 어렵 기 때문에 접근 방식 자체가 부적합합니다. 그리고 올바른 제어 기능 (보상)을 찾으면 더 이상 필요하지 않습니다.
다른 것을 시도해 보았지만 안정적인 결과를 얻을 수 없었습니다.

그리고 유전적 최적화보다 계산적으로 더 복잡하지만 효율성 측면에서는 더 낫지 않습니다. 한 번의 반복으로 비슷한 결과를 얻을 수 있습니다. 트레이딩 분야에 대한 전문 지식이 없으면 좋은 결과가 나오지 않습니다.
 
Maxim Dmitrievsky #:
짧은 기간 동안 매우 겸손한 테스트가 있으므로 명확한 결론을 내릴 수 없습니다. 교육 프로그램에서도 효과가 없다면 실수를 많이 했다는 뜻입니다 :) 이러한 훈련 과정은 제어하기 어렵 기 때문에 접근 방식 자체가 부적합합니다. 그리고 올바른 제어 기능 (보상)을 찾으면 더 이상 필요하지 않습니다.
.
다른 것을 시도했지만 안정적인 결과를 얻을 수 없었습니다.

그리고 유전적 최적화보다 계산적으로 더 복잡하지만 효율성 측면에서는 더 낫지 않습니다. 한 번만 반복해도 비슷한 결과를 얻을 수 있습니다. 트레이딩 분야에 대한 전문 지식이 없으면 좋은 결과가 나오지 않습니다.
저는 이 시리즈에서 유전 및 진화적 방법을 사용하여 전문가 어드바이저를 양성하려고 노력했습니다(30, 31편). 저자는 매개 변수에 1000 개의 시대를 가지고 있습니다. 제가 알기로는 에포크 당 인구는 50명입니다. 훈련 할 때 최상의 결과가 로그에 표시됩니다. 따라서 200 개의 에포크 동안이 최상의 결과는 초기 결과와 관련하여 변경되지 않았습니다. 나는 또한 100 명의 인구를 넣고 약 150 개의 에포크를 훈련했습니다. 결과는 동일했습니다. 그래서 저는 이 방법을 포기하고 새로운 방법으로 넘어갔습니다.
 
Viktor Kudriavtsev #:
저는 유전적 및 진화적 방법을 사용하여이주기에서 EA를 훈련하려고했습니다 (기사 30 및 31). 저자는 매개 변수에 1000 개의 시대를 가지고 있습니다. 내가 알기로 인구는 에포크 당 50 명입니다. 훈련 할 때 최상의 결과가 로그에 표시됩니다. 따라서 200 개의 에포크 동안이 최상의 결과는 초기 결과와 관련하여 변경되지 않았습니다. 나는 또한 100 명의 인구를 넣고 약 150 개의 에포크를 훈련했습니다. 결과는 동일했습니다. 그래서 저는 이 방법을 포기하고 새로운 방법으로 넘어갔습니다.

새로운 모델, 특히 복잡한 모델에 시간을 낭비하는 것은 완전히 시간 낭비입니다.

RF의 이상은 간단하고 매우 명확한 모델입니다. 모델 앙상블을 통해 최종 결과를 얻으려는 경우 오래되고 잘 테스트 된 모델에서 두세 가지 모델을 더 가져올 수 있습니다 (약 5 % 오류 감소 제공).

저의 회의론은 매우 간단하게 설명됩니다. 우리의 주요 적은 금융 시장의 고정성, 즉 한계 정리와 이에 기반한 모든 통계 (다른 상관 관계, 분산 등)가 작동하지 않습니다. 그건 그렇고, RMSE와 같은 추정치도 마찬가지입니다.


그렇기 때문에 전처리(데이터 마이닝)부터 시작해야 합니다. 대상 (교사)과 충분히 안정적인 연결을 가진 예측 변수 세트를 얻지 못하면 아무 것도 이야기하는 것은 의미가 없습니다. 이 연결의 품질이 예측 오류와 따옴표의 다른 부분에서의 안정성을 결정합니다. 모델은 그것과 전혀 관련이 없습니다. RF에서 "샘플 내"와 "샘플 외"에서 거의 동일한 예측 오류가 20 % 미만이면 동일한 예측 변수 집합을 시도하고 고급 모델, 모델 앙상블로 인한 예측 오류를 줄이기 위해 목표를 설정할 수 있지만 몇 퍼센트이므로 RF 이외의 다른 것에 시간을 할애하는 것은 의미가 없습니다.

한 가지 더 조건이 있습니다 : 예측자와 대상과의 연결의 안정성에 대한 수학적 증명, 즉 예측자와 대상과의 연결의 분산을 구하고 최소한 GARCH의 의미에서 대략적인 안정성을 증명하여 예측자와 대상과의 연결의 안정성을 증명하는 것입니다.

그리고 다른 "시대"와 수세기에 걸친 테스트 - 아무것도, 당신은 너무 소란스럽고, 당신은 주제에있는 것처럼 보이지만 제자리에서 달리고 있습니다.

사유: