트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1909

 
마이클 마르쿠카이테스 :

내 더티 파일은 24개 리그를 차지하는 7700개 열로 구성되어 있으므로 계속하지 말고 여기를 보세요. 여기 당신의 파일이 있습니다

그리고 여기 내꺼야

차이점은 무엇입니까???? 나는 게으르지 않을 것입니다. 주성분을 분석할 때 각 열이 고유한 좌표계인 경우 서로 다른 열의 점이 하나의 공통 좌표계에 표시될 수 있는 경우 해당 열을 그룹화할 수 있는 것이 중요합니다. 해석은 간단합니다. 수직 및 수평 벡터가 많을수록 좋습니다. 당신은 이 멍청하게 균일한 자리를 가지고 있습니다.

정보를 압축하려면 먼저 자기 상관 을 확인하고 1개의 입력만 안전하게 남겨둘 수 있습니다. 메모리가 없기 때문에 네트워크만 작동하지 않습니다.

 
로르샤흐 :

정보를 압축하려면 먼저 자기 상관을 확인하고 1개의 입력만 안전하게 남겨둘 수 있습니다. 메모리가 없기 때문에 네트워크만 작동하지 않습니다.

네트워크의 메모리는 가장 중요하지 않고 지연에 의해 제공되지만 클래스 분리의 품질(분류에 대해 이야기하는 경우)은 매우 중요합니다. 모순이 없고 클래스가 함께 그룹화되는 데이터 세트를 얻는 것이 필요합니다. 이 모든 것이 질적 분열로 이어집니다. 나는 당신의 파일을 딸랑이(P의 그래픽 쉘)로 실행 했는데 지원 벡터 머신이 있고 결과는 65% 개선되었습니다. 즉, 세트가 프랭크 G이면 토가에 물고기가 없습니다. 그러나 이러한 방법에는 큰 데이터 세트가 필요하지 않습니다. 전체 세트를 사용하면 높은 학습 점수를 얻을 수 있는 AI 구성을 사용 중일 수 있지만 이는 일반적으로 더 이상 의미가 없습니다.
 
마이클 마르쿠카이테스 :

글쎄, 모델의 평가 외에도.

예측 변수에서 파일의 열 번호가 표시됩니다.

총 258개의 벡터 수. 클래스 0을 제거하고 클래스 2를 남겨 0으로 이름을 변경했습니다. 수량에서 클래스 1과 균형을 이루었기 때문에 19.60은 2차 오류이거나 직선 선형과 2차의 차이입니다. 오히려 0이 되는 경향이 있습니다. 79.141은 일반 일반화 능력, 지표 100에 노력하는 동안 오류 간의 차이가 줄어들고 69.767이 특이도입니다. 대조구의 총 개수는 75개이고 일반 일반화 능력은 70개입니다. 우리는 총 표본의 77개 벡터에 대해 모른다라는 답을 받았습니다. 여기서 대조구에는 17개가 있었습니다.

실제로 훈련에서 최악의 결과를 얻었지만 컨트롤 섹션에서 훨씬 더 높습니다. 이것은 당신과 같은 테스트 사이트가 아니라 네트워크에서 일반적으로 볼 수 없는 제어 사이트라는 사실에도 불구하고. 테스트는 그녀가 테스트에서 잘 작동하도록 훈련에 대해 훈련할 때입니다. 즉, 잠재적으로 네트워크가 훈련 중에 테스트 섹션을 볼 수 있습니다. 제어 번호 질문????

Adabust는 79 대 79를 주었습니다.

 
막심 드미트리예프스키 :

Adabust는 79 대 79를 주었습니다.

내 모델을 OOS에서 거래할 수 있나요?
 
마이클 마르쿠카이테스 :
전체 세트를 사용하여 높은 학습 점수를 얻을 수 있는 AI 구성을 사용 중일 수 있습니다.

이것이 바로 그것입니다. 나는 다르게 설명하려고 노력할 것이다. ma(100)와 price에 대한 고전적인 시스템이 있다고 가정해 봅시다. 구매 교차, 교차 판매. 일반적으로 ma 및 진입 가격 및 퇴장 시스템 신호가 네트워크에 입력됩니다. ma가 미리 계산되어 완성된 형태로 네트에 공급되기 때문에 투입물을 절약할 수 있습니다. 그리고 네트워크에 ma가 아니라 100 가격 시차(네트워크 자체가 계산되도록)를 입력하고 시스템 신호를 종료할 수 있습니다. 이러한 유형의 네트워크에서는 시차를 100개 미만으로 제출할 수 없습니다.

 
로르샤흐 :

이것이 바로 그것입니다. 나는 다르게 설명하려고 노력할 것이다. ma(100) 및 price에 대한 고전적인 시스템이 있다고 가정해 보겠습니다. 매수 교차, 매도 교차. 일반적으로 ma 및 진입 가격 및 퇴장 시스템 신호가 네트워크에 입력됩니다. ma가 미리 계산되어 완성된 형태로 네트에 공급되기 때문에 투입물을 절약할 수 있습니다. 그리고 네트워크에 ma가 아니라 100 가격 시차(네트워크 자체가 계산되도록)를 입력하고 시스템 신호를 종료할 수 있습니다. 이러한 유형의 네트워크에서는 시차를 100개 미만으로 제출할 수 없습니다.

원초적인 생각과 그것을 빨리 제거할수록, 당신은 더 빨리 당신의 망상 구덩이에서 뛰어내릴 것입니다. 모델 준비의 주요 규칙 중 하나를 위반했습니다. 기억하십시오. 우리는 올림픽 게임에 대해 Alexei Vyazemsky와 어떤 식으로든 적극적이었습니다. 그래서 감사의 표시로 그에게 지연과 내가 놀란 효과에 대한 힌트를 주었습니다. 저는 실무자이자 이론가입니다. 지연의 본질을 드러내는 서신의 일부를 인용하겠습니다.

나는 인용한다:

허허허... 웃기다. 알았어 괴롭히지 않을게 상냥하게 대해줘서 말해줄게 나는 실무자이고 종종 다양한 종류의 현상을 접합니다. 나중에 이론을 구축하거나 내가 발견한 효과를 자세히 연구하여 어떻게든 설명하려고 합니다. 그러나 가장 흥미로운 것은 질문에 대한 답변을 얻는 것입니다. 그래서 우리는 질문이 있었습니다. 분류기를 훈련할 때 현재 데이터가 아닌 과거 데이터를 제공하는 방법. 회귀를 기반으로 예측 모델을 구축할 때 데이터의 순서가 매우 중요합니다. 예측 모델이 훈련 샘플의 전체 기록을 볼 수 있도록 하는 것은 데이터 시퀀스(엄격한 순서로 이동)이며, 내가 말했듯이 훈련 샘플의 맨 처음 데이터는 순서로 인해 후자에 영향을 미칩니다. 즉, 과거에서 미래로, 어떤 경우에도 혼합되어서는 안됩니다. Max가 어떻게 시도했는지 기억하십니까? 그러나 결과는 우울했습니다. 혼합은 회귀에 적용할 수 없기 때문입니다. 비위반 과적합을 위해 훈련 세트의 무작위 혼합 방법이 필수인 경우 분류는 또 다른 문제입니다. 다시 말해, 데이터가 잘 정렬되었기 때문에 과대평가가 아니라 훈련 품질에 대한 실제 추정치를 얻습니다. 우리는 10개의 에포크를 스크롤하고 세트를 섞고 다시 비틀었습니다. 다시 섞는다. 이 경우 훈련 벡터 사이에는 연결이 없으며 실제로 각 벡터는 자체적으로 이동합니다.
2020.07.02 22:47
글쎄, 나는 NN이 현재 신호에 대한 지표의 값뿐만 아니라 히스토리도 훈련을 제공하도록 만드는 방법에 대해 생각했습니다. 마침내 아이디어가 떠올랐습니다. 예, 매우 간단합니다. 신호의 순간에 표시기를 저장 한 다음 현재 신호에 대한 이전 신호 표시기의 값을 취한 다음 이전 신호 등을 취합니다. 결과적으로 현재 신호의 경우 해당 표시기뿐만 아니라 이전 신호의 표시기도 저장됩니다. 현재 저는 24개의 신호를 기록합니다. 즉, 현재 신호에 대해 24개 신호 전의 표시기 값을 저장합니다. 포럼에서 내 교육 파일에 50행에 대해 7500개의 열이 포함되어 있다고 말한 것을 기억합니다. MO 영역의 문제, 우리는 여기에서 너무 똑똑합니다 :-)
2020.07.02 22:52
이제 비즈니스를 시작하겠습니다.
아시다시피 저는 15개 악기에 대한 데이터를 저장하고 이 데이터를 기반으로 여러 지표를 만듭니다. 나는 확률 함수를 취한다. 누적 표준 편차 및 아마도 모든 것. 결과적으로 현재 신호의 기본인 307개의 고유한 입력 열이 있습니다. 결과적으로 현재 신호에 대해 이 307개의 막대를 가져오고 24개의 이전 신호 24개에서 다른 307개의 막대(신호)를 추가합니다. 이번 결정의 의미는 신호가 나타났을 때 최근 24개 신호에 대한 데이터를 즉시 국회에 제출한다는 것이다. 이것은 분류가 현재 신호에 대한 기록의 깊이를 조사할 수 있도록 하는 변환입니다. 실제로 이것은 최대 24 깊이까지의 지연입니다.
2020.07.02 22:59
하지만 마지막 단락에서 가장 흥미로운 부분을 남겼습니다. R용 vtreat 애드온에 대해 들었을 것입니다. 따라서 이 짐승은 데이터 사전 처리를 수행하여 출력 변수에 대한 중요한 열을 표시합니다. 일반적으로 처리 후 130-180 정말 중요한 막대가 남아 있습니다. 그러나 역설은 현재 신호에 대한 표시기의 현재 값이이 샘플에 거의 속하지 않는 것으로 나타났습니다. 극히 드물다고 합니다. 매우 자주 큰 지연이 있는 데이터가 있습니다. 동일한 지연 24는 후처리된 파일에서 드문 게스트가 아닙니다. 즉, 24개 신호 이전에 있던 지표의 값이 목적 함수에 중요하다는 의미입니다. 사실 아이디어는 5센트 정도로 간단합니다. 길이가 충분히 큰 샘플을 저장한 다음 Excel의 한 셀을 아래로 쉬프트한 열을 곱하고 전처리를 수행합니다. 모든 이익!


견적 완료:

네트워크는 혼자서는 아무 것도 할 수 없습니다. 그녀에게 입력으로 제공하는 것은 결과적으로 얻는 것입니다. 연습에서 알 수 있듯이 모든 지연이 유용한 것은 아니며 귀하의 세트에는 국회가 적절한 모델을 얻는 데 어떻게든 도움이 될 단일 열이 없습니다 ..... 행운을 빕니다 !!!!!

Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов
Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов
  • www.mql5.com
При создании графического объекта функцией ObjectCreate() необходимо указать тип создаваемого объекта, который может принимать одно из значений перечисления ENUM_OBJECT. Дальнейшие уточнения свойств созданного объекта возможно с помощью функций по работе с графическими объектами.
 

그리고 모든 것이 올바르게 완료되면 모델은 다음과 같이 작동합니다 .....


 
발레리 야스트렘스키 :

예, 망쳤습니다) 분명히 글리치는 모두 구문 분석할 때 또는 읽기가 진행 중인 데이터에서 발생합니다.

정규화는 편리하지 않을 것입니다. 좋은 소식을 위해서는 터미널에 보관된 뉴스 데이터, 정기적으로 다운로드할 수 있는 기능 및 작업을 위한 서비스가 필요 합니다. 아카이브가 없다고 생각합니다) 하지만 제작자의 입장으로 보면 사용자가 말을 하기 전까지는 어떤 종류가 필요한지 움직이지 않고 있으면 유료 버전으로 먼저 갑니다. )

글쎄요, 무료이고 좋은 달력은 거의 불가능합니다)

 
알렉세이 니콜라예프 :

글쎄요, 무료이고 좋은 달력은 거의 불가능합니다)

예, 달력이 나쁠 수 있습니다. 가장 중요한 것은 길고 정확합니다) 아카이브에서) 이것은 코인 서비스입니다) 아, 지금은 현재를 직접 구문 분석합니다)
 
마이클 마르쿠카이테스 :

고맙게도, 흥미롭게도 이전 신호를 주는 일은 발생하지 않았을 것입니다. 이것은 아마도 네트워크가 일반적으로 추가 링크일 수 있다는 질문을 던집니다.

표지판을 선택하지 않기 위해 네트워크는 나에게 흥미 롭습니다. 그렇지 않으면 고전적인 시스템을 만드는 것이 더 쉽습니다.

나는 실험을 땜질해야 할 것이고, 기계의 시스템에서 매우 많은 수의 예를 취할 것이므로 훈련 중에 단일 반복이없고 한 시대 내에 유지할 수 있습니다.

사유: