트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 584

 
막심 드미트리예프스키 :

, 러시아 연방에서 예측 변수의 중요성이 어떻게 결정되는지조차 몰랐고, 설명 없이 어닐링 등에 대한 몇 가지 말도 안되는 내용 을 생략했습니다(이와 무슨 관련이 있습니까?)

벤치가 Forex에서 특별히 사용되는 곳이 어디라고 누가 말했습니까? 왜 GBM이 아니라 Ada입니까? 답변에 흐릿한 추상화가 너무 많습니다. 실제로는 오버트레이닝을 더 많이 하면 증가량이 5%를 넘지 않습니다.

토론하는 수준에서

나는 ALGLIB 수준을 지정합니다 - 집단 농장의 수준, Novgorod 근처의 마을. 당신은 이 수준이 당신에게 적합하다고 반복해서 썼습니다. 이것이 당신의 작업에 충분할 가능성이 있지만 왜 기분이 상합니까?


어닐링

당신은 정말..

예측 변수 선택에 대해 R에서 거의 모든 것을 시도했는데 이 어닐링이 가장 효과적입니다.


왜 GBM이 아니라 Ada입니까? 답변에 흐릿한 추상화가 너무 많습니다. 실제로는 오버트레이닝을 더 많이 하면 증가량이 5%를 넘지 않습니다.

그들뿐만 아니라 내가 시도했기 때문입니다. 아직 프로토콜이 있습니다.

네, 베스트 에이다? 예, 숲과 관련하여 5%, 최대 7%입니다. 그리고 나는 그것보다 더 좋은 것을 모릅니다.

"훌륭한 과적합"이란 무엇입니까? 무슨 얘기를 하는 건가요? 과적합에 대해, 나는 당신이 당신의 모델이 과도하게 훈련되지 않았다는 것을 보여주는 단 한 개의 게시물도 기억하지 못합니다!

과적합은 모델에 의존하지 않고 다음에 의존한다는 것을 반복할 수 있습니다.

  • 예측 변수 세트
  • 모델을 다듬는 능력

 
산산이치 포멘코 :

토론하는 수준에서

나는 ALGLIB 수준을 지정합니다 - 집단 농장의 수준, Novgorod 근처의 마을. 당신은 이 수준이 당신에게 적합하다고 반복해서 썼습니다. 이것이 당신의 작업에 충분할 가능성이 있지만 왜 기분이 상합니까?


어닐링

당신은 정말..

예측 변수의 선택에 관해서는 R에서 거의 모든 것을 시도했으며 이 어닐링이 가장 효과적입니다.


왜 GBM이 아니라 Ada입니까? 답변에 흐릿한 추상화가 너무 많습니다. 실제로는 오버트레이닝을 더 많이 하면 증가량이 5%를 넘지 않습니다.

그들뿐만 아니라 내가 시도했기 때문입니다. 아직 프로토콜이 있습니다.

네, 베스트 에이다? 예, 숲과 관련하여 5%, 최대 7%입니다. 그리고 나는 그것보다 더 좋은 것을 모릅니다.

"훌륭한 과적합"이란 무엇입니까? 무슨 얘기를 하는 건가요? 과적합에 대해, 나는 당신이 당신의 모델이 과도하게 훈련되지 않았다는 것을 보여주는 단 한 개의 게시물도 기억하지 못합니다!

과적합은 모델에 의존하지 않고 다음에 의존한다는 것을 반복할 수 있습니다.

  • 예측 변수 세트
  • 모델을 다듬는 능력


그렇다면 배깅과 부스팅의 차이점은 무엇입니까? bagging에서는 처음에는 덜 적합하고 더 많은 기회 요소가 있으며, boosting에서는 두 번째의 나머지에 대해 하나가 조정된 다음 세 번째에 조정되는 식입니다. 결과는 완전한 과적합입니다. 저것들. RF는 처음부터 이미 "거칠게" 만들 수 있지만 여전히 이를 다시 확인해야 합니다. 아직 시간이 없었습니다.

내 모든 모델이 재교육되었습니다 :) 나는 아직 그 아래에서 영구적 인 패턴을 찾지 못했습니다.

컨볼루션, PCA, 클러스터링, 신경망 앙상블, 포리스트 등 Alglib에는 거의 모든 것이 있습니다. 고전에 따르면 모든 것이 있고 다른 것이 필요합니다-이해하지 못합니다 :) 물론 더 이상 현대적인 것은 없습니다.

좋은 오픈 소스 라이브러리로 간주되며 저자는 신경망 등에 적용되지 않는다고 씁니다. 큰 존경을 표하지만 일반적인 분류/회귀 도구를 참조하고 다른 방법과 구별하지 않습니다. 나는 이런 현실적인 접근이 좋다.

어닐링 등에 관해서도 명확하지 않습니다. 모든 모델에 대한 일종의 보편적인 방법입니까 아니면 무엇입니까? 각 모델에는 이 특정 항목을 최상의 방법으로 훈련할 수 있는 평가 방법이 있어야 합니다.

 
막심 드미트리예프스키 :

그렇다면 배깅과 부스팅의 차이점은 무엇입니까? bagging에서는 처음에는 덜 적합하고 더 많은 기회 요소가 있으며, boosting에서는 두 번째의 나머지에 대해 하나가 조정된 다음 세 번째에 조정되는 식입니다. 결과는 완전한 과적합입니다. 저것들. RF는 처음부터 이미 "거칠게" 만들 수 있지만 여전히 이를 다시 확인해야 합니다. 아직 시간이 없었습니다.

모든 모델이 재교육되었습니다 :) 나는 아직 그 아래에서 영구적 인 패턴을 찾지 못했습니다.

컨볼루션, PCA, 클러스터링, 신경망 앙상블, 포리스트 등 Alglib에는 거의 모든 것이 있습니다. 고전에 따르면 모든 것이 있고 다른 것이 필요합니다-이해하지 못합니다 :) 물론 더 이상 현대적인 것은 없습니다.

좋은 오픈 소스 라이브러리로 간주되며 저자는 신경망 등에 적용되지 않는다고 씁니다. 큰 존경을 표하지만 일반적인 분류/회귀 도구를 참조하고 다른 방법과 구별하지 않습니다. 나는 이런 현실적인 접근이 좋다.

어닐링 등에 관해서도 명확하지 않습니다. 모든 모델에 대한 일종의 보편적인 방법입니까 아니면 무엇입니까? 각 모델에는 이 특정 항목을 최상의 방법으로 훈련할 수 있는 평가 방법이 있어야 합니다.

나는 내 관점에서 기본적인 몇 가지를 설명하기 위해 여러 번 시도했습니다. 실패했습니다.


나는 단지 조언할 수 있다: 캐럿에 몇 달을 보내면 당신은 다른 사고 방식, 질적으로 다른 전망을 갖게 될 것입니다.

 
막심 드미트리예프스키 :

어닐링 등에 관해서도 명확하지 않습니다. 모든 모델에 대한 일종의 보편적인 방법입니까 아니면 무엇입니까? 각 모델에는 이 특정 항목을 최상의 방법으로 훈련할 수 있는 평가 방법이 있어야 합니다.

어닐링, 아프리카에서도 어닐링이며, 목표/목적은 거의 동일합니다. 모델이 로컬 최소값이 아닌 전역 최소값을 찾을 수 있도록 합니다.

ADA는 모르겠지만 국회에서는 어닐링이 좋은 결과를 가져다준다. 나는 평범한 것을 좋아하지 않았기 때문에. 어닐링 매개변수는 미리 설정해야 하므로 수동으로 어닐링하여 이전 교육 결과를 기반으로 매개변수를 변경합니다.

위협 그건 그렇고, 어닐링 없이는 다소 복잡한 NS를 가르칠 수 없습니다.

 
막심 드미트리예프스키 :

네, 하지만 너무 훌륭해서 이 단계에서 끌지 않습니다 :) + 그는 연 20% 이상을 벌 수는 없다고 썼습니다. 아마도 항상 그러한 진술로 시작하고 세부 사항으로 가야 할 것입니다. :)

맥심, 이제 그만 담배를 피우세요. 맥락에서 벗어나, 다른 사람의 말을 다른 사람의 것으로 귀속시키는 등
+ 일부 댓글이 삭제되었습니다. 또한 딸랑이 Fa (Fomenko))라는 단어의 저자를 표시해서는 안됩니다)

 
마법사_ :

맥심, 이제 그만 담배를 피우세요. 맥락에서 벗어나, 다른 사람의 말을 다른 사람의 것으로 귀속시키는 등
+ 일부 댓글이 삭제되었습니다. 또한 딸랑이 Fa (Fomenko))라는 단어의 저자를 표시해서는 안됩니다)


예, 저는 단순합니다 :) 마음에 있는 것은 언어에 있습니다

그리고 나서 뭔가가 밝혀졌습니다 .. 작업 프로세스가 비인간적입니다

딸랑이에 대해, 네, 제가 착각했습니다) SanSanych는 어떻게 든 .. 넌센스 또는 그런 것을 쓰는 것 같았습니다.

 

게으름과 추가 작업에 대한 아이디어가 완전히 없기 때문에 나는 물론 나 자신을 위해 새로운 것을 연구하기로 결정했습니다. 아마도 이미 아주 좋을 것입니다. old.) RF를 알게 되면서 시작했고, RF를 통해 Python(Python)에 이르렀습니다. 내 SciLab 소프트웨어와 양방향으로 호환됩니다. 이제 Python용 패키지에 대한 개요를 살펴보았습니다.

총 120,000개가 넘는 패키지가 있습니다. 그 중 약 70개는 머신 러닝용이고, 약 70개는 신경망용이며, 딥 패키지를 포함하여 더 많을 수 있습니다.

여기에는 다른 회사에서 직접 배포한 패키지는 포함되지 않습니다. 그런 패키지가 많이 있습니다. 우리에게 흥미로운 주제도 있습니다. 국방부, 러시아 연방 의회 및 ADA에 따르면.

다른 회사들 중에는 머신러닝, 트리, NS, 그리고 ADA와 관련된 것이 있었습니다.

많은 패키지가 C/C++로 만들어지므로 성능에 대해 걱정할 필요가 없습니다. Python은 인터페이스(스크립팅 언어)일 뿐입니다. 마치 R처럼.

일반적으로 나는 흥미로운 시간을 가지고 있습니다.)

 
막심 드미트리예프스키 :

왜 GBM이 아니라 Ada입니까? 답변에 흐릿한 추상화가 너무 많습니다. 실제로는 오버트레이닝을 더 많이 하면 증가량이 5%를 넘지 않습니다.

분류할 때 정답의 백분율인 "정확도"를 사용하여 모델을 평가하는 것은 매우 일반적입니다. 제 생각에는 이것은 거래 패턴을 평가하기 위한 가장 약하고 가장 부적절한 추정 중 하나이며 피해야 합니다. 나는 여기 주제에서 kappa, f-score, logloss와 같은 다른 많은 시도를 제안했습니다.

R의 Ada(R뿐만 아니라)는 훈련 중에 분류 모델에 대해 약간 다른 기본 제공 평가를 사용하며 이는 "정확도"보다 훨씬 좋습니다.

 
유리 아사울렌코 :

게으름과 추가 작업에 대한 아이디어가 완전히 없기 때문에 나는 물론 나 자신을 위해 새로운 것을 연구하기로 결정했습니다. 아마도 이미 아주 좋을 것입니다. old.) RF를 알게 되면서 시작했고, RF를 통해 Python(Python)에 이르렀습니다. 내 SciLab 소프트웨어와 양방향으로 호환됩니다. 이제 패키지 개요가 나옵니다.

총 120,000개가 넘는 패키지가 있습니다. 그 중 약 70개는 머신 러닝용이고, 약 70개는 신경망용이며, 딥 패키지를 포함하여 더 많을 수 있습니다.

여기에는 다른 회사에서 직접 배포한 패키지는 포함되지 않습니다. 그런 패키지가 많이 있습니다. 우리에게 흥미로운 주제도 있습니다. 국방부, 러시아 연방 의회 및 ADA에 따르면.

다른 회사들 중에는 머신러닝, 트리, NS, 그리고 ADA와 관련된 것이 있었습니다.

많은 패키지가 C/C++로 만들어지므로 성능에 대해 걱정할 필요가 없습니다. Python은 인터페이스(스크립팅 언어)일 뿐입니다. 마치 R처럼.

일반적으로 나는 흥미로운 시간을 가지고 있습니다.)

https://cloud.google.com/datalab/을 확인하십시오.

나쁜 점은 AutoML이 여전히 그곳에서 개발 중이라는 것입니다. 서비스는 자체적으로 특정 작업에 대한 모델을 선택합니다.

Cloud Datalab - Interactive Data Insights Tool  |  Google Cloud Platform
Cloud Datalab - Interactive Data Insights Tool  |  Google Cloud Platform
  • cloud.google.com
Integrated Cloud Datalab simplifies data processing with Cloud BigQuery, Cloud Machine Learning Engine, Cloud Storage, and Stackdriver Monitoring. Authentication, cloud computation and source control are taken care of out-of-the-box. Multi-Language Support Cloud Datalab currently supports Python, SQL, and JavaScript (for BigQuery...
 
박사 상인 :

분류할 때 정답의 백분율인 "정확도"를 사용하여 모델을 평가하는 것은 매우 일반적입니다. 제 생각에는 이것은 거래 패턴을 평가하기 위한 가장 약하고 가장 부적절한 추정 중 하나이며 피해야 합니다. 나는 여기 주제에서 kappa, f-score, logloss와 같은 다른 많은 시도를 제안했습니다.

R의 Ada(R뿐만 아니라)는 훈련 중에 분류 모델에 대해 약간 다른 기본 제공 평가를 사용하며 이는 "정확도"보다 훨씬 좋습니다.


거래는 일반적으로 이러한 방식으로 평가하기 어렵습니다. 거래 기간이 있고 손절매 수준이 다른 모든 것에 어떻게든 추가되어야 하고 주기적으로 스스로 재교육해야 하기 때문입니다. 일반적으로, 경비원 :)

사유: