트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2385

 
막심 드미트리예프스키 :

Aleksey는 컴퓨팅 성능을 제공했으며 오랫동안 무언가를 계산하는 것을 좋아하며 아마도 당신을 협동 조합으로 만들 수 있습니다. :)

벡터화가 없는 R에서는 여전히 느릴 것입니다. 빠른 데이터베이스를 통해 가능합니다.

예, 원칙적으로 느린 부분을 벡터화했습니다. 알고리즘의 논리를 최적화해야 합니다. 앉아서 다시 생각하고 있습니다. 이미 속도를 5배 높이는 방법을 알아냈고 코드를 다시 작성했습니다. .

징후가 너무 적고 원시적이어서 이것으로도 무언가를해야합니다. 대상이별로 마음에 들지 않습니다 ...

어머.. 리노베이션 같으니 시작해야지..

 
mytarmailS :

물론 당신은 그것을 보지 않습니다)) 그리고 당신이 그것을 보았다면 그것은 어떤 식으로든 나에게 영향을 미치지 않을 것입니다)

그것을 시도하십시오. 결과 만 Random Forest와 같을 것입니다. 즉, ...


포리스트 출력은 트리거된 규칙의 합계이며 규칙은 어떤 식으로든 필터링되거나 거부되지 않으며 약 100% 결함이 있는 규칙이 있습니다.

규칙은 반복성(하나의 작업만 있을 수 있음) 또는 적절성(무언가 제공)에 대한 테스트를 통과하지 않으며, 규칙은 단순히 데이터에 확장 됩니다(모델이 데이터에 맞게 조정됨).

이러한 모델은 교차 검증이 끌릴 것이라는 희망으로 어떻게든 훈련 샘플을 근사하지만 객관적인 이유로 끌지 않습니다(시장에 중요한 이벤트가 너무 적음).


나는 다른 접근 방식을 시도했지만 모델을 데이터에 맞추지 않았지만 가설을 세우고 테스트했습니다.

1) 나는 규칙의 형태로 그럴듯한 (이미 필터링된) 가설을 형성합니다.

2) 작은 데이터에 대한 가설 검증

3) 작은 데이터에 대해 검증된 가설은 큰 데이터에 대해 검증됩니다.

사실, 백만 개의 그럴듯한 규칙 중 어딘가에 하나가 남아 있습니다.

준비되지 않은 독자는 두 접근 방식의 차이점을 이해하기 어렵지만, 그 차이는 심연입니다.

일종의 철학. 구체적인 내용은 없습니다...
 
도서관 :
일종의 철학. 구체적인 내용은 없습니다...

글쎄, 왜, 경로는 더 일찍 발표되었으며 모든 것이 계획대로 엄격합니다. 우리는 규칙을 생성하고 확인합니다. 이것은 작업의 논리/목표를 기반으로 규칙을 선택할 때 일반적인 접근 방식이 아닙니다. 저것들. 일반적으로 처음에는 결정에 대한 규칙이 형성됩니다. 이것은 논리적이지 않지만 결과를 제공하는 규칙의 손실로 이어집니다.

 
도서관 :
일종의 철학. 구체적인 내용은 없습니다...
  • 우리의 개념이 약해서가 아니라 우리가 이해할 수 없는 많은 것들이 있습니다. 그러나 이러한 것들은 우리 개념의 범위에 들어가지 않기 때문입니다.
발레리 야스트렘스키 :

글쎄, 왜, 경로는 더 일찍 발표되었으며 모든 것이 계획대로 엄격합니다. 우리는 규칙을 생성하고 확인합니다. 이것은 작업의 논리/목표를 기반으로 규칙을 선택할 때 일반적인 접근 방식이 아닙니다. 저것들. 일반적으로 처음에는 결정에 대한 규칙이 형성됩니다. 이것은 논리적이지 않지만 결과를 제공하는 규칙의 손실로 이어집니다.

++++

 
mytarmailS :
  • 우리의 개념이 약해서가 아니라 우리가 이해할 수 없는 많은 것들이 있습니다. 그러나 이러한 것들은 우리 개념의 범위에 들어가지 않기 때문입니다.

++++

조금 더 철학

 
이러한 접근 방식의 경우 결과가 일반적이며 조건부로 "안티 햄스터"라고 부를 수 있습니다. 즉, 햄스터가 표시되지만 표시되지 않습니다. 이것은 SB 구현과 유사한 시리즈에서 매우 일반적입니다.
 
알렉세이 니콜라예프 :
이러한 접근 방식의 경우 결과가 일반적이며 조건부로 "안티 햄스터"라고 부를 수 있습니다. 즉, 햄스터가 표시되지만 표시되지 않습니다. 이것은 SB 구현과 유사한 시리즈에서 매우 일반적입니다.

난 동의하지 않는다. 물론 많은 수의 규칙과 선택 논리에 문제가 있습니다. 두 접근 방식의 목표는 동일합니다.

그리고 도로가 전혀 없다는 사실, 우리는 규칙을 확인하고 경로를 수정합니다))))

 

실제 패턴(있는 경우)을 정확하게 찾아야 하는 다른 MO 추상화가 있지만 정확하지 않습니다.

Google에서 프리메이슨이나 펜타곤에 대한 언급을 찾지 못했기 때문에 지금은 비밀로 하고 있습니다.

나는 씨앗을 클릭했을 때 추상화를 생각해 냈습니다.
 
막심 드미트리예프스키 :

실제 패턴(있는 경우)을 정확하게 찾아야 하는 다른 MO 추상화가 있지만 정확하지 않습니다.

Google에서 프리메이슨이나 펜타곤에 대한 언급을 찾지 못했기 때문에 지금은 비밀로 하고 있습니다.

나는 씨앗을 클릭했을 때 추상화를 생각해 냈습니다.

나는 분명히 잊어 버렸습니다 : SB의 실제 패턴 (있는 경우))))

 
막심 드미트리예프스키 :

Aleksey는 컴퓨팅 성능을 제공했으며 오랫동안 무언가를 계산하는 것을 좋아하며 아마도 당신을 협동 조합으로 만들 수 있습니다. :)

벡터화가 없는 R에서는 여전히 느릴 것입니다. 빠른 데이터베이스를 통해 가능합니다.

게다가, 나는 수년 동안 이 접근 방식을 해왔다.

그러나 지금은 매우 느려서 대상을 빠르게 변경(성공한 대상 검색)할 수 없고 개별 규칙은 기록에서 어떻게 확인하더라도 작동이 중지되기 때문에 다소 연기되었습니다.

Maxim, CSV 파일의 데이터에 따라 주기에서 모델(또는 100개 모델)을 생성하는 파이썬 스크립트를 만든 다음 표준 CatBoost 도구를 사용하여 예측자의 중요성에 대해 분석한 다음 비활성화하는 것을 도와주시겠습니까? / 특정 조건에서 예측자(CatBoost가 이 작업을 수행할 수 있음)를 사용하도록 설정하고 새 모델을 다시 생성합니다. 이 방법은 모델 개선으로 이어질 중요한 예측 변수를 강조 표시합니다. 저도 비슷한 방법을 사용하지만, 매 주기마다 예측변수를 필터링/추가한 후 학습 주기를 수동으로 다시 시작해야 하기 때문에 이렇게 하는 것이 매우 불편합니다.

사유: