트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2384

 
막심 드미트리예프스키

수동 마크업 을 수행했습니까? 이 기술은 더 흥미로워야 합니다

 
예브게니 가브릴로비 :

수동 마크업 을 수행했습니까? 이 기술은 더 흥미로워야 합니다

하지 않았습니다. 이 접근 방식에 관심이 없습니다.

 
mytarmailS :

나는 기차와 테스트 모두에서 작동하는 규칙을 생성하는 방법을 찾았습니다. 마침내 FUCK ....

나의 중개인 , 나의 기차와 시험



귀하의 중개인 귀하의 데이터 및 테스트 9년 통과!!

성배 발견!!!!!!

웃긴건 제가 내일 포럼에서 한 달간 어딘가에서 사라지게 될 텐데 너무 아쉽네요(공유하고 싶은데 시간이 없어서 뭘, 어떻게 해야할지..


편안한 거래를 위해 200-400개의 이러한 규칙( 또는 원하는 경우 패턴 )을 마이닝해야 합니다.

규모를 이해하기 위해 이렇게 말하겠습니다. 약한 노트북은 하루에 5-8개의 규칙을 채굴할 수 있습니다.

나는 마이닝 규칙에서 비난할만한 것을 보지 못했습니다. 패턴을 검색하기 위해 슬라이더가있는 시각적 광부 (매우 빠르게)를 만들고 싶었습니다.

그러나 평소와 같이 아직 완료되지 않은

 
막심 드미트리예프스키 :

나는 마이닝 규칙에서 비난할만한 것을 보지 못했습니다. 패턴을 검색하기 위해 슬라이더가있는 시각적 광부 (매우 빠르게)를 만들고 싶었습니다.

그러나 평소와 같이 아직 완료되지 않은

무엇을 어떻게 보여주고 싶습니까?

 
발레리 야스트렘스키 :

무엇을 어떻게 보여주고 싶습니까?

상자 그림 유형

 
막심 드미트리예프스키 :

상자 그림 유형

상자 그림의 학습 결과 또는 마이닝 규칙?

 
막심 드미트리예프스키 :

나는 마이닝 규칙에서 비난할만한 것을 보지 못했습니다.

물론 당신은 그것을 보지 않습니다)) 그리고 당신이 그것을 보았다면 그것은 어떤 식으로든 나에게 영향을 미치지 않을 것입니다)

막심 드미트리예프스키 :

패턴을 찾기 위해 슬라이더를 사용하여 시각적 광부(매우 빠르게)를 만들고 싶었습니다.

그러나 평소와 같이 아직 완료되지 않은

그것을 시도하십시오. 결과 만 Random Forest와 같을 것입니다. 즉, ...


포리스트 출력은 트리거된 규칙의 합계이며 규칙은 어떤 식으로든 필터링되거나 거부되지 않으며 약 100% 결함이 있는 규칙이 있습니다.

규칙은 반복성(하나의 작업만 있을 수 있음) 또는 적절성(무언가 제공)에 대한 테스트를 통과하지 않으며, 규칙은 단순히 데이터에 확장 됩니다(모델이 데이터에 맞게 조정됨).

이러한 모델은 교차 검증이 끌릴 것이라는 희망으로 어떻게든 훈련 샘플을 근사하지만 객관적인 이유로 끌지 않습니다(시장에 중요한 이벤트가 너무 적음).


나는 다른 접근 방식을 시도했지만 모델을 데이터에 맞추지 않았지만 가설을 세우고 테스트했습니다.

1) 나는 규칙의 형태로 그럴듯한 (이미 필터링된) 가설을 형성합니다.

2) 작은 데이터에 대한 가설 검증

3) 작은 데이터에 대해 검증된 가설은 큰 데이터에 대해 검증됩니다.

사실, 백만 개의 그럴듯한 규칙 중 어딘가에 하나가 남아 있습니다.

준비되지 않은 독자는 두 접근 방식의 차이점을 이해하기 어렵지만, 그 차이는 심연입니다.

 
mytarmailS :

물론 당신은 그것을 보지 않습니다)) 그리고 당신이 그것을 보았다면 그것은 어떤 식으로든 나에게 영향을 미치지 않을 것입니다)

그것을 시도하십시오. 결과 만 Random Forest와 같을 것입니다. 즉, ...


포리스트 출력은 트리거된 규칙의 합계이며 규칙은 어떤 식으로든 필터링되거나 거부되지 않으며 약 100% 결함이 있는 규칙이 있습니다.

규칙은 반복성(하나의 작업만 있을 수 있음) 또는 적절성(무언가 제공)에 대한 테스트를 통과하지 않으며, 규칙은 단순히 데이터에 확장 됩니다(모델이 데이터에 맞게 조정됨)

이러한 모델은 교차 검증이 끌릴 것이라는 희망으로 어떻게든 훈련 샘플을 근사하지만 객관적인 이유로 끌지 않습니다(시장에 중요한 이벤트가 너무 적음).


나는 다른 접근 방식을 시도했지만 모델을 데이터에 맞추지 않았지만 가설을 세우고 테스트했습니다.

1) 나는 규칙의 형태로 그럴듯한 (이미 필터링된) 가설을 형성합니다.

2) 작은 데이터에 대한 가설 검증

3) 작은 데이터에 대해 검증된 가설은 큰 데이터에 대해 검증됩니다.

사실, 백만 개의 그럴듯한 규칙 중 어딘가에 하나가 남아 있습니다.

준비되지 않은 독자는 두 접근 방식의 차이점을 이해하기 어렵지만, 그 차이는 심연입니다.

글쎄, TS 결과의 예를 보여

 
막심 드미트리예프스키 :

글쎄, TC 결과의 예를 보여줘

아직 할 수 없습니다. 최소 500개의 "더티" 규칙을 채굴해야 하며, 그 중 10%가 최종 검사를 통과합니다.

내가 어젯밤에 2개의 "더러운" 규칙을 채굴했음을 이해할 수 있도록


나는 규칙의 합성 속도를 높이기 위해 노력하고 있습니다. 오늘은 속도를 5 배 높이는 방법을 알아 냈고 코드를 다시 작성했습니다. 더 많이 생각합니다.

 
mytarmailS :

아직 할 수 없습니다. 최소 500개의 "더티" 규칙을 채굴해야 하며, 그 중 10%가 최종 검사를 통과합니다.

내가 어젯밤에 2개의 "더러운" 규칙을 채굴했음을 이해할 수 있도록

Aleksey는 컴퓨팅 성능을 제공했으며 오랫동안 무언가를 계산하는 것을 좋아하며 아마도 당신을 협동 조합으로 만들 수 있습니다. :)

벡터화가 없는 R에서는 여전히 느릴 것입니다. 빠른 데이터베이스를 통해 가능합니다.
사유: