트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3187

 
무슨 일이 일어났는지 전혀 이해하지 못했지만 저에게는 정상적인 마음 상태입니다.
 
fxsaber #:.

ZЫ 일반적으로 두 행 간의 차이점을 찾으려는 관심이 있는 경우 이를 제공할 수 있습니다.

내가 쓴 내용을 살펴보십시오. 가을에만 직접 볼 수 있습니다.

 
Aleksey Nikolayev #

포레스터#:

GIF를 게시한 샘플로 실험을 했는데, 샘플에는 이미 47%의 단위가 있으며 데이터는 표에 요약되어 있습니다.


열의 내용에 대한 설명입니다:

  • 생성 - 고정된 수의 "1"과 "0"으로 대상의 무작위 생성 횟수, 마지막 줄 - 원래 대상입니다.
  • 모두의 유사도 % - 대상의 유사도 백분율이 지정됩니다.
  • 유사도 "1" - 대상의 유사도 백분율이 지정되지만 응답 "1"에 대해서만 지정됩니다.
  • 유사도 "0" - 대상의 유사도 백분율이 지정되지만 응답이 "0"인 경우에만 지정됩니다.
  • Q_All - 870개의 양자 테이블과 6533개의 술어를 사용하여 발견된 총 양자 세그먼트 수입니다.
  • Q_All% - 원래 타겟이 있는 샘플의 백분율로 "Q_All"이 몇 개인지 표시합니다.
  • 샘플링된 Q - 샘플링된 양자 세그먼트 수를 표시합니다(범위가 겹치지 않는 세그먼트만 샘플링됨).
  • Q 선택됨 % - 원래 타겟이 있는 샘플에서 백분율로 표시된 "Q 선택됨"의 수입니다.
  • 예측자 - 샘플에서 주어진 기준을 충족하는 퀀텀 세그먼트를 찾을 수 있었던 예측자 수입니다.
  • 예측자 % - 원래 목표가 있는 샘플에서 백분율로 표현된 "예측자"의 수입니다.

하나의 예측자에 대해 총 하나 이상의 양자 세그먼트를 선택할 수 있으며 이러한 세그먼트는 예측자 값의 범위에서 겹치지 않아야한다고 설명하겠습니다.

제가 마음에 들지 않는 것은 목표의 50% 정도가 제자리에 남아 결과 평가에 부정적인 영향을 미칠 수 있다는 것입니다.

실제로 무작위 대상에서 꽤 많은 양자 세그먼트가 발견되었지만 일부 클러스터 (아마도)였기 때문에 다른 테이블이 좌표가 겹쳐서 겹치지 않는 범위를 선택한 후 이러한 양자 세그먼트의 품질 (유틸리티)이 원래보다 10 배 더 나쁨 (적음)이 밝혀졌습니다. 따라서 평균적으로 원래 목표가 있는 샘플에서 다른 예측자에 대해 퀀텀 컷이 3.5배 더 많이 발견되었습니다.

결과에 대해 어떻게 생각하시나요?

추가되었습니다:

무작위 타겟과 원본의 이진 시퀀스 플롯은 다음과 같습니다.


 
Aleksey Vyazmikin #:

GIF를 게시한 샘플로 실험을 수행했는데, 샘플에는 이미 47%의 단위가 있으며, 데이터는 표에 요약되어 있습니다.


열의 내용에 대한 설명입니다:

  • 생성 - 고정된 수의 "1"과 "0"으로 대상의 무작위 생성 횟수, 마지막 줄 - 원래 대상입니다.
  • 모두의 유사도 % - 대상의 유사도 백분율이 지정됩니다.
  • 유사도 "1" - 대상의 유사도 백분율이 지정되지만 응답 "1"에 대해서만 지정됩니다.
  • 유사도 "0" - 대상의 유사도 백분율이 지정되지만 응답이 "0"인 경우에만 지정됩니다.
  • Q_All - 870개의 양자 테이블과 6533개의 술어를 사용하여 발견된 총 양자 세그먼트 수입니다.
  • Q_All% - 원래 타겟이 있는 샘플의 백분율로 "Q_All"이 몇 개인지 표시합니다.
  • 샘플링된 Q - 샘플링된 양자 세그먼트 수를 표시합니다(범위가 겹치지 않는 세그먼트만 샘플링됨).
  • Q 선택됨 % - 원래 타겟이 있는 샘플에서 백분율로 표시된 "Q 선택됨"의 수입니다.
  • 예측자 - 샘플에서 주어진 기준을 충족하는 퀀텀 세그먼트를 찾을 수 있었던 예측자 수입니다.
  • 예측자 % - 원래 목표가 있는 샘플에서 백분율로 표현된 "예측자"의 수입니다.

하나의 예측자에 대해 총 하나 이상의 양자 세그먼트를 선택할 수 있으며 이러한 세그먼트는 예측자 값의 범위에서 겹치지 않아야한다고 설명하겠습니다.

제가 마음에 들지 않는 것은 목표의 50% 정도가 제자리에 남아 결과 평가에 부정적인 영향을 미칠 수 있다는 것입니다.

실제로 무작위 대상에서 꽤 많은 양자 세그먼트가 발견되었지만 일부 클러스터 (아마도)였기 때문에 다른 테이블이 좌표가 겹쳐서 겹치지 않는 범위를 선택한 후 이러한 양자 세그먼트의 품질 (유틸리티)이 원래보다 10 배 더 나쁨 (적음)이 밝혀졌습니다. 따라서 평균적으로 원래 목표가 있는 샘플에서 다른 예측자에 대해 퀀텀 컷이 3.5배 더 많이 발견되었습니다.

결과에 대해 어떻게 생각하시나요?

알렉세이에게 질문합니다. 저는 통계 이론에 강하지 않습니다. 저는 생성 대신 타겟을 혼합하는 것을 제안했습니다.
 
Forester #:
알렉세이에게 질문합니다. 저는 통계 이론에 능숙하지 않습니다. 방금 생성 대신 대상을 혼합하는 것을 제안했습니다.

그렇군요.

숲 구성 과정을 더 관리하기 쉽게 만들고 선택한 양자 세그먼트의 특정 하위 샘플을 각 나무의 루트로 삼는다면 어떨까요?

깊이를 약 2~3개의 분할로 만들어 나뭇잎별로 분류 가능한 클래스의 예가 최소 1%가 되도록 하세요.

그러면 모델이 더 안정적일 것 같습니다.

 
Aleksey Vyazmikin #:

GIF를 게시한 샘플로 실험을 수행했는데, 샘플에는 이미 47%의 단위가 있으며, 데이터는 표에 요약되어 있습니다.


열의 내용에 대한 설명입니다:

  • 생성 - 고정된 수의 "1"과 "0"으로 대상의 무작위 생성 횟수, 마지막 줄 - 원래 대상입니다.
  • 모두의 유사도 % - 대상의 유사도 백분율이 지정됩니다.
  • 유사도 "1" - 대상의 유사도 백분율이 지정되지만 응답 "1"에 대해서만 지정됩니다.
  • 유사도 "0" - 대상의 유사도 백분율이 지정되지만 응답이 "0"인 경우에만 지정됩니다.
  • Q_All - 870개의 양자 테이블과 6533개의 술어를 사용하여 발견된 총 양자 세그먼트 수입니다.
  • Q_All% - 원래 타겟이 있는 샘플의 백분율로 "Q_All"이 몇 개인지 표시합니다.
  • 샘플링된 Q - 샘플링된 양자 세그먼트 수를 표시합니다(범위가 겹치지 않는 세그먼트만 샘플링됨).
  • Q 선택됨 % - 원래 타겟이 있는 샘플에서 백분율로 표시된 "Q 선택됨"의 수입니다.
  • 예측자 - 샘플에서 주어진 기준을 충족하는 퀀텀 세그먼트를 찾을 수 있었던 예측자 수입니다.
  • 예측자 % - 원래 목표가 있는 샘플에서 백분율로 표현된 "예측자"의 수입니다.

하나의 예측자에 대해 총 하나 이상의 양자 세그먼트를 선택할 수 있으며 이러한 세그먼트는 예측자 값의 범위에서 겹치지 않아야한다고 설명하겠습니다.

제가 마음에 들지 않는 것은 목표의 50% 정도가 제자리에 남아 결과 평가에 부정적인 영향을 미칠 수 있다는 것입니다.

실제로 무작위 대상에서 꽤 많은 양자 세그먼트가 발견되었지만 일부 클러스터 (아마도)였기 때문에 다른 테이블이 좌표가 겹쳐서 겹치지 않는 범위를 선택한 후 이러한 양자 세그먼트의 품질 (유틸리티)이 원래보다 10 배 더 나쁨 (적음)이 밝혀졌습니다. 따라서 평균적으로 원래 목표가 있는 샘플에서 다른 예측자에 대해 퀀텀 컷이 3.5배 더 많이 발견되었습니다.

결과에 대해 어떻게 생각하시나요?

추가되었습니다:

무작위 타겟과 원본의 이진 시퀀스 플롯은 다음과 같습니다.


10번의 시뮬레이션은 아무것도 아니며, 통계적으로 유의미한 결과를 얻으려면 수천 번의 시뮬레이션이 필요합니다.

또한 특정 사례에 대한 전문적인 의견을 제시할 준비가 되어 있지 않지만 가능한 문제와 일반적인 해결 방법을 지적했을 뿐입니다.

 
Aleksey Vyazmikin #:

결과에 대해 어떻게 생각하시나요?

추가했습니다:

대상 무작위와 원본의 이진 시퀀스 그래프는 다음과 같습니다.

무의미하고 끊임없는 헛소리를 하고 있군요. 세이버는 적어도 30분 만에 그런 일이 일어났고 잊어버렸어요.
 
Aleksey Nikolayev #:

10번의 시뮬레이션은 아무것도 아니며, 통계적으로 유의미한 결과를 얻으려면 수천 번의 시뮬레이션이 필요합니다.

또한 특정 사례에 대한 전문적인 의견을 제시할 준비가 되어 있지 않지만 가능한 문제와 일반적인 해결 방법을 지적했을 뿐입니다.

수천 - 너무 많은 계산 리소스가 필요합니다 - 한 번의 패스 - 약 40 분 - 비디오 카드에서 기본 계산.

저는 일반적으로이 테스트를 통해 다양한 범위의 예측자에 대한 이러한 클러스터의 가능성 만 확인할 수 있다고 생각했습니다.

그리고 이미 처음에 선택된 양자 세그먼트의 특정 범위에 도달 할 확률을 살펴볼 필요가 있습니다.

그리고 여전히 그러한 테스트의 신뢰성을 위해 백분율 표현에서 목표의 차이에 대한 의견을 듣고 싶습니다.

 
Maxim Dmitrievsky #:
쓸데없는 헛소리를 하고 있군요. 세이버는 적어도 30분 정도는 그런 일을 겪은 후 잊어버렸어요.

특히 상대방이 무엇을 하고 있는지 이해하지 못할 때는 다른 사람의 성과에 대한 평가는 스스로에게만 하세요.

저는 건설적인 비판에 열려 있으며, 여러분으로부터 오는 비판은 없습니다.

 
Aleksey Vyazmikin #:

특히 상대방이 무엇을 하고 있는지 이해하지 못할 때는 다른 사람의 성과에 대한 평가는 스스로에게 맡기세요.

저는 건설적인 비판에 열려 있지만, 여러분은 그렇지 않습니다.

당신은 헛소리를 하고 있어요. 어떤 결과가 나오든 무작위로 얻을 수 있다고 여러 번 언급했습니다. 눈을 뜨고 보세요. 추가할 내용이 없습니다.)

최소한 자신이 무엇을 왜 하고 있는지 이해할 수 있나요?)