트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1305

 

0.45에서 0.65로 분류 0/1에 대한 "확률" 임계값의 변위에 따른 지표의 변화

기본적으로 정확도

히스토그램에서 볼 수 있듯이 분류의 확률 임계값이 이동하면 분류 정확도의 증가가 매우 원활하게 발생하며 이는 이익이라고 할 수 없습니다.

분류 효율성뿐만 아니라 규칙(잎) 간에 이익이 어떻게 분배되는지, 그리고 이에 대한 민감도 임계값은 얼마인지 평가하는 것이 필요하다는 것이 밝혀졌습니다. 저것들. 무엇을 말하든지 간에, 별도의 규칙을 도출하고 평가해야 합니다.

 
도서관 :
보았다)
일반적으로 용어와 혼동

교차 검증은 어떻습니까? 모든 하위 집합이 여기에 참여하므로 검증이 테스트보다 정확합니다.

요컨대, 네, 젠장. 내 테스트는 하위 집합의 두 번째 부분이지만 유효성 검사라고 부를 것입니다.

 
알렉세이 비아즈미킨 :

0.45에서 0.65로 분류 0/1에 대한 "확률" 임계값의 변위에 따른 지표의 변화

기본적으로 정확도

히스토그램에서 볼 수 있듯이 분류의 확률 임계값이 이동하면 분류 정확도의 증가가 매우 원활하게 발생하며 이는 이익이라고 할 수 없습니다.

분류 효율성뿐만 아니라 규칙(잎) 간에 이익이 어떻게 분배되는지, 그리고 이에 대한 민감도 임계값은 얼마인지 평가하는 것이 필요하다는 것이 밝혀졌습니다. 저것들. 무엇을 말하든지 간에, 별도의 규칙을 도출하고 평가해야 합니다.

거래도 더 적기 때문에 이익은 0.65로 더 작습니다. 예를 들어 100 대신 10 트랜잭션이 있습니다. 많이 늘릴 수 있습니다

 
알렉세이 비아즈미킨 :

0.45에서 0.65로 분류 0/1에 대한 "확률" 임계값의 변위에 따른 지표의 변화

기본적으로 정확도

히스토그램에서 볼 수 있듯이 분류의 확률 임계값이 이동하면 분류 정확도의 증가가 매우 원활하게 발생하며 이는 이익이라고 할 수 없습니다.

분류 효율성뿐만 아니라 규칙(잎) 간에 이익이 어떻게 분배되는지, 그리고 이에 대한 민감도 임계값은 얼마인지 평가하는 것이 필요하다는 것이 밝혀졌습니다. 저것들. 무엇을 말하든지 간에, 별도의 규칙을 도출하고 평가해야 합니다.

임계값을 높이면 모델이 악화될 때 새 데이터에 대한 트랜잭션이 점점 줄어들고 확률이 0을 중심으로 회전합니다. 지금이 재교육하기에 좋은 시간입니다.

임계값을 높이려면 오류가 낮아야 합니다. 그렇지 않으면 신호가 전혀 없습니다.
 
도서관 :

거래도 더 적기 때문에 이익은 0.65로 더 작습니다. 예를 들어 100 대신 10 트랜잭션이 있습니다. 많이 늘릴 수 있습니다

거래 횟수와 수익성 있는 거래는 아주 순조롭게 변합니다. (거래는 거래입니다 / MT의 논리에 따라 2)

손절매 가 고정되어 있지 않기 때문에 거래당 손실이 안정적이지 않다는 것입니다.

 
도서관 :
보았다)
일반적으로 용어와 혼동

나는 내 용어를 제공합니다 (지금은 그것에 충실하겠습니다).

1. 훈련 샘플 - 모델이 생성되는 샘플

2. 테스트 샘플 - 훈련 중단을 포함하여 모델 훈련의 품질을 제어하는 데 사용

3. 검사 샘플 - 교육과 관계없이 결과 모델의 품질을 평가하는 데 사용됨

 
막심 드미트리예프스키 :

임계값을 높이면 모델이 악화될 때 새 데이터에 대한 트랜잭션이 점점 줄어들고 확률이 0을 중심으로 회전합니다. 지금이 재교육하기에 좋은 시간입니다.

임계값을 높이려면 오류가 낮아야 합니다. 그렇지 않으면 신호가 전혀 없습니다.

예, 이해할 수 있습니다. 특히 전체 활성화 부분의 대부분이 0.5 주변에서 회전하고 0.1 + 0.05 + 0.08 + 0.25 + 0.03의 합처럼 보이는 것은 나뭇잎의 연결 재생산 부족으로 인해 사라지는 신호입니다. 금액이 떨어지면서 활성화가 발생하지 않습니다.

 
알렉세이 비아즈미킨 :

예, 이해할 수 있습니다. 특히 전체 활성화 부분의 대부분이 0.5 주변에서 회전하고 0.1 + 0.05 + 0.08 + 0.25 + 0.03의 합처럼 보이는 것은 나뭇잎의 연결 재생산 부족으로 인해 사라지는 신호입니다. 금액이 떨어지면서 활성화가 발생하지 않습니다.

알고리즘이 새로운 데이터로 잘 일반화되지 않는다는 것을 의미합니다.

 
막심 드미트리예프스키 :

테스트당 10% 오류 및 ~10,000개 예제에 대해 교육, 증가하면 원활하게 증가

이러한 오류와 함께 모델은 새 데이터 작업을 시작했습니다.

다양한 방법으로 유효성 검사를 수행할 때 옵션을 정렬해야 합니다.

더 이상 알고리즘 공개 안 하고 그냥 소통해요

영형! 여기 문제가 있습니다! 거의 내 것! 그는 당신이 fsyaky Alyosha와 마법사의 말을들을 필요가 없다고 말했습니다 :)

 
막심 드미트리예프스키 :

알고리즘이 새로운 데이터로 잘 일반화되지 않는다는 것을 의미합니다.

그래서 나는 빙글빙글 돌고 있어, 나 자신을 속이고 싶지 않아 :)

이제 새로운 예측 변수를 추가하겠습니다...

사유: