ATS 구축 시 필터의 효율성 평가 - 페이지 4

 
-Aleks- :

거래가 감소하면 전략(세트)의 추정 지표가 확실히 변경되며, 이는 변경이 허용되는 정도에 대한 질문입니다.

예를 들어, 필터 없이 기본 파라미터 전체 범위에 대한 최적화는 평균 이익 100,000, 손실(예금 손실)의 35%를 제공하는 반면, 평균 거래 건수는 500, 필터 적용 후 평균 이익, 10k, 손실 5%, 평균 거래 건수 250 - 이익 10배 감소, 불리한 결과 비율 7에 불과한 반면 거래 건수 2배 감소 - 좋은가요? 또는 나쁜? 어떤 지표가 우선 순위를 갖습니까?

통계에는 표본의 비교라는 것이 있습니다.

우리가 실험을 한다고 가정해 봅시다. 주제는 어떤 요인의 영향에 대한 연구입니다. 이 경우 필터의 효과입니다.

2개의 샘플이 비교됩니다. 첫 번째는 모든 거래의 초기 결과 세트이고 두 번째는 필터링된 결과입니다.

귀무 가설 - 필터가 작동하지 않음, 대안 - 필터가 무언가를 걸러냈습니다.

Alex, IMHO, 평가의 초기 단계가 누락되었습니다. 모든 거래 결과의 배포를 구축하고 이상값을 검색한 후 후속적으로 제거합니다. 그렇지 않으면 "평균 이익"과 같은 지표가 대표되지 않습니다.
 

Dennis Kirichenko :

Alex, IMHO, 평가의 초기 단계가 누락되었습니다. 모든 거래 결과의 배포를 구축하고 이상값을 검색한 후 후속적으로 제거합니다. 그렇지 않으면 "평균 이익"과 같은 지표가 대표되지 않습니다.

이러한 이상값을 검색하는 방법은 무엇입니까? 나는 아직 그것이 무엇에 관한 것인지 완전히 이해하지 못했지만 데이터 정규화에 관한 것이라고 생각합니까? 단순히 전략이론의 틀에 맞지 않는 비논리적인 결과만을 선별하는 것이라면 이 단계는 이미 진행된 것으로 이해되지만, 강력하게 뛰어난 결과를 배제하는 것이라면 그들의 배제에 대한 정당화.

반대로 덜 매력적이지만 수용 가능한 옵션을 배제하지 않으려고 노력하는 동안 시장은 변할 수 있다는 아이디어가 있습니다(일반적으로 다양한 상품에서 다양한 행동을 볼 수 있음).

 
-Aleks- :

이러한 이상값을 검색하는 방법은 무엇입니까? 나는 아직 그것이 무엇에 관한 것인지 완전히 이해하지 못했지만 데이터 정규화에 관한 것이라고 생각합니까? 전략이론의 틀에 맞지 않는 비논리적인 결과만을 걸러내는 것이라면 이미 이 단계를 밟았다고 이해하지만, 강력하게 뛰어난 결과를 제외하는 것이라면 그들의 배제에 대한 정당화 ...

그래서 통계적 절차 가 있습니다. 예, 맞습니다. 값이 너무 크거나 작은 인구 요소를 제거합니다.
...반대로 나는 매력적이지 않지만 수용 가능한 옵션을 배제하지 않으려고 노력하지만 시장은 변할 수 있다는 아이디어입니다(일반적으로 다양한 상품에서 다양한 행동을 볼 수 있음).
예, 변경 가능합니다. 그러나 그것은 또 다른 질문입니다. 여기서 아이디어는 간단합니다. 필터가 전략의 효과에 영향을 미쳤는지 여부를 평가해야 합니다.

IMHO, 최적화 결과를 설명하는 일부 지표를 찾은 다음 함께 재생하는 것이 아니라 2개의 샘플(전후)을 비교하는 것이 방법론적으로 더 정확합니다 :-)

또한 샘플은 효과적인 지표로 구성될 수 있습니다. 위에서 거래 결과에 대해 썼습니다. 그러나 당신은 다른 사람들을 데려 갈 수 있습니다 ... 그건 그렇고, 흥미로운 문제 ...
 
Dennis Kirichenko :
그래서 통계적 절차 가 있습니다. 예, 맞습니다. 값이 너무 크거나 작은 인구 요소를 제거합니다. 예, 변경 가능합니다. 그러나 그것은 또 다른 질문입니다. 여기서 아이디어는 간단합니다. 필터가 전략의 효과에 영향을 미쳤는지 여부를 평가해야 합니다.

그래서 저는 실제로 모든 지표의 평균을 내서 그것을 합니다. 이런 식으로 배출량은 평준화됩니다. 그렇지 않습니까? 최적화 결과의 컨볼루션을 수행합니다(두 가지 기능으로 나뉩니다. 그러나 이것은 명확성을 위한 것입니다. 그 중 하나는 제거할 수 있습니다. 즉, 옵션 중 하나는 분명히 더 나쁠 것입니다.). 그리고 이미 컨볼루션을 비교합니다(최대값과 최소값이 모두 있습니다) 일부 지표의 값과 배수 비율 형태의 구조 - 그러나 파일을 보지 않았습니까?) 배출량의 영향을 평준화하기 위해. 또한 종합적으로는 구매와 판매에 대해 별도로 13개의 통화쌍을 한 번에 비교하여 결과적으로 13 * 2 * 2 = 52 평균 최적화 결과를 비교합니다. 필터가 전역적으로 작동하는 경우 모든 쌍에서 작동해야 합니다. 긍정적인 경향이 있어야 합니다.

데니스 키리첸코 :

IMHO, 최적화 결과를 설명하는 일부 지표를 찾은 다음 함께 재생하는 것이 아니라 2개의 샘플(전후)을 비교하는 것이 방법론적으로 더 정확합니다 :-)

또한 샘플은 효과적인 지표로 구성될 수 있습니다. 위에서 거래 결과에 대해 썼습니다. 그러나 당신은 다른 사람들을 데려 갈 수 있습니다 ... 그건 그렇고, 흥미로운 문제 ...

샘플이 전부는 아니지만 일부입니다. 이 부분을 강조하기 위해 어떤 표시를 해야 합니까?

정말 관심이 있으시면 자세한 검사를 위해 최적화 결과를 배치할 준비가 되어 있습니다. 예를 들어 필터가 없는 한 쌍과 필터가 있는 한 쌍의 비교 가능한 데이터가 있습니다.



 
Так я это и делаю фактически путем усреднения всех показателей - таким образом выбросы нивелируются, разве нет?
아니요. 배출량이 고려됩니다. 그리고 그들은 평균에 큰 영향을 미칠 수 있습니다. 그리고 이것은 근본적으로 잘못된 것입니다.

그런 다음 표본 분포의 모양을 보는 것이 중요합니다. 예를 들어 정상과 매우 다른 경우 정점이 몇 개 있으면 좋지 않습니다 ... 간단히 말해서 ...

샘플이 전부는 아니지만 일부입니다. 이 부분을 강조하기 위해 어떤 표시를 해야 합니까?

정말 관심이 있으시면 자세한 검사를 위해 최적화 결과를 배치할 준비가 되어 있습니다. 예를 들어 필터가 없는 한 쌍과 필터가 있는 한 쌍의 비교 가능한 데이터가 있습니다.

정의에 따라 전체 모집단이 없기 때문에 샘플이 여기에 있습니다. 요컨대, 여기에 이것이 있습니다. 우리는 현상의 일부만 봅니다(거래 내역).

네, 알 수 있습니다.

Alex, 먼저 2개의 샘플( 최적화 결과 )이 필요합니다.

1) 필터가 없는 패스입니다.

2) 이것은 필터를 사용한 패스입니다(여기서만 필터 매개변수를 최적화해서는 안 되지만 수정해야 함).
 
Dennis Kirichenko :
아니요. 배출량이 고려됩니다. 그리고 그들은 평균에 큰 영향을 미칠 수 있습니다. 그리고 이것은 근본적으로 잘못된 것입니다.

그리고 방출이 무작위가 아니라면?

데니스 키리첸코 :

네, 알 수 있습니다.

Alex, 먼저 2개의 샘플( 최적화 결과 )이 필요합니다.

1) 필터가 없는 패스입니다.

2) 이것은 필터를 사용한 패스입니다(여기서만 필터 매개변수를 최적화해서는 안 되지만 수정해야 함).

파일에서 필터가 없고 필터가 7개 있는 필터가 있는 최적화 결과는 별도의 시트로 나누어져 있으므로 파싱에 어려움이 없어야 하며, 다른 설정도 필터링 범위에 대한 질문에 답합니다.

나는 최악의 옵션인 2013-2015년 EURUSD M15 쌍을 선택했습니다.

필터 없이:

필터 없이

필터 사용 - 필터를 7개 위치로 전환하는 한계는 그래프에서 구별할 수 있습니다.

 

Dennis Kirichenko , 데이터가 충분합니까 아니면 관심이 없어졌습니까?

 
-Aleks- :

Dennis Kirichenko , 데이터가 충분합니까 아니면 관심이 없어졌습니까?

요전날 한번 봐야겠다 미안하다 너무 바빠서...
 
Dennis Kirichenko :
요전날 한번 봐야겠다 미안하다 너무 바빠서...

글쎄요, 흥미롭고 유익할 것 같아요!

 
첫 번째 시트 표준인 "순 이익" 열을 살펴봅니다(표준이 더 정확할 수도 있지만).

먼저 기술 통계를 계산해 보겠습니다. 특히 이상치가 있는지 여부에 관심이 있습니다.





이상치가 있습니다. 그것은 58,351.76 이상의 손실로 가장 수익성이 없는 패스에 관한 것입니다.

막대 그래프.



이론적으로 이상값을 제거하고 추가로 분석해야 합니다. 그러나 여기에는 많은 이상치가 있습니다. 그리고 그들의 제거는 오히려 방법 론적 기술입니다. 현재의 형태에 따르면 이상치를 고려한 분포가 정규분포처럼 보이지 않아 결과에 영향을 미치는 요인이 다른 요인보다 크다는 것을 의미한다.