트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 352

 
막심 드미트리예프스키 :

글쎄요, 당신은 분류 모델을 생성합니다. 표본이 클수록 일반화가 강할수록 모델은 일반적으로 더 안정적이고 특히 덜 정확하므로 이익이 적습니다.

효율성 측면에서 이야기합시다. 복잡성의 결과로 시스템의 효율성이 떨어지면 그러한 시스템은 흥미롭지 않습니다. 이익 + 손실의 감소는 효율성의 감소를 나타냅니다.

안정성이 증가함에 따라 효율성이 증가해야 합니다. 효율성에서 이익 / (이익 + 손실)의 비율을 취할 수 있습니다. 트랜잭션에 대한 효율성은 여전히 가능합니다.

 
유리 아사울렌코 :

효율성 측면에서 이야기합시다. 복잡성의 결과로 시스템의 효율성이 떨어지면 그러한 시스템은 흥미롭지 않습니다. 이익 + 손실의 감소는 효율성의 감소를 나타냅니다.

안정성이 증가함에 따라 효율성이 증가해야 합니다. 효율성에서 이익 / (이익 + 손실)의 비율을 취할 수 있습니다. 트랜잭션에 대한 효율성은 여전히 가능합니다.


NS는 해당되지 않습니다))장기효율은 증가하고 단기효율은 떨어지는 것으로 나타났습니다) 글쎄요, 어떤 예를 들어도.. 전술이 있고 전략이 있습니다.. 단기 훈련에서는 NS가 전술적으로 승리하고, 장기적으로는 전략적으로 다양한 요인이 영향을 미치기 시작합니다.
 
유리 아사울렌코 :

효율성 측면에서 이야기합시다. 복잡성의 결과로 시스템의 효율성이 떨어지면 그러한 시스템은 흥미롭지 않습니다. 이익 + 손실의 감소는 효율성의 감소를 나타냅니다.

안정성이 증가함에 따라 효율성이 증가해야 합니다. 효율성에서 이익 / (이익 + 손실)의 비율을 취할 수 있습니다. 트랜잭션에 대한 효율성은 여전히 가능합니다.

효율성이라는 자전거 없이 합시다.

계량 경제학은 정보 기준을 사용합니다.

다음 은 정의입니다.

정보 기준 은 사용된 추정된 매개변수의 수에 대한 조정(페널티)과 함께 데이터에 대한 모델의 "적합" 정도를 고려하여 계량 경제학(통계)에 사용되는 계량 경제학(통계) 모델의 상대적 품질 측정입니다. . 즉, 기준은 모델의 정확도와 복잡성 사이의 일부 절충을 기반으로 합니다.

정보 기준은 이러한 기준 값에 대한 의미 있는 해석 없이 모델을 서로 비교하는 데만 사용됩니다. 그들은 통계적 가설을 테스트한다는 의미에서 모델을 테스트하는 것을 허용하지 않습니다. 일반적으로 기준 값이 작을수록 모델의 상대적 품질이 높아집니다 .


모델 선택을 가정하는 패키지를 선택하면 정보 기준 중 하나가 사용됩니다.

 
드미트리 :


Faa는 올바른 생각을 썼지만 잘못했습니다.

계열과 예측 변수 집합이 있습니다. 시리즈를 훈련 샘플과 앞으로(가장 단순한 경우)의 세 부분으로 나눕니다.

예를 들어 20개의 모델을 만듭니다.

결론은 목록에서 모델을 선택하는 것은 훈련 샘플의 최고 기준이 아니라 전방 최고 기준이 아니라는 것입니다. 그리고 훈련과 전방 모두에서 거의 동일한 품질 점수를 제공하는 모델이 선택됩니다.

우리 둘 다 옳다.

정보 기준이 사용되어 더 간단한 것을 선택할 수 있지만 정보 기준은 절대 테스트를 배제하지 않습니다.

 
산산이치 포멘코 :

효율성이라는 자전거 없이 합시다.

계량 경제학은 정보 기준을 사용합니다.

하나는 절대 다른 하나를 방해하지 않으며 대체하지 않습니다. 경제학에는 절대적으로 상응하는 효율성의 관점에서 효율성에 대한 기준이 있습니다. 아무것도 발명할 필요가 없습니다.

이 경우 우리는 과정이 아니라 결과를 평가합니다. 우리는 더 이상 프로세스의 기준에 관심을 두지 않습니다. 시스템은 블랙박스입니다. 여기에서 우리는 상자의 특성을 비교합니다.

투자 1 루블 당 효율성, 평균 거래 효율성 등 평가 기준도 있습니다. 전체 비즈니스는 이러한 기준에 따라 운영됩니다. 우리 뭐하는거야, 결국?

 
막심 드미트리예프스키 :
좋은. 시스템의 안정성을 높였습니다. 단점이 제거되었습니다. 총 이익이 떨어지지도 않고 일정하게 유지되더라도. 문제는 - 이전 버전에서 이러한 구멍에서 빠져나올 수 있었던 거래는 어디로 갔습니까? 그것들을 제거하지 않으면 시스템의 이익만 증가할 것입니다.
 
유리 아사울렌코 :
좋은. 시스템의 안정성을 높였습니다. 단점이 제거되었습니다. 총 이익이 떨어지지도 않고 일정하게 유지되더라도. 문제는 - 이전 버전에서 이러한 구멍에서 벗어날 수 있었던 거래는 어디로 갔습니까? 그것들을 제거하지 않으면 시스템의 이익만 증가할 것입니다.

다른 시간 간격으로 뉴런을 훈련시키면 다른 결과를 얻을 수 있고 비교할 대상도 전혀 없습니다. 다른 신호가 있고 모델이 다르게 학습하며 이것은 어떤 식으로든 영향을 받을 수 없습니다. 나는 아무것도 제거하지 않았다)
 
막심 드미트리예프스키 :

다른 시간 간격으로 뉴런을 훈련시키면 다른 결과를 얻을 수 있고 비교할 대상도 전혀 없습니다. 다른 신호가 있고 모델이 다르게 학습하며 이것은 어떤 식으로든 영향을 받을 수 없습니다. 나는 아무것도 제거하지 않았다)

옵티마이저가 제거된 것이 분명합니다. 그러나 결과의 반복성은 모든 실험의 요구 사항입니다. 저것들. 다른 영역에서 훈련할 때 테스트에서 다른 결과가 나온다면 이것이 생각해야 할 이유입니다.

하나의 TK를 사용하여 음성 인식을 위해 동일한 NN을 훈련하고 비교할 수도 없다고 선언한다고 상상해 보세요. 그들은 다르게 훈련되었습니다.

 
유리 아사울렌코 :

옵티마이저가 제거된 것이 분명합니다. 그러나 결과의 반복성은 모든 실험의 요구 사항입니다. 저것들. 다른 영역에서 훈련할 때 테스트에서 다른 결과가 나온다면 이것이 생각해야 할 이유입니다.

하나의 TK를 사용하여 음성 인식을 위해 동일한 NN을 훈련하고 비교할 수도 없다고 선언한다고 상상해 보세요. 그들은 다르게 훈련되었습니다.


네, 하지만 현재 모델에서는 불가능합니다. 작은 데이터 세트와 거대한 데이터 세트를 같은 방식으로 근사하는 것은 그렇게 복잡하지 않습니다.
 
막심 드미트리예프스키 :

네, 하지만 현재 모델에서는 불가능합니다. 작은 데이터 세트와 거대한 데이터 세트를 같은 방식으로 근사하는 것은 그렇게 복잡하지 않습니다.

일반적으로 분에 대해 이야기하면 시장은 통계적으로 동질적입니다. 통계는 매주, 매월, 거의 변하지 않습니다. 대규모 TF에서는 이 문제를 연구한 적이 없습니다. 내가 기억하는 한 당신은 1분 동안 일합니다.

원칙적으로 단순한 시스템이 수렴하면 더 빨리 수렴해야 합니다. 즉, 높은 최대값이 하나 있습니다. 그건 그렇고, 우리는 "잘못된" 예측자를 통해 이러한 추가 최대값을 스스로 생성합니다.

사유: