트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3282

 
Aleksey Vyazmikin #:

2010년부터 2023년까지 샘플(4만 7천 줄)을 시간 순서대로 3개 부분으로 나누어 이 부분을 교체하면 어떤 일이 일어나는지 살펴보기로 했습니다.

하위 샘플의 크기는 훈련 - 60%, 테스트 - 20%, 시험 - 20%입니다.

이 조합(-1)을 표준 순서인 시간순으로 만들었습니다. 각 하위 샘플에는 고유한 색상이 있습니다.


각 샘플 세트에 대해 서로 다른 시드를 사용하여 101개의 모델을 훈련한 결과 다음과 같은 결과를 얻었습니다.


모든 지표가 표준이며, 모델의 평균 수익(AVR 수익)과 훈련에 참여하지 않은 마지막 샘플에서 수익이 3000 포인트를 초과하는 모델의 비율을 결정하기 어렵다는 것을 알 수 있습니다.

훈련 샘플 크기에서 -1 및 0 변형의 상대적 성공률을 줄여야 할까요? 일반적으로 Recall이 이에 반응하는 것 같습니다.

이러한 조합의 결과가 우리의 경우 서로 비슷해야 한다고 생각하시나요? 아니면 데이터가 복구할 수 없을 정도로 오래된 것일까요?

또 다른 스스로 ...

교차 검증이 있고, 모든 것이 씹고 씹고 ..., 널리 사용됩니다....

 
СанСаныч Фоменко #:

또 다른 자작곡...

교차 검증이 있고, 모든 것이 씹고 씹고 ..., 널리 사용됩니다.....

그게 문제입니다. 교차 유효성 검사는 여기서 효과적으로 작동하지 않을 수 있습니다.

그리고이 자체 설계의 요점은 무엇입니까? 맥심은 연대순으로 샘플을 뒤집어 결과가 동일할 것이라고 가정하지만, 제 실험은 오류를 보여줍니다. 또는 모든 것이 개별적이며 검증을 통해 샘플 전체에서 임의의 패턴이나 발생이 나타날 수 있습니다.

 
Aleksey Vyazmikin #:

교차 유효성 검사는 여기서 효과적으로 작동하지 않을 수 있습니다.

그리고 이 자기 거래는 어디에 있을까요? Maxim은 결과가 동일할 것이라고 가정하고 샘플을 시간순으로 뒤집는데, 제 실험은 이 오류를 보여줍니다. 또는 모든 것이 개별적이며 검증을 통해 샘플 전체에서 임의의 패턴이나 발생이 나타날 수 있습니다.

특히 제안된 일을 하지 않았거나 생각조차 하지 않았을 때 화살표를 Maxim에게로 옮기지 마세요.

 
Maxim Dmitrievsky #:

특히 맥심이 제안한 사항을 하나도 이행하지 않았는데도 맥심에게 뒤집어씌우면 안 됩니다.

안 했다니 무슨 뜻이죠? 이미 모델에게 가장 최근의 역사를 교육하고 있지 않나요?

 
fxsaber #:

매트릭스가 처리할 수 없는 경우.

10M 길이의 문자열에서 30K 길이의 비슷한 문자열을 찾는 데 3초가 걸립니다.

이것은 가능한 모든 상관 관계 패턴을 계산하는 것이 아니라 소스를 다른 데이터와 비교하는 것입니다. 매트릭스는 필요 없고 벡터만 있으면 됩니다.

 
Aleksey Vyazmikin #:

안 했다니 무슨 뜻이죠? 이미 가장 최근의 기록으로 모델을 훈련시키지 않았나요?

누가 먼저 그런 말을 했는지 기억이 안 나네요. 어떤 샌님이요 제 경우는 상관없어요.

 
Maxim Dmitrievsky #:

누가 먼저 그런 말을 했는지 기억이 나지 않습니다. 제 경우에는 상관없습니다.

여러분의 경우는 저와 어떻게 다른가요?

 
Aleksey Vyazmikin #:

여러분의 사례는 저와 어떻게 다른가요?

나는 문맹 인 궤변가 및 심리학자들과 의사 소통하는 것을 좋아하지 않기 때문입니다.)

그런 사람들은 유용한 콘텐츠를 생산하지 않습니다.

 
Maxim Dmitrievsky #:

문맹인 궤변가나 심리학자들과 이야기하는 것을 좋아하지 않기 때문입니다.)

그런 사람들은 유용한 콘텐츠를 생산하지 않습니다.

'사랑'이 데이터에 마법 같은 방식으로 영향을 미치나요?

 
Maxim Dmitrievsky #:

이것은 가능한 모든 상관 관계 패턴을 계산하는 것이 아니라 소스를 다른 데이터와 비교하는 것입니다. 여기에는 행렬이 필요하지 않으며 벡터로 충분합니다.

이것이 행렬의 라인별 계산의 핵심입니다.

사유: