트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2878

 
Maxim Dmitrievsky #:

해시 함수를 사용해 볼 수 있다는 것은 분명합니다. 그러나 임의의 길이의 벡터를 선택하는 원칙 또는 오히려 길이:) 및 데이터에서 어떤 원칙을 선택해야하는지 물어 보는 것이 부끄럽습니다.

많은 변형이있을 수 있습니다.

첫 번째 옵션이 더 즐겁지만 논리에 무언가를 넣어야합니다.

이것은 매우 중요한 질문이며 항상 생각하고 있습니다.) 사용 된 기록의 길이에 대해 이야기 해 봅시다. 계산을 위해서는 관련성과 길이 사이에서 합리적인 타협이 필요합니다. 짧을수록 관련성이 높지만 길수록 계산이 더 정확해집니다. 때로는 원칙적으로 좋은 타협점을 찾을 수 없는 경우도 있습니다.

 
Maxim Dmitrievsky #:

창 길이를 변경하는 과정에서 흥미로운 점을 발견하기도 했습니다.

더 궁금한 점이 있으시면 스케치해 주세요. 새해가 지나고 나서 물어볼게요.

좋아요, 우리 모두 새해 복 많이 받으세요!)

 
Aleksey Nikolayev #:

모두 새해 복 많이 받으세요 :)

마찬가지로 :)

 

GPT 대화에서 무엇을 얻었는지 잘 모르겠습니다.

가끔 엉뚱한 대답을 하기도 합니다. 예를 들면 다음과 같습니다.

В идеале, алгоритм должен получать на вход всю доступную историю, которая очевидно со временем растёт. Он сам должен определять на какие куски её нарезать и что с ними делать.

*예, 이상적으로는 알고리즘이 여러 기능을 처리할 수 있어야 합니다.

다양한 행 길이에 대해 질문했는데, 그는 다양한 열 길이에 대해 대답했습니다.

실제로는 모델을 재학습하여 기록의 길이를 변경할 수 있습니다. 예를 들어 1일, 3일, 7일, 한 달, 2일, ... 1년, 2년, 3년 ... 어떤 길이의 히스토리가 잘 예측되든 사용하세요.
 
Aleksey Nikolayev #:

매우 중요한 질문이고 항상 고민하고 있습니다.) 사용된 기록의 길이에 대해서만 이야기해 보겠습니다. 계산을 위해 관련성과 길이 사이에 합리적인 절충점을 찾아야 합니다. 짧을수록 관련성이 높지만 길수록 계산이 더 정확해집니다. 때로는 원칙적으로 좋은 타협점을 찾을 수 없는 경우도 있습니다.

저도 오래 전에이 질문에 대해 궁금해했는데, 임호, 그것은 작동하는 TS를 구축하는 가장 중요한 순간 중 하나입니다. 저는이 접근 방식을 사용합니다. 알려진 대규모 역사에서 금융 자산의 일부 특성을 대략적으로 분석하고 추세, 변동성 등 변화하는 추세의 좌표를 찾은 다음이 글로벌 특성이 한동안 유지 될 것이라고 가정하여 마지막 변경 지점부터 작업합니다.

 
elibrarius 행 길이에 대해 질문했는데 그는 다양한 열 길이에 대해 대답했습니다.
실제로는 모델을 재학습하여 기록의 길이를 변경할 수 있습니다. 예를 들어 1일, 3일, 7일, 한 달, 2일, ... 1년, 2년, 3년 ... 중 어느 길이의 기록이 더 잘 예측되는지 훈련하고 그 길이를 사용하세요.

열은 아직 전혀 논의되지 않았으며 아직 멀었습니다. 혼란은 표지판이 가격 (바, 렌코 등)이라고 말하지 않았기 때문입니다. 즉, 우리는 동질적인 속성의 벡터의 임의의 길이에 대해 이야기하고 있습니다. 속성 벡터의 임의 길이에 더해 임의의 유형의 속성을 원한다면 이미 명백한 과잉입니다.

 
Aleksey Nikolayev #:

문제는 SB가 규칙이 있는 것처럼 보이게 만드는 데 꽤 능숙하다는 것입니다. 문제는 사이트마다 규칙이 다를 수 있다는 것입니다.

생각해 보면, 이는 임의의 기능 수가 문제가 아니라 애초에 기능 불변성의 문제입니다.

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf
 
Aleksey Nikolayev #:

매우 중요한 질문이고 항상 고민하고 있습니다.) 사용된 기록의 길이에 대해서만 이야기해 보겠습니다. 계산을 위해 관련성과 길이 사이에 합리적인 절충점을 찾아야 합니다. 짧을수록 관련성이 높지만 길수록 계산이 더 정확해집니다. 때로는 원칙적으로 좋은 타협점을 찾을 수 없는 경우도 있습니다.

기준이 필요하며 유일한 기준은 모델 피팅 오류입니다.

다음은 그림입니다.


이것은 2000개의 막대, 43개의 변수로 구성된 샘플입니다. 트리 수를 100개 이상으로 늘리는 것은 무의미하다는 것을 알 수 있습니다. 샘플 크기를 변경했습니다. 그 결과 그림은 1500개 이상의 막대에서는 변하지 않습니다. 즉, 선생님에 대한 예측 변수의 패턴 수는 약 100개이며 1500개의 막대에서 모두 찾을 수 있습니다. 또한 이러한 패턴이 반복됩니다.

 
mytarmailS #:

생각해 보면 임의의 기능 수가 문제가 아니라 애초에 기능 불변성의 문제입니다.

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf

그림 인식에 비유하자면, 각 점마다 그 점이 위치한 물체(블롭)의 경계를 찾는 문제입니다.

문제는 사진의 품질이 매우 낮고 실제로 무엇이 그려져 있는지 명확하지 않다는 것입니다.

이러한 조건에서 작은 물체를 선택하는 것은 비현실적이며 큰 물체는 모호하게 선택됩니다.

 
СанСаныч Фоменко #:

기준이 필요한데, 유일한 기준은 모델 피팅 오류입니다.

다음은 그림입니다.


이것은 2000개의 막대, 43개의 변수로 구성된 샘플입니다. 트리 수를 100개 이상으로 늘리는 것은 무의미하다는 것을 알 수 있습니다. 샘플 크기를 변경했습니다. 그 결과 1500개 막대 이상에서는 그림이 변하지 않습니다. 즉, 선생님에 대한 예측 변수의 패턴 수는 약 100개이며 1500개의 막대에서 모두 찾을 수 있습니다. 또한 이러한 패턴이 반복됩니다.

1500바는 병원의 평균 온도입니다. 역사의 절반이 매우 다른 경우와 아무것도 세거나 거래하지 않는 것이 더 나은 경우 중단 지점이 있습니다.

사유: