트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1298

 

배열에서 노이즈 값을 제거할 수 있는 이론적 가능성에 대해 이전에 이야기한 적이 있는 원래 모델은 다음과 같습니다.

그러나 이진 트리 응답의 가중치를 사용하여 배열에서 노이즈 0.01 ~ -0.01을 제거했습니다.

이익은 약간 낮지만 상대적인 성과는 향상되었습니다.

 

흠, 이미 -0.02에서 0.02로 이진 트리를 제거했습니다(값을 0으로 설정).

진보가 약하지 않은 것 같은데, 이는 여기에 합리주의의 핵심이 있다는 것을 의미합니다. 더 많은 연구가 필요합니다.

 
알렉세이 비아즈미킨 :

매우 원시적이라면 첫 번째 트리는 샘플에 대한 응답이 없고 0을 반환하고 네 번째 트리는 이 응답을 갖고 "확률" 0.6을 고려합니다. 기술적으로 첫 번째 트리의 오류를 수정했지만 실제로는 이전에는 전혀 존재하지 않았던 연결이 드러났습니다.

첫 번째 트리의 오류는 0일 뿐만 아니라 1일 수도 있습니다.

저것들. 첫 번째 트리가 1을 예측했지만 실제로 0이 있는 경우 후속 트리는 합계를 1에서 0으로 낮춰야 합니다. 즉, 2.3 등이 있습니다. 나무는 몇 번의 빼기로 N 단계 후에 첫 번째 나무에서 1을 0으로 줄이기 위해 부정적인 예측을 할 것입니다.

 
도서관 :

첫 번째 트리의 오류는 0일 뿐만 아니라 1일 수도 있습니다.

저것들. 첫 번째 트리가 1을 예측했지만 실제로 0이 있는 경우 후속 트리는 총계를 1에서 0으로 낮춰야 합니다. 즉, 2.3 등이 있습니다. 나무는 몇 번의 빼기를 통해 N 단계 후에 첫 번째 나무에서 1을 0으로 줄이기 위해 부정적인 예측을 할 것입니다.

물론 동의합니다. 그러나 이것은 본질을 바꾸지 않습니다. 나무가 찾는 패턴이 중요하며이 패턴의 해석은 별도의 알고리즘의 작업입니다.

 
알렉세이 비아즈미킨 :

그리고 저는 커뮤니티에 대해 잘 모릅니다. 다른 지역의 다른 사람들은 어떻게 하는지 몰라요?

내가 MO를 사용하여 인간 행동(또는 알고리즘)의 모델을 찾고 있기 때문에 데이터를 가져오는 것이 논리적으로 보입니다. 그러한 행동 패턴이 많이 있을 수 있고 독립적일 수 있으므로 가능한 한 많이 꺼내는 것이 합리적입니다. , 모든 것을 함께 일반화하는 방법은 불가능합니다. 그리고 일부의 경우 시장은 집합적인 마음의 작업 결과, 규칙이 없는 특정 투표 기관의 결과이며, 분명히 이 상황에 대해 올바르게 설명하는 하나의 모델을 찾고 있습니다. 유기체.

글쎄, 당신이 그것의 일부일 때 어떻게 알지 못합니까?)

아마도 내가 공유하기 때문에 처음에는 수동 루틴 없이 스스로 모든 것을 선택하는 AI와 같은 것을 만드는 것이 작업이었습니다. 그런 것을 디자인할 때만 루틴

수백 / 수천 개의 모델을 수동으로 정렬하고 거기에서 무언가를 선택하는 방법을 상상할 수 없습니다. 반대로 차량을 악몽으로 "발명"하는 것은 잊고 싶습니다.

 
막심 드미트리예프스키 :

글쎄, 당신이 그것의 일부일 때 어떻게 알지 못합니까?)

아마도 나는 공유하기 때문에 처음에는 수동 루틴 없이 스스로 모든 것을 선택하는 AI와 같은 것을 만드는 것이 작업이었습니다. 그런 것을 디자인할 때만 루틴

수백 / 수천 개의 모델을 수동으로 정렬하고 거기에서 무언가를 선택하는 방법을 상상할 수 없습니다. 반대로 차량을 악몽으로 "발명"하는 것은 잊고 싶습니다.

그래서 각 모델을 개별적으로 분석하는 방법을 모릅니다. 그래서 일괄 처리에 집중했습니다. 개별 모델은 모델 생성 주기의 전체 알고리즘을 개선하고 새로운 아이디어를 찾기 위해 세부적인 분석을 받습니다.

문제는 완전히 다른 결과를 제공하는 수십만 개의 모델 변형이 있을 때 결과를 개선하기 위해 정확히 무엇을 해야 하는지 이해하기 어렵다는 것입니다. 이것이 제가 가장 큰 문제가 되는 부분입니다. 4개의 예측자 중 하나에서 흥미로운 모델이 얻어지고 새로운 예측자를 추가할 의미가 없어 보이지만 더 많은 모델을 생성해야 합니다. 반대로 많은 예측자가 사용되며 훈련 샘플이 더 많은 영향을 미치고 더 많은 매개변수가 있습니다. CatBoost 자체의 교육용. 그래서 100k당 2~3개 정도는 모델을 많이 생성해서 저장하고 좀 더 자세히 공부해야 한다고 생각하는 경향이 있습니다.

 
알렉세이 비아즈미킨 :

그래서 각 모델을 개별적으로 분석하는 방법을 모릅니다. 그래서 일괄 처리에 집중했습니다. 개별 모델은 모델 생성 주기의 전체 알고리즘을 개선하고 새로운 아이디어를 찾기 위해 세부적인 분석을 받습니다.

문제는 완전히 다른 결과를 제공하는 수십만 개의 모델 변형이 있을 때 결과를 개선하기 위해 정확히 무엇을 해야 하는지 이해하기 어렵다는 것입니다. 이것이 제가 가장 큰 문제가 되는 부분입니다. 4개의 예측자 중 하나에서 흥미로운 모델이 얻어지고 새로운 예측자를 추가할 의미가 없어 보이지만 더 많은 모델을 생성해야 합니다. 반대로 많은 예측자가 사용되며 훈련 샘플이 더 많은 영향을 미치고 더 많은 매개변수가 있습니다. CatBoost 자체의 교육용. 따라서 100k당 2~3개 정도는 모델을 많이 생성해서 저장 한 후 좀 더 자세히 공부해야 한다고 생각하는 경향이 있습니다.

네, 이와 같이 가능한 한 많이 자동화하는 것이 바람직합니다. 그래야 나중에 커피 한 잔보다 가장 좋아하는 것이 진부한 선택이 될 수 있습니다.

하기 어렵다는 점에 동의하지만, 그러면 일반 분류기가 아닌 khukhra muhra가 아니라 AI가 될 것입니다.

후자의 경우 - AutoML이 있습니다. - 신경망 자체가 최고의 신경망 또는 특정 작업에 대한 모델 세트를 선택하는 것도 좋습니다. 아직 사용하지 않았습니다
 
막심 드미트리예프스키 :

네, 이와 같이 가능한 한 많이 자동화하는 것이 바람직합니다. 그래야 나중에 커피 한 잔보다 가장 좋아하는 것이 진부한 선택이 될 수 있습니다.

하기 어렵다는 점에 동의하지만, 그러면 일반 분류기가 아닌 khukhra muhra가 아니라 AI가 될 것입니다.

이제 훈련 후 결과는 스크립트(모델 인터프리터 없이 - CatBoost 계산 결과에 따라)에 의해 처리되며 100,000개 모델 중 세 가지 모두에서 지정된 기준(모델 기준 및 거래 기준)을 충족하는 모델이 처리됩니다. 샘플이 얻어지고 약 50-100개 모델이 얻어지고, 그것들은 이미 터미널에서 재생을 위해 변환 중이며 거기에서 후속적인 더 자세한 선택을 위해 두 번째 패스를 수행하고 있습니다. 원칙적으로는 정확히 무엇을 원하는지 알면 터미널에서 실행하지 않아도 되지만, 지금은 선택 기준을 찾는 중이고 다양한 모델을 시각적으로 살펴보는 것도 무리는 아니라고 생각합니다. 그래서 스크립트를 사용하여 균형 곡선을 바로 저장할 수 있지만 차트로 작업하는 방법을 모릅니다. 손으로 파악하지 못합니다.

파이썬에서 한 번에 많은 모델을 생성할 수 있는지는 모르겠지만 관심이 있다면 이 작업을 수행하는 배치 파일을 버릴 수 있습니다.

 
알렉세이 비아즈미킨 :

이제 훈련 후 결과는 스크립트(모델 인터프리터 없이 - CatBoost 계산 결과에 따라)에 의해 처리되며 100,000개 모델 중 세 가지 모두에서 지정된 기준(모델 기준 및 거래 기준)을 충족하는 모델이 처리됩니다. 샘플이 얻어지고 약 50-100개 모델이 얻어지고, 그것들은 이미 터미널에서 재생을 위해 변환 중이며 거기에서 후속적인 더 자세한 선택을 위해 두 번째 패스를 수행하고 있습니다. 원칙적으로는 정확히 무엇을 원하는지 알면 터미널에서 실행하지 않아도 되지만, 지금은 선택 기준을 찾는 중이고 다양한 모델을 시각적으로 살펴보는 것도 무리는 아니라고 생각합니다. 그래서 스크립트를 사용하여 균형 곡선을 바로 저장할 수 있지만 차트로 작업하는 방법을 모릅니다. 손으로 파악하지 못합니다.

파이썬에서 한 번에 많은 모델을 생성할 수 있는지는 모르겠지만 관심이 있다면 이 작업을 수행하는 배치 파일을 버릴 수 있습니다.

파이썬으로 무엇이든 할 수 있습니다.

아니오, 아직 아닙니다. 감사합니다. 재미있는 책을 읽었습니다. 저도 python에서 catbust를 사용했는데, 숲과 비교했을 때 큰 개선 사항은 없었지만 자체적으로 조정되고 멋지게 작동합니다. 실제로 몇 줄에.

 
막심 드미트리예프스키 :

AutoML - 신경망 자체가 특정 작업에 가장 적합한 신경망 또는 모델 세트를 선택합니다. 아직 사용하지 않았습니다

예, 비슷한 작업을 수행했습니다. 질문은 다시 예측 변수 및 선택 기준(목표)에 있습니다. 이제(수개월 후) 예측자로 모든 아이디어를 끝내고 이 주제로 돌아갑니다. 결과는 일반적으로 이전에 유사한 모델이 작동하는 방식을 게시했지만 다른 모델의 다양한 샘플이 필요합니다.

그리고 이 AutoML은 예측자와 대상으로 무엇을 사용합니까?

사유: