트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩

mytarmailS 2023.04.11 12:35 #30211

Maxim Dmitrievsky #:
그런 개발이 아니라 렉서스가 있는 차고가 필요해요.

시장이 무엇인지 이해하지 못하면 파스타 한 봉지도 만들 수 없습니다.

Maxim Dmitrievsky 2023.04.11 12:38 #30212

mytarmailS #:

시장이 무엇인지 이해하지 못하면 파스타 한 봉지도 없을 것입니다.

FF는 렉서스가 있는 차고입니다. 달리 어떻게 설명할 수 있을지 모르겠습니다.

mytarmailS 2023.04.11 12:43 #30213

Maxim Dmitrievsky #:
FF는 렉서스가 있는 차고입니다. 달리 설명할 방법이 없네요.

설명할 필요 없어 난 다 컸으니까

당신은 하나의 의견을 가지고 있고 나는 다른 의견을 가지고 있습니다.

내 의견은 내 경험이지 말로 바꿀 수 없어요.

Maxim Dmitrievsky 2023.04.11 13:22 #30214

mytarmailS #:

설명할 필요 없어요 전 다 컸으니까요

당신은 한 가지 의견이 있고 저는 다른 의견이 있습니다.

내 의견은 내 경험이고 말로 바꿀 수 없어요.

슬픈 점은 의견이 아니라 사실이라는 겁니다.

FF 대신 대머리 악마를 그려서 맞출 수 있습니다.

mytarmailS 2023.04.11 13:30 #30215

Maxim Dmitrievsky #:
슬픈 점은 이것이 의견이 아니라 사실이라는 것입니다.

FF 대신 대머리 악마를 그리고 그에 맞게 조정할 수 있습니다.

당신은 지금 당신이 무슨 말을하고 있는지조차 깨닫지 못합니다))))

마치 MT의 옵티마이저가 옵티마이저가 아니며 FF가 아닌 최적화하는 것처럼

Maxim Dmitrievsky 2023.04.11 13:40 #30216

mytarmailS #:

지금 무슨 말을 하고 있는지조차 깨닫지 못합니다.)

마치 MT의 옵티마이저는 옵티마이저가 아니며 FF가 아닌 최적화를 하는 것처럼 말입니다.

그게 MT와 무슨 상관이 있을까요? 생산 최적화에 대해 들어본 적이 있나요? 실제로 상호 의존적인 프로세스가 있지만 효율성을 개선해야 하는 경우입니다.

완성된 모델에 대한 SL/TP 최적화도 마찬가지입니다.

그리고 FF를 사용하여 쓰레기 더미에서 대머리 악마를 만들고 있습니다.

정말, 끝내자, 마치 남학생에게 말하는 것처럼 말도 안 되는 소리입니다.

mytarmailS 2023.04.11 15:34 #30217

R용 TORCH 책이 드디어 출시되었습니다.

향후 DL 마법사가 있다면 꼭 읽어보세요.

Aleksey Vyazmikin 2023.04.11 19:53 #30218

Rorschach #:

이 방법을 사용해 보셨나요? (페이지 중간쯤에 있는 모델 해석 섹션을 찾아보세요).

링크 주셔서 감사합니다 - 마침내 파이썬에서 실험을 시작할 때 매우 유용할 것 같습니다!

이 책은 새로운 스타일의 책인가요? 다른 자료가 있나요?

질문에 답하기 위해-잎 컬링을 할 때 직접 사용한 것은 없습니다.

저는 의사 결정 트리의 숲으로 작업하지 않았기 때문에 원칙적으로 제안된 여러 가지 기술을 사용하지 않았습니다. 그러나 예를 들어 특정 잎의 오차 분산을 추정하여 앙상블에서 잎의 가중치를 결정하는 데 사용한 것과 같이 비슷한 것을 사용했습니다.

분할 추정에서 예측 변수의 중요성은 CatBoost에도 존재하지만, 그라데이션 부스팅에서는 트리가 의존적이고 순차적이기 때문에 지표에 대한 이해를 조정해야 합니다. 트리 구성을 평가하는 지표 자체는 상당히 논란의 여지가 있으며, 욕심 원칙이 모든 데이터에 잘 적용되지는 않습니다. 하지만 8개의 샘플 간격에 걸쳐 100개의 모델의 평균 점수를 사용하여 CatBoost 모델의 예측자를 선택했는데, 평균적으로 이 방법은 훈련 결과를 개선했습니다. 이 실험은 이 스레드에 자세히 게시되어 있습니다.

제안 된 버전에서 빈도 상관 관계를 시도하지 않았습니다. 이진 예측자와 잎을 그룹화하는 나만의 방법을 발명하여 너무 유사한 이진 예측자와 잎을 버릴 수 있습니다. 제 알고리즘이 최적이 아니기 때문에 파이썬 구현이 더 빨리 실행되어야 한다고 생각하며 이해를 위해 비교해야 합니다.

많이 변경된 예측자를 선택하는 아이디어는 바빠서 시도해 봐야 할 것 같습니다. 그러나 실제로 위에서 설명한 실험에서는 최종 훈련을 위해 그러한 예측자를 사용하지 않는 것으로 간단히 수행했습니다. 변수의 과거 행동을 기반으로 변수의 변화 경향을 감지하는 방법과 변동이 예측 변수의 확률 분포 평균 범위의 변화로 되돌릴 수 없게 된 순간을 이해하는 것이 더 좋을 것입니다. 종이에 아이디어는 있지만 이를 코딩해야 합니다.

특정 행에 대한 솔루션에 대한 각 예측자의 기여도를 시각화로 평가하는 것은 재미있지만 모델 예측자의 수가 많을 때는 거의 쓸모가 없습니다. 하지만 저는 비슷한 작업을 수행했는데, 여기 스레드에 하나의 클러스터를 게시하여 각 행을 예측하는 데 사용된 모델의 시트 수와 색상별로 리트 응답의 중요도를 강조했습니다. 대부분의 잎이 모델에서 활성화되지 않는 것으로 나타났습니다. 즉, 패턴이 전혀 발생하지 않는 것으로 나타났는데 이에 대해 생각하는 사람은 거의 없었습니다.

제가 놓친 아이디어가 있나요? 그렇다면 구체적으로 적어주세요 - 설명해 드리겠습니다.

신경망에서 사용하기 위해 범주형 기능을 코딩하는 아이디어에 대해 이해하지 못했습니다. 과거 자료에 대한 참조가 있습니다.

혼돈에 패턴이 있을까요? 찾아보겠습니다! 진입점 머신 러닝 및 신경망

Stanislav Korotky 2023.04.11 21:00 #30219

Slava #:

알겠습니다. 손실 함수는 벡터와 마찬가지로 행렬에서도 작동합니다. 여기서 우리는 완료하지 못했습니다(축 매개 변수를 추가하지 않았습니다).

즉, 예제에서는 한 줄씩 풀어야 합니다.

관심을 가져주셔서 감사합니다.

네, 이해합니다. 하지만 벡터, 특히 LOSS_BCE에 문제가 있습니다:

double bce(const vector &truth, vector &pred)
{
   double sum = 0;
   pred.Clip(DBL_EPSILON, 1 - DBL_EPSILON);
   const int n = (int)truth.Size();
   for(int i = 0; i < n; ++i)
   {
      sum += truth[i] * MathLog(pred[i]) + (1 - truth[i]) * MathLog(1 - pred[i]);
   }
   return sum / -n;
}

void OnStart()
{
   vector actual_values = {0, 1, 0, 0, 0, 0};
   vector predicted_values = {.5, .7, .2, .3, .5, .6};     // 0.53984624 - keras (correct answer)
   Print(actual_values.Loss(predicted_values, LOSS_BCE));  // 0.6798329317196582 - mql5 API
   Print(bce(actual_values, predicted_values));            // 0.5398464220309535 - custom
}

다시 한 번 API 결과가 예상 결과와 일치하지 않습니다.

Maxim Dmitrievsky 2023.04.12 07:20 #30220

Aleksey Vyazmikin #:

링크 주셔서 감사합니다 - 마침내 파이썬에서 실험을 시작할 때 매우 유용할 것 같습니다!

이 책은 새로운 스타일의 책인가요? 다른 자료도 있나요?

질문에 답하자면, 리프 선택을 할 때 직접적으로 사용된 것은 없습니다.

저는 의사 결정 트리의 숲으로 작업하지 않았기 때문에 원칙적으로 제안된 여러 가지 기법을 사용하지 않았습니다. 그러나 예를 들어 앙상블에서 리프의 가중치를 결정하기 위해 특정 리프의 오차 분산을 추정하는 등 비슷한 기법을 사용했습니다.

분할 추정에서 예측 변수의 중요성은 CatBoost에도 존재하지만, 그라데이션 부스팅에서는 트리가 종속적이고 순차적이기 때문에 지표에 대한 이해를 조정해야 합니다. 트리 구성을 평가하는 지표 자체는 상당히 논란의 여지가 있으며, 욕심 원칙이 모든 데이터에 잘 적용되지는 않습니다. 하지만 8개의 샘플 간격에 걸쳐 100개의 모델의 평균 점수를 사용하여 CatBoost 모델의 예측자를 선택했는데, 평균적으로 이 방법은 훈련 결과를 개선했습니다. 이 실험은 이 스레드에 자세히 게시되었습니다.

제안 된 버전에서 빈도 상관 관계를 시도하지 않았습니다. 이진 예측자와 잎을 그룹화하는 나만의 방법을 발명하여 너무 유사한 이진 예측자와 잎을 버릴 수 있습니다. 내 알고리즘이 최적이 아니므로 이해를 위해 비교해야하므로 파이썬 구현이 더 빨리 실행되어야한다고 생각합니다.

많이 변경된 예측자를 선택하는 아이디어는 바빠서 시도해 봐야 할 것 같습니다. 그러나 실제로 위에서 설명한 실험에서는 최종 훈련을 위해 그러한 예측자를 사용하지 않는 것으로 간단히 수행했습니다. 변수의 과거 행동을 기반으로 변수의 변화 경향을 감지하는 방법과 변동이 예측 변수의 확률 분포 평균 범위의 변화로 되돌릴 수 없게 된 순간을 이해하는 것이 더 좋을 것입니다. 종이에 아이디어가 있는데 코딩해야 합니다.

특정 행에 대한 솔루션에 대한 각 예측자의 기여도를 시각화 형태로 평가하는 것은 재미있지만 모델 예측자의 수가 많은 경우에는 거의 쓸모가 없습니다. 하지만 저는 이 스레드에 비슷한 작업을 수행하여 각 행을 예측하는 데 사용된 모델의 시트 수와 색상별로 리트 응답의 중요성을 강조했습니다. 그 결과 대부분의 나뭇잎이 모델에서 활성화되지 않는 것으로 나타났습니다. 즉, 패턴이 전혀 발생하지 않는 것으로 나타났습니다.

제가 놓친 아이디어가 있나요? 그렇다면 구체적으로 적어주세요. 설명해 드리겠습니다.

신경망에서 사용하기 위해 범주형 기능을 코딩하는 아이디어에 대해 이해하지 못했습니다. 과거 자료에 대한 참조가 있습니다.

이것은 쉽게 자동화되며 사람의 개입없이 작동합니다.

지난 기사에서 비슷한 알고리즘을 보여 드렸습니다.

본질적으로 모델 오류를 필터링하고이를 별도의 클래스 "거래하지 않음"에 넣고 곡물과 왕겨를 분리하는 방법을 배우는 두 번째 모델을 통해 더 잘 처리합니다.

그리고 첫 번째 모델에는 곡물만 남습니다.

트리 규칙과 동일하지만 측면에서 보면 마찬가지입니다. 그러나 규칙을 강탈하고 서로 비교해야하며 거기에서 출력은 정제 된 TC입니다.

예를 들어, 왕겨에서 곡물을 선택하는 첫 번째 반복(세로 점선 왼쪽 - OOS)입니다:

그리고 여기에 10번째가 있습니다:

트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3022