트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2742

 
Aleksey Nikolayev #:

생존 분석 애플리케이션의 힌트를 본 것 같습니다.

직접 해보지는 않았지만 비슷한 질문을 한 적이 있습니다. 이 접근 방식은 저에게는 유망해 보이지만 완전히 다른 영역에서 나온 것입니다.

 
СанСаныч Фоменко #:

classDist {캐럿}, 즉 캐럿 패키지의 일부인 특정 함수를 지정합니다.

내가 알기로, 당신은 R을 모릅니다. 그렇다면 왜이 스레드와 일반적으로 MO에 시간을 낭비하고 있습니까?

R에 대한 숙달 없이는 MO에 대한 논의는 무의미합니다.

교차 엔트로피가 분류 모델의 표준 손실 함수이기 때문에 엔트로피에 대해서만 침묵을 지켰습니다.... MO는 R에서만 구현되는 것이 아닙니다! (하나의 라이브러리만 알고 그 라이브러리가 작동하는 엔티티의 특성을 모른다면 운동의 방향을 이해하지 못하고 가는 것과 같습니다).

더 어려운 질문-"정보 이론"에 대해 선언 할 때 왜 통계와 단호하게 분리합니까?... 정확히 만들어졌지만

이 분야는 수학 , 통계 , 컴퓨터 과학 , 물리학 , 신경 생물학 , 정보 공학 및 전기 공 학의 교차점에 있습니다.

실제로 토론은 대화의 주제가 아니라 스 니펫과 자아 (그리고 심지어 자신뿐만 아니라 누군가에 대해서도)에서 작동한다면 주제가 없습니다 ... 불행히도 스레드는 변경되지 않습니다 (답변의 구체성과 주제가 추가되지 않음).
 
Maxim Dmitrievsky #:
다시 한 번 이 둔한 대변인은 모든 사람을 진실로 부르고 있지만 아직 결정하지 않았습니다

당신은 이미 사회자를 너무 지루하게 만들어서 모든 것을 무너 뜨리고 있습니다.

(그의 게시물 "연회를 계속하라"는 도발과 요구입니다.)
어제 저는 인신 공격으로 욕설과 욕설이 담긴 여러 게시물을 삭제했으며, 이에 따라
JeeyCi의 게시물을 삭제했습니다 .

스레드에서 두 번의 경고를 했지만 무시당했고, 욕설이 담긴 게시물을 여러 개 삭제했습니다.
(전혀 읽을 수 있었던) 유일한 문학적 게시물은 어제 모든 것을 시작한 이 게시물뿐이었습니다:

트레이딩, 자동매매 시스템 및 테스트 트레이딩 전략에 대한 포럼

...

막심 드미트리예프스키, 2022.09.10 12:15

모델 기반, 모델 불가지론 및 혼합 기능 선택이 있습니다. 불가지론을 취하면 상관 관계와 상호 정보 (엔트로피 기반)입니다. 후자는 비선형 종속성을 포착할 수 있다는 점에서 전자와 다르지만, 그 외에는 동일합니다. 이 경우 특징과 타깃의 관계에 대해 이야기하는 것은 어렵고 심지어 불가능합니다. 단지 상관관계일 뿐입니다. 하지만 정보가 없는 피처를 제거하는 것은 유용합니다.

슬라이딩 창, 애매한 창, 슬라이딩 창 또는 문지르는 창에서 할 수 있습니다.

인과 관계를 구체적으로 결정하려면 시계열에 적용하는 방법을 모르거나 주제를 연구하지 않은 MO를 사용하는 것을 포함하여 인과 관계 추론입니다.

그리고 이전의 모든 방법은 인과 관계를 찾는 데는 효과가 없지만 알고리즘을 최적으로 훈련하는 데만 효과가 있습니다.

그래서 다시 한 번 시민들은 집중할 수없고 커틀릿에서 파리를 제거 할 수 없습니다.

위대하고 전능 한 R에 대해 우리는 이미 여러 번 들었습니다. 분명히 원숭이를 그 뒤에두면 원숭이도 스스로를 통계 학자이자 분석가라고 생각할 수 있습니다.

예, 예를 들어 어제처럼 반나절 동안 두 페이지의 텍스트가 지속되는 경우 특히 욕설을 가끔 삭제합니다.

----------------

이 스레드는 매우 인기가 있습니다(영어권 포럼에서도 읽히며 이 주제에 대한 핵심 스레드로 간주됩니다).
그러니 제발-욕설을 줄이세요.

 
mytarmailS #:

어느 정도 성공한 트레이더의 TS를 분석해보면 모든 트레이더의 거래 레벨이 비슷하다는 것을 알 수 있습니다.

인디케이터의 도움으로 거래하는 성공적인 트레이더는 한 명도 본 적이 없습니다.

레벨은 명확한 스톱이 있는 명확하고 이해하기 쉬운 진입점입니다....

낮은 위험으로 거래 할 수 있다면 다른 것은 필요하지 않습니다. 거래 당 낮은 위험 / 정확한 진입이 가장 중요합니다!

MO의 도움으로 정확한 항목의 PD / SP 수준을 찾을 수 있으며, 사소하지 않고 간단하지 않으며 여기에서 MO에 대한 블로그에서 읽을 수 없으며 자신의 머리를 사용해야합니다.....

sb 차트에 레벨을 그릴 수도 있으며 시계열이기도합니다. 모두들 충분히 들었으니 더 이상 답변하지 않겠습니다. 매일같이 쓰레기 같은 얘기만 하고 있잖아요.
 
mytarmailS #:

다음은 5개의 특성과 1개의 이진 타겟으로 무작위로 생성된 샘플의 예입니다.

포레스트 및 피시 셀렉터

작업 대기열이 약간 언로드되어 스크립트를 실행할 수 있게 되었습니다. 스크립트를 실행하면 오류가 발생합니다.

> install.packages("randomForest")
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Installing package into ‘C:/Users/S_V_A/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Warning in install.packages :
  package ‘randomForest’ is not available (for R version 4.0.5)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/bin/windows/contrib/4.0:
  cannot open URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/PACKAGES'

> library(randomForest)
Error in library(randomForest) : нет пакета под названием ‘randomForest’

프로그램이 이전 버전의 R 4.0을 원한다는 것을 올바르게 이해했나요?

글쎄요, 이전 버전을 검색했지만 찾지 못했습니다. 물론 끔찍한 비호환성은 혐오스럽습니다.

 
Aleksey Vyazmikin #:

작업 대기열이 약간 언로드되어 스크립트를 실행할 수 있게 되었습니다. 스크립트를 실행하면 오류가 발생합니다.

프로그램이 이전 버전 R 4.0을 원한다는 것을 올바르게 이해했나요?

R-3.6.3이 있습니다.

나는 내 자신의 이유로 이전 R-3.6.3에서 이것을 쓰고 있으므로 내 문제입니다...

나는 패키지가 탭에서 제거 될 것이라고 상상할 수 없었습니다....

알렉세이 뱌즈 미킨 #:

프로그램이 이전 버전의 R 4.0을 원한다는 것을 올바르게 이해 했습니까?

올바르게

알렉세이 뱌즈미킨 #:

글쎄요, 일반적으로 이전 버전을 검색했지만 찾지 못 했습니다. 물론 끔찍한 비 호환성은 혐오 스럽습니다.

들어 봐, 그런 스 미칼 카로 거래에 들어갈 수 없을 수도있어 ??? ))

호환성을 사용하면 모든 것이 괜찮습니다. 예를 들어 파이썬은 그러한 호환성 만 부러워합니다....


또한 다음을 참조하십시오.

https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2

현재 버전에서 사용해보십시오.

urlPackage <- "https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-12.tar.gz"
install.packages(urlPackage, repos=NULL, type="source") 

 
산치의 이론을 요약하자면 (그 자신이 제대로 공식화하고 예를 제시하지 못했기 때문에) 다음과 같습니다:

*"관계"와 "연결"이 상관관계의 정의이기 때문에 그의 특징 선택 방식은 상관관계에 기반합니다.

*이 방식은 LDA(선형 판별 분석) 또는 PCA와 유사한 의미의 역사에 대한 암시적 적합을 수행하며 학습 과정을 단순화하고 오류를 줄입니다.

*특징이 특성에 맞춰져 있거나 (더 나쁘게는) 사용 가능한 이력에 맞춰져 있기 때문에 훈련된 모델이 새로운 데이터(특징과 대상 간의 연결 추정과 관련이 없음)에서 더 나은 성능을 보여야 한다는 이론도 없습니다.

*슬라이딩 창에서 QC를 평균화하여 확산을 추정하고 더 안정적인 것을 선택할 수 있는 것처럼 상황은 다소 개선됩니다. 적어도 우리는 신뢰할 수 있는 통계가 있습니다.

*인과관계나 통계적으로 유의미한 관계를 생각했지만, 그의 접근 방식은 그렇지 않습니다.
 
Maxim Dmitrievsky #:
산치의 이론을 요약하자면(산치 자신도 제대로 공식화하지 못하고 예를 제시하지 못했기 때문에) 다음과 같습니다:

*"관계"와 "관계"가 상관관계의 정의이기 때문에 그의 특징 선택 방식은 상관관계에 기반합니다.

*이 방식은 LDA(선형 판별 분석) 또는 PCA와 유사한 의미로 역사에 암묵적으로 적합하게 만들고 학습 과정을 단순화하며 오류를 줄입니다.

*특징이 이전에 특성에 적합했거나 (더 나쁘게는) 사용 가능한 전체 기록에 적합했기 때문에 훈련된 모델이 새로운 데이터(특징-대상 관계 추정과 관련이 없음)에서 더 나은 성능을 보여야 한다는 이론도 없습니다.

*관계란 인과관계 또는 통계적으로 유의미한 관계를 의미하지만, 그의 접근 방식에서는 그렇지 않습니다.

외람된 말씀이지만, 이 글은 요약본이 아닙니다(요약이나 요약이 아닙니다). 개인적인 태도와 근거 없는 공격으로 가득 차 있습니다.

"훈련된 모델은 새로운 데이터에 대해 작동해야 한다"는 타당한 이론을 가지고 있다고 생각할 수 있습니다 :-) 그리고 검증되었습니다.

 
Maxim Kuznetsov #:

외람된 말씀이지만 이것은 요약본이 아닙니다(요약이나 요약이 아닙니다). 이것은 개인적인 태도이자 근거 없는 공격입니다.

"훈련된 모델은 새로운 데이터에 대해 작동해야 한다"는 유효한 이론을 가지고 있다고 생각하실 수 있습니다 :-) 그리고 검증되었습니다.

그리고 자세히 읽어보면 2번의 매복, 즉 스토리에 대한 초기 적합성을 볼 수 있습니다. 그래서 학습 오류가 줄어든 것입니다.

포인트 4는 사용 가능한 모든 기록에 대해 수행되지 않으면 조금 더 낙관적입니다. 적합도를 높이기 위해 훈련 샘플링에 대해서만 수행해야 합니다. 새로운 데이터에 대한 적절한 모델 추정치를 얻기 위해서입니다.

심리학에 관심이 없으니 아무데서나 튀어나오지 않죠. 그리고 개인적으로 아는 사람도 없습니다.
 
СанСаныч Фоменко #:

EA 수준에 도달하기에 충분한 전력이 없습니다. 그러나 모델 피팅 오차의 결과는 8%에서 22%까지 피팅 구간과 표본에서 거의 차이가 없는 피팅 오차입니다.

이는 전체 히스토리에 대한 피팅이 훈련 전에 이루어졌다는 것을 암시합니다. 그렇지 않다면 정정해 주세요. 어떤 간격으로 피처를 추정/선택하고 어떤 간격으로 훈련을 수행했나요?

저도 비슷한 방법을 사용하고 있으며 이번 주말에 결과를 공유할 수 있습니다. 말장난이 아닌 실질적인 커뮤니케이션이 있을 경우에만 가능합니다.
사유: