트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 79

 
트레이더 박사 :

기본 분할과 함께 trainControl에서 "repeaatedcv" 메서드를 사용했습니다. 최근에 교차 검증을 위한 코드를 직접 작성했고 무작위로 가져온 막대와 간격 없이 순차적으로 가져온 조각으로 교차 검증을 시도했습니다. 전면 테스트에서는 차이가 없었습니다. 두 경우 모두 거의 동일한 결과를 보였습니다. 나는 훈련/교차 검증을 위해 데이터를 50%/50%로 나누었습니다. 아마도 이 비율에서는 더 이상 중요하지 않을 것입니다.
이것을 캐럿으로 실험합니다 ...

나는 당신이 최근에 게시한 기사에서 그에 비해 부스트 트리가 Platt 방법(이와 비슷한 것)에서 선두에 있었던 것을 기억합니다. 이 방법에 대해 Google에서 찾은 모든 것 - 모델의 출력을 시그모이드로 전송하고 결과를 가져와야 합니다. gbm 또는 xgboost가 이것을 할 수 있습니까? 이 접근 방식은 2위인 숲, 뉴런 및 일부 "배지 나무"보다 나은 것 같습니다.

Gbm 및 xgboost 는 부스트 트리입니다. 그라디언트에 대한 더 나은 수렴을 위해 각각의 새 트리는 이전 트리의 훈련 결과에서 가중치가 부여된 관찰을 기반으로 구축됩니다. 또한 선형 모델과 비선형 모델을 모두 향상할 수 있습니다.

두 번째로 랜덤 포레스트 같은 것이 있습니다. 이것은 내가 이해하는 바둑입니다. 서로 다른 데이터를 기반으로 구축된 여러 모델의 결과를 평균화합니다.

그라디언트 부스팅에 대해 읽어보세요. 분류에 가장 적합한 것은 찾기 어렵습니다. 예를 들어, 회귀 예측자의 결과에 대한 분류를 수행합니다.
 
이력서에 대해. 기본값은 임의 분할입니다... 시계열 의 경우 시간 분리가 중요합니다... 캐럿으로 할 수 있습니다. Caret CV 시계열 맞춤 접기... 보세요. 내 코드에서 이전에 게시했습니다. traincontrol에서 구현됩니다.
 
알렉세이 버나코프 :
이력서에 대해. 기본값은 임의 분할입니다... 시계열의 경우 시간 분리가 중요합니다. 캐럿으로 할 수 있습니다. Caret CV 시계열 맞춤 접기... 보세요. 내 코드에서 이전에 게시했습니다. traincontrol에서 구현됩니다.

여기에서 나는 당신을보고 미치게됩니다 ... 당신은 무에서 최소한 무언가를 얻고 싶어합니다. 즉, 0에서 0.0000000000000000000000000000000001 결과를 얻고 싶습니다. 더 이상 볼 수 없으니 도와드리겠습니다. 사실 네트워크 토폴로지는 부차적입니다. 기계 학습에서는 Forex와 관련하여 데이터뿐만 아니라 데이터가 우선입니다. 즉, 신경망 을 설계할 때 가장 중요한 것은 네트워크의 토폴로지나 학습 방법이 아닙니다. 입력과 출력입니다. 데이터가 시장과 관련이 있다면, 아주 작은 퍼셉트론이라도 분류 문제를 해결하고 미래에 큰 성공을 거둘 것입니다. 한 가지 간단한 이유는 입력에 제공된 데이터가 시장에 적합하고 적합하기 때문입니다. 예측할 수 있는 데이터입니다. 그리고 당신이 손가락에서 관련 없는 정보를 빨아들이려고 한다는 사실. 죄송하지만 결과는 관련이 없습니다 .... 시장으로 돌아 가면 forex에서 볼륨이 기본이고 그 다음에야 시장 반응이 온다는 것을 말할 것입니다. 그리고 MT(틱)에 있는 거래량이 아니라 선물의 실제 거래량, 동일한 유로입니다. 델타 클러스터가 도와드리겠습니다. 유용한 정보가 많이 있습니다. 따라서 거래량을 사용하면 가장 단순한 퍼셉트론이라도 모든 네트워크의 성능이 크게 향상됩니다. 또한 매우 유용한 델타도 있습니다. 그리고 당신은 2차 지표를 기반으로 하는 모델을 구축하려고 하고 있습니다. 가격 다음으로 3차라고 할 수 있으며, 그로부터 기적을 기대합니다. 기적은 일어나지 않을 것입니다, 나는 당신에게 확신합니다 .....

추신, 당신이 누굴 밀어붙이려고 하는지 생각해보세요. 4개의 코어보다 더 급작스럽게 컴퓨팅 성능을 발휘하는 가장 멋진 프로그래머 팀이 있는 기업. 새로운 방법 개발 등에 투자한 돈으로 그리고 나서 단순한 러시아 아웃백의 Aleksey는 5년 만에 시장을 축소하고 성배를 얻기로 결정했습니다. 하늘에서 내려와 장미빛 안경을 벗어라........

 
마이클 마르쿠카이테스 :

기계 학습에서는 Forex와 관련하여 데이터뿐만 아니라 데이터가 우선입니다. 즉, 신경망을 설계할 때 가장 중요한 것은 네트워크의 토폴로지나 학습 방법이 아닙니다. 입력과 출력입니다. 데이터가 시장과 관련이 있다면, 아주 작은 퍼셉트론이라도 분류 문제를 해결하고 미래에 큰 성공을 거둘 것입니다. 한 가지 간단한 이유는 입력에 제공된 데이터가 시장에 적합하고 적합하기 때문입니다. 예측할 수 있는 데이터입니다.

나는 논쟁할 것이 없다, 모든 것이 옳다. 우리는 또한 이것을 알고 있으며 분류 모델뿐만 아니라 예측 변수(입력 데이터)를 선택하는 방법에 대해서도 논의하므로 이 항목을 먼저 읽으십시오.

12개의 항목을 직접 선택하고, 모델을 만들고, 일주일 동안 거래하고, 지기 시작하고, 항목을 다시 선택하기 시작하기를 희망하는 것 같습니다. 나도 이 일을 했다. 때때로 "특정 시드를 사용하여 뉴런을 초기화하고 정확히 7777번 반복하도록 훈련하면 모든 것이 정상이지만 매주 화요일마다 신호와 거래해야 합니다. 새로운 네트워크에서 네트워크 최적화 2일마다 데이터". 이러한 전략은 현실적이지만, 이런 것을 선택하는 데 오랜 시간이 걸리고 몇 주 동안만 수익을 얻을 수 있습니다. 이는 그러한 전략이 어떤 단기적 규칙성을 기반으로 하기 때문입니다.

대신, 이제 입력을 자동으로 선택하는 알고리즘을 스스로 선택하고 있습니다. 간단합니다. 각 막대에 대해 약 100개의 항목, 100개의 막대가 있으며, 이러한 항목 조합을 선택하여 1년 내내 일관되게 올바른 매수/매도 신호를 제공하는 알고리즘이 있습니다. 이것은 mt5 의 어드바이저 최적화 와 어떤 관련이 있습니까? 어드바이저에서 성배 결과를 얻을 수 있고 전면 테스트에서 병합할 수 있습니다. 그러나 결과를 평가하기 위한 교차 검증과 다른 기준으로 모든 것이 더 복잡합니다. 이전에는 약 100개의 항목이 선택되었지만 지금은 수십 개에 불과합니다. 프론트 테스트에서는 60%~70% 정도의 정확도를 얻었지만 아직까지는 불안정해서 처음부터 거의 같은 결과를 얻기 위해서는 전체 선택과 훈련 과정에서 자유도를 없애야 합니다. 매번 긁습니다.

마이클 마르쿠카이테스 :

추신, 당신이 누굴 밀어붙이려고 하는지 생각해보세요. 4개의 코어보다 더 급작스럽게 컴퓨팅 성능을 발휘하는 가장 멋진 프로그래머 팀이 있는 기업. 새로운 방법 개발 등에 투자한 돈으로 그리고 나서 단순한 러시아 아웃백의 Aleksey는 5년 만에 시장을 축소하고 성배를 얻기로 결정했습니다. 하늘에서 내려와 장미빛 안경을 벗어라........

시설과 프로그래머가 있는 기업은 우리가 사용할 수 있는 것과 동일한 데이터 분석 및 모델링 프로그램을 사용합니다. 이상적인 모델을 훈련하고 월 100%의 수익을 얻는다고 가정해 보겠습니다. 저는 용량이 적기 때문에 동일한 데이터에 대해 더 약한 모델을 구축할 수 있습니다. 예를 들어 수익의 50%에 불과합니다. 나에겐 충분하다.

 
마이클 마르쿠카이테스 :

여기에서 나는 당신을보고 미치게됩니다 ... 당신은 무에서 최소한 무언가를 얻고 싶어합니다. 즉, 0에서 0.0000000000000000000000000000000001 결과를 얻고 싶습니다. 더 이상 볼 수 없으니 도와드리겠습니다. 사실 네트워크 토폴로지는 부차적입니다. 기계 학습에서는 Forex와 관련하여 데이터뿐만 아니라 데이터가 우선입니다. 즉, 신경망을 설계할 때 가장 중요한 것은 네트워크의 토폴로지나 학습 방법이 아닙니다. 입력과 출력입니다. 데이터가 시장과 관련이 있다면, 아주 작은 퍼셉트론이라도 분류 문제를 해결하고 미래에 큰 성공을 거둘 것입니다. 한 가지 간단한 이유는 입력에 제공된 데이터가 시장에 적합하고 적합하기 때문입니다. 예측할 수 있는 데이터입니다. 그리고 당신이 손가락에서 관련 없는 정보를 빨아들이려고 한다는 사실. 죄송하지만 결과는 관련이 없습니다 .... 시장으로 돌아 가면 forex에서 볼륨이 기본이고 그 다음에야 시장 반응이 온다는 것을 말할 것입니다. 그리고 MT(틱)에 있는 거래량이 아니라 선물의 실제 거래량, 동일한 유로입니다. 델타 클러스터가 도와드리겠습니다. 유용한 정보가 많이 있습니다. 따라서 거래량을 사용하면 가장 단순한 퍼셉트론이라도 모든 네트워크의 성능이 크게 향상됩니다. 또한 매우 유용한 델타도 있습니다. 그리고 당신은 2차 지표를 기반으로 하는 모델을 구축하려고 하고 있습니다. 가격 다음으로 3차라고 할 수 있으며, 그로부터 기적을 기대합니다. 기적은 일어나지 않을 것입니다, 나는 당신에게 확신합니다 .....

추신, 당신이 누굴 밀어붙이려고 하는지 생각해보세요. 4개의 코어보다 더 급작스럽게 컴퓨팅 성능을 발휘하는 가장 멋진 프로그래머 팀이 있는 기업. 새로운 방법 개발 등에 투자한 돈으로 그리고 나서 단순한 러시아 아웃백의 Aleksey는 5년 만에 시장을 축소하고 성배를 얻기로 결정했습니다. 하늘에서 내려와 장미빛 안경을 벗어라........

선동가, 에이. 여기서 나갈 시간입니다. 건물 집입니다.

"개가 짖는다 - 캐러밴이 움직인다." 와 함께

 
Dr.Trader :

나는 논쟁할 것이 없다, 모든 것이 옳다. 우리는 또한 이것을 알고 있으며 분류 모델뿐만 아니라 예측 변수(입력 데이터)를 선택하는 방법에 대해서도 논의하므로 이 항목을 먼저 읽으십시오.

12개의 항목을 직접 선택하고, 모델을 만들고, 일주일 동안 거래하고, 지기 시작하고, 항목을 다시 선택하기 시작하기를 희망하는 것 같습니다. 나도 이 일을 했다. 때때로 "특정 시드를 사용하여 뉴런을 초기화하고 정확히 7777번 반복하도록 훈련하면 모든 것이 정상이지만 매주 화요일마다 신호와 거래해야 합니다. 새로운 네트워크에서 네트워크 최적화 2일마다 데이터". 이러한 전략은 현실적이지만, 이런 것을 선택하는 데 오랜 시간이 걸리고 몇 주 동안만 수익을 얻을 수 있습니다. 이는 그러한 전략이 어떤 단기적 규칙성을 기반으로 하기 때문입니다.

대신, 이제 입력을 자동으로 선택하는 알고리즘을 스스로 선택하고 있습니다. 간단합니다. 각 막대에 대해 약 100개의 항목, 100개의 막대가 있으며, 이러한 항목 조합을 선택하여 1년 내내 일관되게 올바른 매수/매도 신호를 제공하는 알고리즘이 있습니다. 이것은 mt5 의 어드바이저 최적화 와 어떤 관련이 있습니까? 어드바이저에서 성배 결과를 얻을 수 있고 전면 테스트에서 병합할 수 있습니다. 그러나 결과를 평가하기 위한 교차 검증과 다른 기준으로 모든 것이 더 복잡합니다. 이전에는 약 100개의 항목이 선택되었지만 지금은 수십 개에 불과합니다. 프론트 테스트에서는 60%~70% 정도의 정확도를 얻었지만 아직까지는 불안정해서 처음부터 거의 같은 결과를 얻기 위해서는 전체 선택과 훈련 과정에서 자유도를 없애야 합니다. 매번 긁습니다.

시설과 프로그래머가 있는 기업은 우리가 사용할 수 있는 것과 동일한 데이터 분석 및 모델링 프로그램을 사용합니다. 이상적인 모델을 훈련하고 월 100%의 수익을 얻는다고 가정해 보겠습니다. 저는 용량이 적기 때문에 동일한 데이터에 대해 더 약한 모델을 구축할 수 있습니다. 예를 들어 수익의 50%에 불과합니다. 나에겐 충분하다.

그렇게 말할게. 상위 펀드의 연평균 수익률은 40~50%입니다. 똑똑하고 뛰어난 학생 모두가 그곳에서 일할 수 있습니다. 나는 내가 매년 50%에 도달하고 있고 이 증가가 있을 것이라는 사실에서 이상한 점을 발견하지 못했습니다.
 
알렉세이 버나코프 :
그렇게 말할게. 상위 펀드의 연평균 수익률은 40~50%입니다. 똑똑하고 뛰어난 학생 모두가 그곳에서 일할 수 있습니다. 나는 내가 매년 50%에 도달하고 있고 이 증가가 있을 것이라는 사실에서 이상한 점을 발견하지 못했습니다.

첫째, 펀드가 이렇게 저조한 수익성을 보이는 이유는 시장의 유동성 부족, 전략에 많은 돈을 투자하기 어려운 이유, 확실히 그런 문제는 없습니다

둘째 - 한 달에 100%에 집중하는 것이 어떻습니까?

그리고 나는 Mihail Marchukajtes 완전히 동의합니다. 인식 수준을 질적으로 높이려면 기능 및 모델의 품질을 높여야 합니다. ... 그들의 영향은 전체 결과에 +/- 5%입니다.

 
mytarmailS :

첫째, 펀드가 이렇게 저조한 수익성을 보이는 이유는 시장의 유동성 부족, 전략에 많은 돈을 투자하기 어려운 이유, 확실히 그런 문제는 없습니다

둘째 - 한 달에 100%에 집중하는 것이 어떻습니까?

그리고 나는 Mihail Marchukajtes 완전히 동의합니다. 인식 수준을 질적으로 높이려면 기능 및 모델의 품질을 높여야 합니다. ... 그들의 영향은 전체 결과에 +/- 5%입니다.

당신은 또한 선동가입니다. 글쎄, 그런 정도의 정보를 가진 입력을 보여주십시오. 왜 우리는 최고의 모델을 선택합니까? 노이즈가 있는 데이터에서 신호를 짜내려면 노이즈가 없는 데이터가 있어야 하므로 Excel에서 수식을 만들 수 있습니다.

"한 달에 100%". 노력하고, 결과를 보여주고, 아이디어를 공유하십시오. 수익성을 20배 늘리고 다음달에 드로다운에서 합치지 않는 방법을 들어보자.

 
알렉세이 버나코프 :

당신은 또한 선동가입니다. 글쎄, 그런 정도의 정보를 가진 입력을 보여주십시오. 왜 우리는 최고의 모델을 선택합니까? 노이즈가 있는 데이터에서 신호를 짜내려면 노이즈가 없는 데이터가 있어야 하므로 Excel에서 수식을 만들 수 있습니다.

"월 100%". 노력하고, 결과를 보여주고, 아이디어를 공유하십시오. 수익성을 20배 늘리고 다음달에 드로다운에서 합치지 않는 방법을 들어보자.

"장기" 외환. 5년 이상의 거래. FV로 정렬됩니다. 예, 일부는 우주적 수익성이 있지만 다른 통계는 좋지 않습니다. 이것은 현실입니다. 또한 안정성은 손을 거래합니다. 나머지는 모두 EF 3 이하를 나타냅니다.

 
알렉세이 버나코프 :

당신은 또한 선동가입니다. 글쎄, 그런 정도의 정보를 가진 입력을 보여주십시오. 왜 우리는 최고의 모델을 선택합니까? 노이즈가 있는 데이터에서 신호를 짜내려면 노이즈가 없는 데이터가 있어야 하므로 Excel에서 수식을 만들 수 있습니다.

"한 달에 100%". 노력하고, 결과를 보여주고, 아이디어를 공유하십시오. 수익성을 20배 늘리고 다음달에 드로다운에서 합치지 않는 방법을 들어보자.

네, 우리는 모두 여기 선동가입니다. 오직 당신만이 d'artagnan입니다. 이것은 이미 분명합니다. 적어도 당신이 트롤이 아니라는 것은 좋은 일입니다.... 지금은 ..... :)


바로 이것이 가짜다, 모든 거래는 역사에 불과하다는 등의 말을 시작할 것입니다. 그러나 나는 의사 소통을 통해 이 사람과 꽤 많은 이야기를 나누었고, 나는 그 사람이 깊은 수행자라는 것을 깨달았고 그런 질문이 없었습니다. 답이 없는 시장에서..

이 사람이 후보자입니다. 저것들. 과학. , 오랫동안(20년 전) 그는 "AI"에 대한 자신의 논문을 옹호했습니다.

그리고 블랙박스의 위치에서 시장을 예측하는 것은 불가능하며 작동 신호를 강조 표시하고 작동 방식과 이유를 이해하고 가능한 한 데이터를 필터링하여 작동하는 것만 남기고 노이즈를 무시해야한다고 주장합니다. .

그는 그의 네트워크에 약 100개의 기호(예측자)를 가지고 있으며, 각 기호 뒤에는 원하는 대로 전체 라이브러리 또는 패키지가 있습니다.

이제 전체 라이브러리를 작성해야 하는 기호와 이름이 "SMA", "MACD", "RSI"인 일종의 어리석은 krivulka 사이의 품질 차이를 비교하십시오. 0.00000001의 유용한 정보 %, Mihail Marchukajtes가 쓴 것처럼 이것은 사실입니다. 그렇지 않으면 모델은 그들이 보여줄 수 있는 효과를 정확히 보여줄 것이고 이것은 정답의 90%에서 나온 것입니다.

이 사람은 "MGUA" 및 스펙트럼 분석, 특히 푸리에에 익숙해질 것을 권장합니다.

==================================================== =====

내가 "선동가"는 어떤 결과를 얻었지만 실제로 매우 겸손하고 좋은 아이디어가 많이 있습니다. 내 연구는 한 번에 여러 방향으로 진행되고 다양한 분야의 지식이 크게 부족합니다. 따라서 나는 종종 포럼 회원들에게 도움을 요청하지만 특히 아무도 돕고 싶어하지 않습니다. 그들은 스스로 배우라고 말합니다. 그리고 ..... 이미 모든 것을 스스로 마스터 한 경우에만 어떻게 든이 의사 소통이 필요합니까? 내 생각에는 논리가 없어 .. 글쎄, 나는 탈선한다.


지금은 여기가 최고입니다. 엄마. 새 데이터에서 RF에서 짜낸 것은 2개월 연속 월 50%이지만 여전히 모든 것이 매우 불안정합니다. 사진을 10번이나 업로드하려고 시도했지만 작동하지 않았습니다 (잘됨)

www

www

결론은 처음에는 연간 30%와 같은 템플릿으로 자신을 제한할 필요가 없다는 것입니다. 이것은 멋지고 이것은 멋지지 않습니다. 이것은 이성과 창의성을 위한 프레임워크입니다