트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 95

 
마법사_ :
나는 "Gopher"를 찾을 수 없었고, 망쳤습니다.)) 그리고이 모든 운동은 ... "엉덩이"가 이해하는 사람을위한 것입니다.
솔직히 이해가 안감...........
 
mytarmailS :

글쎄, 예, 하지만 젠장, 그것은 어떻게 든 옳지 않습니다. 품질 예측자는 대상을 잘 설명하는 것이지 자체를 설명하는 것이 아닙니다. xs 비교하지 않고 예측자의 품질을 알아낼 수 있는 방법이 나에게는 명확하지 않습니다. 대상과 함께 나에게 명확하지 않습니다 ....

문제에 접근하는 쪽이 어느 쪽인지에 달려 있습니다. 처음에는 원하는 예측 변수를 알지 못하고 대상 변수도 알 수 없습니다. 그리고 성공적인 거래를 위해서는 두 가지를 모두 배워야 합니다. 두 가지를 동시에 찾는 것은 작동하지 않으므로 목표 변수에 대한 예측 변수를 선택해야 합니다. 또는 고품질 예측 변수를 수집한 다음 경험을 통해 예측할 수 있는 항목을 찾습니다.

첫 번째 접근 방식. 예를 들어, 다음 막대에 대한 가격 상승/하락이라는 목표 변수가 있습니다. 좋은 타겟변수라서가 아니라 어디선가 시작해야 해서 좀 더 쉽게 하기로 했어요 :) 그리고 지표를 잔뜩 집어서 이제 모델에게 "성장/성장/ 하락"은 "지표 무리"에 있습니다. 무작위로 선택한 대상 변수가 전혀 예측 가능하다는 보장이 없고 내 예측자가 예측할 수 있는 충분한 정보를 가지고 있다는 보장도 없기 때문에 최소한 무언가가 나온 것이 기쁩니다. 이 경우 ForeCA는 뉴런이 더 쉽게 학습할 수 있는 형식으로 데이터를 가져오기 위해 데이터를 사전 처리하는 역할만 합니다. 예를 들어 데이터를 대신 정규화하거나 인접한 값의 델타를 가져오거나 PCA 구성 요소를 만들 수 있습니다. 이 모든 것이 뉴런의 작업을 용이하게 하며, 이러한 사전 처리된 데이터에서 더 쉽게 배울 수 있습니다. 이 경우 ForeCA는 어떻게든 동일한 클래스를 그룹화해야 합니다. 그러나 ForeCA가 이에 도움이 될 것이라는 것은 사실이 아닙니다. 이미 운이 좋은 것입니다. 사용 가능한 예측 변수와 대상 변수에 따라 다릅니다.
간단히 말해서 이 경우 목표 변수에 대해 모델과 예측 변수가 선택되며 모두 기적적으로 최소한 어느 정도의 예측 능력을 갖습니다.

또 다른 접근 방식입니다. 많은 예측 변수를 "신뢰도"로 정렬하고 불필요하고 중요하지 않은 예측 변수를 제거하십시오. 예를 들어, 지표가 항상 일정한 값을 갖는다면 분명히 쓸모가 없습니다. 예측자가 random() 함수에 의해 생성된 경우에도 쓸모가 없습니다. 등등, 실제로 일부 정보를 전달하는 예측 변수를 남겨두는 것이 중요합니다. 나는 이것에 대해 거의 알지 못하지만, 내가 기억하는 유일한 것은 적절한 추정치인 것처럼 보이는 PCA 구성요소(캐럿의 pruneSig 매개변수)에 대한 예측자의 중요성을 찾는 방법뿐입니다. 이 경우 ForeCA는 커틀릿에서 파리를 제거해야 하며 신뢰할 수 있는 예측 변수를 찾는 데 도움이 됩니다. 이 모든 패키지가 무엇이 중요하고 무엇이 중요하지 않은지 아는 방법은 미스터리이지만 시끄럽고 무작위적인 예측 변수를 찾아 거부합니다. 좋은 예측자는 무작위도 아니고 잡음도 아닌 것이 될 것입니다.
또한 고품질 예측 변수 세트를 사용하여 무언가를 예측하도록 시도해야 합니다. 예를 들어, 코호넨 지도를 만들고 코호넨 지도에서 클래스에 대한 시장 행동의 종속성을 찾을 수 있습니다. 거래할 클래스와 거래하지 않을 클래스에 대한 결론을 도출하고 새로운 목표 변수를 구축하십시오. 대상 변수는 사용 가능한 예측자에 의해 매우 예측 가능합니다. 왜냐하면 그것이 기반으로 구축되기 때문에 모든 것이 좋게 들리지만 여기에는 많은 문제와 트릭이 있을 것입니다.

 
트레이더 박사 :

문제에 접근하는 쪽이 어느 쪽인지에 달려 있습니다. 처음에는 원하는 예측 변수를 모르고 목표 변수를 알 수 없습니다. 그리고 성공적인 거래를 위해서는 두 가지를 모두 배워야 합니다. 두 가지를 동시에 찾는 것은 작동하지 않으므로 목표 변수에 대한 예측 변수를 선택해야 합니다. 또는 고품질 예측 변수를 수집한 다음 경험을 통해 예측할 수 있는 항목을 찾습니다.

첫 번째 접근.....

또 다른 접근....

다양한 접근 방식이 있지만 우리는 거래를 할 것입니까?

무엇을 거래할까요?

경향?

일탈?

수준?

동시에 BUY/SELL이라는 두 가지 주문만 있음을 염두에 둡니다. 아니면 다양한? BUY 시장 진입 / BUY 시장 퇴출 / SELL 시장 진입 / SELL 시장 퇴출

다음은 대상 변수의 변형입니다.

더 나아가.

우리가 거래하는 대상 변수를 만들 수 있습니까?

아니면 목표와 거래 시스템의 아이디어 사이에 일종의 간격이 있습니까? 오류가 있습니까?

등.

그러나 우리는 우리가 거래하는 것부터 시작해야 합니다.

 
마이클 마르쿠카이테스 :
v2 변수에 지연을 곱하고 v3 으로 나누어야 합니다.
이러한 열(v2, 지연 v2(Lag1_v2), v3, v11(목표) 및 공식 v2*Lag1_v2/v3이 있는 열)이 있는 10개 행 표시

v2;Lag1_v2;v3;v11(대상);v2*Lag1_v2/v3

아카이브 파일은 업로드할 필요가 없습니다.
 
마이클 마르쿠카이테스 :
네트워크에 지연이 표시되지 않습니다.
빈 줄을 자르고 원하는 위치에 놓으십시오 ...
 

산산이치 포멘코 :

무엇을 거래해야 하는지 정확히 알고 있습니다. 많은 옵션이 있지만 예측할 수 없는 것을 다시 선택하고 예측 불가능에 대해 배우는 데 많은 시간을 할애할 수 있습니다. 사용 가능한 예측 변수에서 더 쉽게 예측할 수 있는 것을 선택해야 합니다. 어떻게 해야할지 많이 고민하셔야 합니다.

ForeCA로 예측을 위한 테스트 코드를 만들었습니다. 마지막 열에 대상 변수가 있는 trainData 테이블이 필요합니다. 훈련/검증을 위해 두 부분으로 줄로 나뉩니다(중간에 엄격하게 나뉩니다). 예측 모델은 lm에서 가져왔습니다. 어떤 이유에서인지 항상 PCA와 함께 예제에서 사용됩니다. 여기에서도 마찬가지일 것이라고 생각합니다. 코드의 lm(...) 함수를 다른 모델로 교체하는 것이 가능합니다.
ForeCA는 cov() 다음에 전체 순위가 있는 행렬의 데이터가 필요합니다. 이를 미리 확인하고 낮은 고유값 열을 제거하는 코드를 첨부했습니다. 모든 것이 하나의 주기에 있고 오랜 시간이 걸리며 아마도 더 간단하게 만들 수 있었을 것입니다. 내 예측자 중 일부는 이런 식으로 제거되었습니다. 이것이 좋은지 나쁜지 모르겠습니다.
나는 아직 결과가 없습니다. 패키지는 5 기가의 opreatives를 먹고 오랫동안 생각했습니다. 시도하십시오. 아마도 누군가가 좋은 예측을 줄 것입니다.

파일:
 
마법사_ :
이러한 열(v2, 지연 v2(Lag1_v2), v3, v11(목표) 및 공식 v2*Lag1_v2/v3이 있는 열)이 있는 10개 행 표시

v2;Lag1_v2;v3;v11(대상);v2*Lag1_v2/v3

아카이브 파일은 업로드할 필요가 없습니다.
솔직히 말해서 이 게임의 요점은 잘 모르겠습니다.... 입력 데이터의 복잡하지 않은 변환을 기반으로 출력 변수를 구축하는 것은 의미가 없습니다. 차량이 잘 작동하면 네트워크가 필요하지 않습니다. 옵티마이저가 훈련 파일을 한 줄씩이 아니라 복잡한 것으로 간주하면 어떻게 될까요? 열 간의 관계뿐만 아니라 모든 열의 과거 값에서도 관계를 찾습니다. 결과적으로 상당히 흥미로운 일이 될 수 있습니다. 데이터 정규화 외에도 데이터 사전 처리가 수행되어 정규화 공식뿐만 아니라 다음과 같은 사전 처리 공식도 제공됩니다. 정규화 전에 v2에 lag1 v5를 곱해야 합니다. 그러면 검색이 훨씬 더 재미있을 것 같아요. 오히려 사전 처리는 일종의 사전 최적화 도구인 변환 공식을 생성합니다. 그런 다음 이 공식을 데이터에 적용하고 다른 데이터 세트를 가져와 이미 최적화 프로그램에 밀어 넣어 모델을 빌드합니다. 열 사이뿐만 아니라 과거 값과의 관계 사이에서도 종속성에 대한 일종의 다차원 검색입니다. 누구든지 MKUL에서 이것을 구성하는 방법을 말해 줄 수 있습니까 ???? 나는 시도 할 것입니다 :-)
 
예를 들어, 모델을 구축하기 전에 각 입력을 MKUL 옵티마이저의 출력으로 최적화합니다. 즉, 마우스를 사용하는 경우 모델을 구축하기 전에 가능한 한 많은 수익성 있는 신호를 제공하도록 교육 간격에서 머신의 이러한 매개변수를 선택하고 각 항목과 함께 모든 항목을 옵티마이저.... iii iii.... 모델이 더 안정적이 됩니다. 입구와 출구의 쓰레기에 대한 메시지가 완전히 사라집니다. 모델은 안정적으로 ternated되지만 일반화의 약 50% 또는 약간 더 높기 때문에 MCL에서 각 예측 변수를 최적화할 때 드문 경우지만 수익성 있는 거래의 수는 50% 이상입니다. 그러나 각 입력에 대해 개별적으로 이 작업을 수행하고 기본적으로 평균 매개변수와 지연이 이 참여에 대해 선택되며 다른 입력과의 관계는 확실히 선택되지 않습니다. 그러나 우리가 옵티마이저에 의해 이 연결에 대한 검색을 구성하고 위에서 작성한 내용을 구성한다고 가정합니다. 다음으로 데이터 간의 관계에 대한 매개변수를 가져옵니다. 데이터에 적용한 다음에만 모든 것을 옵티마이저에 푸시합니다. 그러면 이해가 될 것이고 모델은 적절한 일반화 수준으로 밝혀져야 한다고 생각합니다. 하지만 아직 정리하는 방법을 모르겠습니다 ... 제 생각에는 ... 어떤 아이디어라도 듣겠습니다 ... MKUL의 간단한 신경망 이 여기에 도움이 될 것이라고 생각합니다. 테스트 세트의 모든 신호를 가능한 한 정확하게 설명하는 곡선으로 메인 Reshetov 옵티마이저에서 좋은 모델을 구축하는 데 도움이 됩니다. MKUL에 간단한 그리드가 있습니까????
 
Dr.Trader :

ForeCA로 예측을 위한 테스트 코드를 만들었습니다.....

나도 .. 빨리 하기로 결정 홍채가 필요하고 노이즈가 있는 예측 변수 10개 추가

방금 숲을 훈련시킨 다음 노이즈와 동일한 날짜를 사용하고 foreCA를 사용하여 차원을 4개의 예측 변수로 줄이고 숲을 다시 훈련했습니다.

결과:

새로운 데이터를 포리스트

Prediction   setosa versicolor virginica

  setosa         16            0          0
  versicolor       0          15          1
  virginica       0            0          18

Overall Statistics

Accuracy : 0.98     

숲은 데이터에 노이즈가 있다는 것을 눈치 채지 못했습니다 ...

그리고 포카로 상황이 더 나빠집니다

Prediction   setosa versicolor virginica
  setosa           6            6          4
  versicolor       5          10          1
  virginica       8            5          5

Overall Statistics
                                          
               Accuracy : 0.42 
파일:
code.txt  1 kb
 
mytarmails :

나도 .. 빨리 하기로 하고, 홍채를 찍고, 노이즈가 있는 예측변수 10개 추가

방금 숲을 훈련시킨 다음 노이즈와 동일한 날짜를 사용하고 foreCA를 사용하여 차원을 4개의 예측 변수로 줄이고 숲을 다시 훈련했습니다.

결과:

새로운 데이터를 포리스트

숲은 데이터에 노이즈가 있다는 것을 눈치 채지 못했습니다 ...

그리고 포카로 상황이 더 나빠집니다

진실은 좋지만 행복은 더 좋습니다!

True = 42%, 오오오오, 창고에 긍정적인 영향을 미칩니다.

행복하게 살 수 있지만 창고 제로

사유: