트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 482

 
알렉세이 테렌테프 :
그리고 네, 여기서 요점은 정규화에 있습니다. 다른 시간 간격으로 다른 방식으로 데이터를 점프하고 정규화합니다.

예, 알아내도록 노력하겠습니다.

 
막심 드미트리예프스키 :

아니요, 이미 화면을 제공했습니다. 증분은 고정되어 있고 0의 양쪽에서 대칭이므로 확률은 + - 동일합니다.


그럴 수도 있겠지만 가격의 움직임에서 대칭성을 확인하려고 했을 때 찾지 못했습니다. 결과적으로, 다른 증분은 다른 방향에서 다른 확률을 가질 것입니다.

감사합니다.
 
안드레이 키셀료프 :
그럴 수도 있겠지만 가격의 움직임에서 대칭성을 확인하려고 했을 때 찾지 못했습니다. 결과적으로, 다른 증분은 다른 방향에서 다른 확률을 가질 것입니다.

감사합니다.

여기서 확률은 본질적으로 50\50(0 위/아래) - 클래스에 속하거나 속하지 않으며 다른 모든 값은 신호의 강도입니다. 따라서 증분이 대칭적이지 않더라도 NN은 스스로 학습해야 합니다. :)

 
막심 드미트리예프스키 :

여기서 확률은 본질적으로 0과 1입니다. 클래스에 속하거나 속하지 않으며 다른 모든 값은 신호 강도를 나타냅니다. 따라서 증분이 대칭적이지 않더라도 NN은 스스로 학습해야 합니다. :)

이 경우 제 생각에는 위에서 이미 언급했듯이 신호가 매수 또는 매도에 속하지 않는 특정 경계인 3rd state가 있어야 합니다. 사람들이 소음, 평면 및 유사한 이름이라고 부르는 것.

감사합니다.

 
안드레이 키셀료프 :

이 경우 제 생각에는 위에서 이미 언급했듯이 신호가 매수 또는 매도에 속하지 않는 특정 경계인 3rd state가 있어야 합니다. 사람들이 소음, 평면 및 유사한 이름이라고 부르는 것.

감사합니다.


그런 다음 동일한 확률로 두 클래스에 할당합니다.

 
막심 드미트리예프스키 :

그런 다음 동일한 확률로 두 클래스에 할당합니다.

신경망은 기본적으로 이 경계 자체를 찾아야 하며 코드에 제공되기만 하면 되며 양방향에 대해 동일한 확률일 필요는 없습니다.

감사합니다.
 
막심 드미트리예프스키 :

선형 분류기의 예. 분류기에 무언가를 가르친다고 가정하고 2개의 출력에 대해 0에서 1로 가격 증분을 적용합니다. 여기서 0.5는 신호가 없음(출력의 합은 항상 1임)

이 문장에는 잘못된 것이 있습니다. 분류기를 훈련하면 교사는 0에서 1로 증가하지 않고 특정 값(예: -1 및 1(가격 하락/가격 인상))이 됩니다. 모델에 대한 교육 테이블과 교사를 만들 때 증분은 -1과 1로 반올림해야 하며 증분 크기에 대한 모든 정보는 손실됩니다.

그런 다음 모델은 학습하고 일부 분류 모델은 예측할 때 -1과 1의 엄격한 값 대신 실제로 클래스의 확률을 제공할 수 있습니다. 그러나 이 확률은 "X%의 확률을 가진 가격은 아마도 알려지지 않은 성장만큼 증가할 것"으로 해석될 수 있습니다.


막심 드미트리예프스키 :

그리고 비선형 분류로 신경망을 사용하는 경우 출력 판독값이 신호의 강도를 나타내거나 2개 클래스 중 1개 클래스에 속하는 정도만 표시하고 더 이상 표시하지 않습니다.

여기서 다시 2개의 클래스 중 1개의 클래스에 속하는 정도만 있을 것이며 더 이상은 없을 것입니다. 그림과 같은 요구 사항은 충족되지 않습니다. 성장의 양을 알고 싶다면 여러 성장 단계에 대한 클래스를 많이 생성해야 합니다.



분류 대신 회귀를 사용할 수 있습니다. 그리고 회귀 모델 이 필요합니다. 그런 다음 훈련 중에 변경 및 반올림 없이 가격 인상을 제출할 수 있으며 모델이 높은 정확도를 달성할 수 있으면 일부 확률 및 클래스가 아닌 인상 값을 정확히 예측합니다. 매우 편안합니다.

특히 Forex에서는 분류보다 회귀로 더 이상 달성하지 못했습니다. 모델은 예측 시 매우 작은 값을 산출했지만, 50% 이상의 경우에서 방향을 추측했지만 예측에서 예상되는 증가의 크기를 추정하는 것은 불가능했다. 결과적으로 "가격이 알 수 없는 수준으로 오를 것"이라는 두 가지 등급으로 해석되었습니다.

 
막심 드미트리예프스키 :

프로세스를 이해하도록 도와주세요 :)

선형 분류기의 예. 분류기에 무언가를 가르친다고 가정하고 2개의 출력에 대해 0에서 1로 가격 증분을 적용합니다. 여기서 0.5는 신호가 없음(출력의 합은 항상 1임)

예를 들어 가격을 기준으로 간단한 회귀선을 만들면 더 큰 가격 증분은 선에서 멀어지고 더 작은 것은 더 가깝습니다. 즉, 분류기가 0.9를 출력하는 경우입니다. 0.1이면 양수 증분은 선에서 멀리 떨어져 있습니다. 0.9 신호는 0.6 구매 신호보다 강합니다.

그리고 비선형 분류로 신경망을 사용하는 경우 출력 판독값이 신호의 강도를 나타내거나 2개 클래스 중 1개 클래스에 속하는 정도만 표시하고 더 이상 표시하지 않습니다.

저것들. 다음 조건이 충족됩니까?


이 상황에서 이미 재료를 잘 모르는 초보자의 절반은 실패 할 것 같습니다.. 특정 클래스에 속하는 정도는 직관적으로 더 크거나 더 낮은 신호 강도를 나타낼 것입니다. 그러나 이것이 실제로 그러하며 증분을 분산하기 위해 더 많은 클래스를 만드는 것이 더 낫지 않습니까, 예를 들어 % 단위로 값을 가져오면 하나 또는 다른 클래스(예: 10개 중 하나)에 값을 가져오면 이미 정확히 알려줄 것입니다. 증가.

출력에서 신호 강도와 같은 특성을 가지려면 클래스 수가 증가해도 유한(이산)으로 유지되는 분류 문제를 해결해야 하는 이유가 무엇입니까? 회귀 문제를 가지고 -1(100% SELL)에서 1(100% BUY) 또는 일반적으로 점으로 학습할 때 출력을 적용합니다. SELL의 경우 음수이고 BUY의 경우 양수이며 예상대로 0은 평평합니다.

추신
이미 이전 메시지에 썼습니다 - 거의 같은 의미 ...

 
박사 상인 :

이 문장에는 잘못된 것이 있습니다. 분류기를 훈련하면 교사는 0에서 1로 증가하지 않고 특정 값(예: -1 및 1(가격 하락/가격 인상))이 됩니다. 모델에 대한 교육 테이블과 교사를 만들 때 증분은 -1과 1로 반올림해야 하며 증분 크기에 대한 모든 정보는 손실됩니다.

그런 다음 모델은 학습하고 일부 분류 모델은 예측할 때 -1과 1의 엄격한 값 대신 실제로 클래스의 확률을 제공할 수 있습니다. 그러나 이 확률은 "X%의 확률을 가진 가격은 아마도 알려지지 않은 성장만큼 증가할 것"으로 해석될 수 있습니다.


여기서 다시 2개의 클래스 중 1개의 클래스에 속하는 정도만 있을 것이며 더 이상은 없을 것입니다. 그림과 같은 요구 사항은 충족되지 않습니다. 성장의 양을 알고 싶다면 여러 성장 단계에 대한 클래스를 많이 생성해야 합니다.



분류 대신 회귀를 사용할 수 있습니다. 그리고 회귀 모델이 필요합니다. 그런 다음 훈련 중에 변경 및 반올림 없이 가격 인상을 제출할 수 있으며 모델이 높은 정확도를 달성할 수 있으면 일부 확률 및 클래스가 아닌 인상 값을 정확히 예측합니다. 매우 편안합니다.

특히 Forex에서는 분류보다 회귀로 더 이상 달성하지 못했습니다. 모델은 예측 시 매우 작은 값을 산출했지만, 50% 이상의 경우에서 방향을 추측했지만 예측에서 예상되는 증가의 크기를 추정하는 것은 불가능했다. 결과적으로 "가격이 알 수 없는 만큼 인상될 것"이라는 두 가지 등급으로 해석되었습니다.


그것은 분명합니다 :) 결국 출력에서 클래스에 할당될 확률은 증분의 가능한 크기와 아무 관련이 없다는 것을 의미합니다. .. 보시다시피, 여기에서 일부는 혼란스럽기도 합니다. 초보자에게는 이것이 모호한 점입니다. .. 반면에 신경망이 확률을 생성하는 경우(예: softmax 계층) 클래스에 속하는 것이 0.5보다 큰 확률로 조기에 결정된다면 왜 필요한가? 글쎄, 당신은 정말로 회귀 모델 을 사용하려고 시도하고 출력 값의 정규화로부터 자신을 구할 수 있습니다 .. 그건 그렇고, 나는 거기에서 임의의 숲을 사용하고 입력의 정규화는 필요하지 않습니다

 
이반 네그레쉬니 :

출력에서 신호 강도와 같은 특성을 가지려면 클래스 수가 증가해도 유한(이산)으로 유지되는 분류 문제를 해결해야 하는 이유가 무엇입니까? 회귀 문제를 가지고 -1(100% SELL)에서 1(100% BUY) 또는 일반적으로 점으로 학습할 때 출력을 적용합니다. SELL의 경우 음수이고 BUY의 경우 양수이며 예상대로 0은 평평합니다.

추신
이미 이전 메시지에 썼습니다 - 거의 같은 의미 ...


예, 회귀가 더 민첩할 것으로 나타났습니다(그런데 저는 신경망이 아닌 RF를 사용합니다)

사유: