L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 482

 
Aleksey Terentev:
E sì, c'è tutta una questione di normalizzazione. Salterà e normalizzerà i dati in modo diverso a diversi intervalli di tempo.

Sì, cercherò di risolverlo prima o poi.

 
Maxim Dmitrievsky:

No, ho già citato lo schermo, gli incrementi sono stazionari e simmetrici su entrambi i lati dello zero, quindi le probabilità saranno +- le stesse


Maxim Maxim Dmitrievsky: Può essere, ma quando ho cercato di rivelare la simmetria nel comportamento dei prezzi non l'ho trovata.

Con rispetto.
 
Andrey Kisselyov:
Probabilmente sarà così, ma quando ho cercato di trovare la simmetria nel comportamento dei prezzi non l'ho vista.

Con rispetto.

Qui la probabilità è essenzialmente 50\50 (sopra/sotto zero) - se appartiene alla classe o no, e tutti gli altri valori sono la forza del segnale. Quindi anche se gli incrementi non sono simmetrici per comprare e vendere, NS dovrebbe capirlo da solo :)

 
Maxim Dmitrievsky:

Qui la probabilità è essenzialmente 0 e 1 - se appartiene alla classe o no, e tutti gli altri valori sono la forza del segnale. Quindi anche se gli incrementi non sono simmetrici per comprare e vendere, il NS dovrebbe capirlo da solo :)

Secondo me, in questo caso è necessario, come ho detto sopra, avere un terzo stato, una certa frontiera fino alla quale il segnale non appartiene né a comprare né a vendere.

Saluti.

 
Andrey Kisselyov:

Secondo me, in questo caso è necessario, come ho detto sopra, avere un 3-stato, un confine fino al quale il segnale non appartiene né a comprare né a vendere.

Saluti.


allora ci riferiremo ad entrambe le classi con la stessa probabilità

 
Maxim Dmitrievsky:

quindi attribuire a entrambe le classi con uguale probabilità

NS dovrebbe essenzialmente trovare questo confine da solo, ha solo bisogno di essere fornito nel codice. e non deve necessariamente essere uguale probabilità per entrambe le direzioni.

Con rispetto.
 
Maxim Dmitrievsky:

Utilizzando un classificatore lineare come esempio. Supponiamo di insegnare qualcosa a un classificatore, alimentando 2 uscite con incrementi di prezzo da 0 a 1, dove 0,5 è nessun segnale (la somma delle uscite è sempre uguale a uno)

C'è qualcosa di sbagliato in questa frase. Se si insegna al classificatore, l'insegnante non sarà gli incrementi da 0 a 1 ma i valori specifici come -1 e 1 (prezzo in calo / prezzo in aumento). Creando una tabella di allenamento e un insegnante per il modello, gli incrementi saranno arrotondati a -1 e 1 e tutte le informazioni sul valore dell'incremento saranno perse.

Inoltre il modello sarà addestrato, e alcuni modelli di classificazione nel processo di previsione possono effettivamente dare probabilità di classe invece di valori rigidi -1 e 1. Ma questa probabilità non è affatto legata al valore di crescita, può essere interpretata come "il prezzo con probabilità X% probabilmente crescerà, per un valore sconosciuto di crescita".


Maxim Dmitrievsky:

E se prendiamo una rete neurale con classificazione non lineare, le uscite ci diranno la forza del segnale o indicheranno solo il grado di appartenenza a 1 di 2 classi e non più

Anche qui ci saranno solo gradi di appartenenza a 1 delle 2 classi e non di più. Il requisito mostrato nell'immagine non sarà soddisfatto. Se volete conoscere il valore della crescita, dovrete creare un mucchio di classi con diversi livelli di crescita.



La regressione può essere usata al posto della classificazione. Ed è necessario un modello di regressione. Quindi è possibile alimentare gli incrementi di prezzo durante l'addestramento senza modifiche e arrotondamenti, e se il modello può raggiungere un'alta precisione, predirà la grandezza dell'incremento invece di qualsiasi probabilità e classi. È molto conveniente.

Anche se nel forex, non ho ottenuto di più con la regressione che con la classificazione semplice. Il modello ha prodotto valori molto piccoli durante la predizione, anche se ha indovinato la direzione in più del 50% dei casi, ma è stato impossibile stimare la quantità di aumento atteso dalla predizione. Il risultato è stato trattato come per le due classi - "il prezzo salirà probabilmente di una quantità sconosciuta".

 
Maxim Dmitrievsky:

Aiutami a capire il processo :)

Utilizzando un classificatore lineare come esempio. Supponiamo di insegnare qualcosa al classificatore, diamo in pasto incrementi di prezzo da 0 a 1 a 2 uscite, dove 0,5 è nessun segnale (la somma delle uscite è sempre uguale a uno)

Se tracciamo semplicemente una linea di regressione, per esempio, in base ai prezzi, gli incrementi di prezzo più grandi si troveranno più lontani dalla linea, quelli più piccoli più vicini, cioè se le uscite del classificatore sono 0,9; 0,1, l'incremento positivo si trova lontano dalla linea, cioè il segnale 0,9 sarà più forte del segnale 0,6 per comprare

E se prendiamo una rete neurale con classificazione non lineare, le uscite mostreranno la forza del segnale o indicheranno solo il grado di appartenenza a 1 delle 2 classi e non più

Cioè se questa condizione sarà soddisfatta:


Mi sembra che in questa situazione la metà dei principianti che non conoscono molto bene la materia saranno fregati. La ragione è che il grado di appartenenza a questa o quella classe dirà intuitivamente della maggiore o minore forza del segnale. Ma se è così di fatto e se non è meglio creare più classi su cui distribuire i valori degli incrementi, diciamo, in %, allora ottenere del valore in questa o quella classe (una di 10, supponiamo) già precisamente richiederà il valore dell'incremento.

Se volete avere una caratteristica come l'intensità del segnale in uscita, perché volete risolvere un problema di classificazione che rimarrà finito (discreto) con qualsiasi aumento del numero di classi. Prendete il compito di regressione e date da -1 (100% SELL) a 1 (100% BUY) o anche punti all'uscita di formazione - negativo per SELL e positivo per BUY, lo zero sarà piatto come dovrebbe essere.

P.S.
hanno già scritto nel messaggio precedente - circa lo stesso significato...

 
Dr. Trader:

C'è qualcosa di sbagliato in questa frase. Se si addestra un classificatore, l'insegnante non sarà gli incrementi da 0 a 1, ma valori specifici come -1 e 1 (calo del prezzo / aumento del prezzo). Creando una tabella di allenamento e un insegnante per il modello, gli incrementi saranno arrotondati a -1 e 1 e tutte le informazioni sul valore dell'incremento saranno perse.

In seguito il modello sarà addestrato e alcuni modelli di classificazione possono effettivamente dare la probabilità di classe invece dei valori rigidi -1 e 1. Ma questa probabilità non è affatto legata al valore dell'incremento, può essere interpretata come "il prezzo con probabilità X% probabilmente aumenterà di una quantità sconosciuta di incremento".


Anche qui ci saranno solo gradi di appartenenza a 1 delle 2 classi e non di più. Il requisito come nella foto non sarà soddisfatto. Se volete conoscere la grandezza dell'incremento, dovete creare un mucchio di classi per diversi gradi di incremento.



Invece di usare la classificazione, si potrebbe usare la regressione. Ed è necessario un modello di regressione. Poi nell'addestramento si possono alimentare gli incrementi di prezzo senza modifiche e arrotondamenti, e se il modello può raggiungere un'alta precisione, predirà la grandezza dell'incremento invece di qualsiasi probabilità e classi. È molto conveniente.

Anche se nel forex, non ho ottenuto di più con la regressione che con la classificazione semplice. Il modello ha prodotto valori molto piccoli durante la predizione, anche se ha indovinato la direzione in più del 50% dei casi, ma è stato impossibile stimare la quantità di aumento atteso dalla predizione. Il risultato è stato trattato come per le due classi - "il prezzo crescerà probabilmente di una quantità sconosciuta".


Capisco :) quindi la probabilità di uscita dell'assegnazione della classe non ha niente a che vedere con il probabile valore dell'incremento... vedi, alcune persone si confondono anche qui, è un punto ambiguo per i principianti... D'altra parte, se una rete neurale emette delle probabilità (per esempio lo strato softmax), allora a cosa ci servono se l'appartenenza alla classe sarà determinata da una probabilità superiore a 0,5? E poi si può davvero provare a utilizzare il modello di regressione e sbarazzarsi di tutta la normalizzazione dei valori di uscita ... a proposito, sto usando foreste casuali e la normalizzazione degli ingressi non è necessario lì

 
Ivan Negreshniy:

Se si vuole avere una caratteristica come l'intensità del segnale in uscita, allora perché si dovrebbe risolvere il problema di classificazione, che rimarrà finito (discreto) con qualsiasi aumento del numero di classi. Prendete il problema della regressione e date da -1 (100% SELL) a 1 (100% BUY) o generalmente in punti - negativo per SELL e positivo per BUY, mentre zero, come dovrebbe essere, sarà piatto.

P.S.
hanno già scritto nel messaggio precedente - circa lo stesso significato...


Sì, risulta che la regressione sarà più intelligente (sto usando RF, non la rete neurale)