L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3015

 
Maxim Dmitrievsky #:

Come un foglio di legno a volte funziona meglio del legno?

tc pronto al minimo

Sui nuovi dati, sì. È solo che è stato individuato un modello coerente e il resto delle foglie dell'albero sono solo rumore del vento. Il rumore è dovuto al fatto che l'albero è costretto a dare risposte a tutte le domande, cioè a classificare completamente il campione.

 
Dovete dormire la notte.
 
Aleksey Vyazmikin #:

Sui nuovi dati, sì. È solo che è stato individuato un modello stabile e il resto dell'albero lascia solo il rumore del vento. Il rumore è dovuto al fatto che l'albero è costretto a dare risposte a tutte le domande, cioè a classificare l'intero campione.

La selezione delle foglie avviene in modo automatico, modificando il livello di attivazione delle foglie. Classicamente, per la classificazione si usa 0,5. Tutte le foglie con una probabilità superiore a 0,5 vengono attivate, mentre le altre sono silenziose (il che equivale alla loro rimozione dall'albero). Questo metodo è stato descritto in più di un articolo su questo sito e sul forum.

È possibile impostare il livello a 0,9 o 0,95, in questo modo funzioneranno solo le foglie super pulite con il 95% di esempi della classe corretta. Per la regressione, allo stesso modo, solo che il livello non è da 0 a 1, ma in valori abs. Le immagini qui sopra mostrano lo stesso modello, ma con diversi livelli di attivazione. Il primo attraverso 0,00020, il secondo attraverso 0,00040pts. Il secondo ha saltato gli intervalli di trading non redditizi e ha lavorato solo su quelli più redditizi, mostrando profitti, anche se ha lavorato con pause di 1-2 anni. L'attivazione è avvenuta in 70000 casi su 400000, cioè circa il 17% delle foglie migliori ha funzionato.

Il risultato è simile, ottenuto con un solo comando nel codice if(valore_foglia>0,00040){...}. senza tutte le operazioni di selezione delle foglie e ora anche dei cluster.

Ma questo lo sapete già....

 
Aleksey Vyazmikin #:

Sui nuovi dati, sì. È solo che è stato individuato un modello coerente e il resto dell'albero lascia solo il rumore del vento. Il rumore è dovuto al fatto che l'albero è costretto a dare risposte a tutte le domande, cioè a classificare l'intero campione.

Il problema è che l'albero non è costruito in base alla condizione di massimizzazione del profitto, ma in base a una funzione di perdita comoda per la programmazione del pacchetto.

Quindi si deve fare una scelta spiacevole: o cercare di riconfigurare un pacchetto complesso e truccato o costruire una bicicletta angusta. È anche possibile combinare con "successo" entrambe le opzioni).

IMHO, se si sceglie di armeggiare con un pacchetto esistente sugli alberi, si dovrebbe cercare di usare la potatura (pruning) - con la condizione di massimizzazione del profitto in avanti, per esempio. In questo modo, si potrebbe evitare di manipolare manualmente le regole.

 
Maxim Dmitrievsky #:
Non nutro molte speranze, mi limito a sbirciare di tanto in tanto. Dopo tutto il gpt prevedo stagnazione e immobilismo in questo topic. Non si intravedono svolte. Si tratta di un puro flash hype, come per le criptovalute. Ora faranno soldi e si calmeranno.
Sono d'accordo con te!

Tutto il mio vicinato elogia le reti neurali propagandate, ma quando gli si assegnano compiti semplici, non li affrontano.
 
Stanislav Korotky #:

L'esempio che ho fornito proviene dalla sezione dell'entropia incrociata categoriale (e probabilmente non avete prestato attenzione al fatto che la somma dei valori è 1 in ogni istanza). Il fatto che non funzioni come in Keras è per me un indicatore, il che significa che o l'implementazione o la descrizione di CCE in MQL5 non corrisponde a quanto previsto. Quindi è necessaria una descrizione dettagliata. A proposito, in pytorch CrossEntropyLoss include un softmax preliminare all'interno. Ma in generale, poiché la documentazione sulle matrici in MQL5 contiene l'idea che l'interfaccia sia simile a quella di python, la coincidenza di comportamento è implicita. E se non c'è coincidenza, si creano problemi e perplessità.

Avere molte classi implica lavorare con le matrici (quando abbiamo una serie di campioni/riga, ognuno dei quali ha delle classi), quindi il vostro esempio con un vettore non risponde ancora alla domanda.

Ho capito. Le funzioni di perdita lavorano con le matrici come con i vettori. In questo punto non abbiamo finito (non abbiamo aggiunto il parametro dell'asse).

Cioè, nel tuo esempio dobbiamo risolverlo riga per riga.

Grazie per l'attenzione

 
Aleksey Vyazmikin #:

Sui nuovi dati, sì. È solo che è stato individuato un modello coerente e il resto dell'albero lascia solo il rumore del vento. Il rumore è dovuto al fatto che l'albero è costretto a dare risposte a tutte le domande, cioè a classificare l'intero campione.

e se lo si toglie dalla foresta, ci sarà una media delle regole di tutti gli alberi lì, per il numero di alberi

 
Forester #:

La selezione delle foglie avviene automaticamente modificando il livello di attivazione delle foglie. Classicamente, per la classificazione si utilizza un valore di 0,5. Tutte le foglie con una probabilità superiore a 0,5 vengono attivate, mentre le altre sono silenziose (il che equivale a rimuoverle dall'albero). Questo metodo è stato descritto in più di un articolo su questo sito e sul forum.

È possibile impostare il livello a 0,9 o 0,95, in questo modo funzioneranno solo le foglie super pulite con il 95% di esempi della classe corretta. Per la regressione, allo stesso modo, solo che il livello non è da 0 a 1, ma in valori abs. Le immagini qui sopra mostrano lo stesso modello, ma con diversi livelli di attivazione. Il primo attraverso 0,00020, il secondo attraverso 0,00040pts. Il secondo ha saltato gli intervalli di trading non redditizi e ha lavorato solo su quelli più redditizi, mostrando profitti, anche se ha lavorato con pause di 1-2 anni. L'attivazione è avvenuta in 70000 casi su 400000, cioè circa il 17% delle foglie migliori ha funzionato.

Il risultato è simile, ottenuto con un solo comando nel codice if(valore_foglia>0,00040){...}. senza tutte le operazioni di selezione delle foglie e dei cluster.

Ma questo lo sapete già....

Se si dispone di una foresta, non si ripesa il modello dopo averlo costruito? Oppure si prende semplicemente la media delle foglie attivate?

È questo il punto, quando seleziono una foglia tengo conto della stabilità e dell'uniformità della distribuzione delle risposte nel corso della storia. Creo degli indicatori bidimensionali e li valuto in modo aggregato. Pertanto, le foglie senza risposte sono estremamente rare per me.

Mi sembra che si possano facilmente salvare le foglie, creando migliaia di alberi, e lavorare solo con quelle.

 
Aleksey Nikolayev #:

Il problema è che l'albero non è costruito secondo una condizione di massimizzazione del profitto, ma secondo una funzione di perdita conveniente per la programmazione a pacchetti.

Quindi si ha una scelta sgradevole: o cercare di riconfigurare un pacchetto complesso e complicato, o costruire una bicicletta angusta. È anche possibile combinare con "successo" entrambe le opzioni).

IMHO, se si sceglie di armeggiare con un pacchetto esistente sugli alberi, si dovrebbe cercare di usare la potatura (pruning) - con la condizione di massimizzazione del profitto in avanti, per esempio. In questo modo, si potrebbe evitare di manipolare manualmente le regole.

La variante che ho usato per costruire l'albero non costruisce alberi profondi: la potatura potrebbe essere superflua.

Sì, quasi tutte le operazioni sono automatizzate e quelle che non lo sono sono si basano sulla mia ignoranza di R.

Sto parlando di rumore, perché il predittore radice può contenere probabilità di predisposizione a classi specifiche nell'ordine del 10% o meno, e il resto della probabilità è distribuito uniformemente, e il resto del residuo viene utilizzato per tagliare le foglie rimanenti.

 
Maxim Dmitrievsky #:

e se lo si estrae dal bosco, ci sarà una media di tutti gli alberi, per il numero di alberi

Gli alberi sono costruiti in modo indipendente e poi ponderati in base alle risposte delle foglie. Non ho lavorato con una foresta, ma con un singolo albero. Non ho mai sentito parlare di una foresta sulla genetica.