L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3142

 
Maxim Dmitrievsky #:

un paio di grafici O.C.D., per favore?

Non per un nuovo insegnante.

Sto cercando di risolvere il problema del coartazione dei valori dei predittori. Mi sembra che si possa verificare un errore di classificazione se il valore del predittore è leggermente diverso da quello su cui il modello è stato addestrato. Una volta ho provato a convertire tutti i predittori in forma nominale con lo stesso insegnante, ma non ho ottenuto alcun risultato. Tuttavia, il numero di valori delle variabili nominali era uno. Forse ne servono diverse centinaia? Sto lavorando, ma ci sono molte altre domande interessanti in mezzo.

 
Forester #:

Si tratta di una ricerca lunga, soprattutto se si tratta di una ricerca di pochi secondi.

Sì, lunga, davvero senza fretta, ma comunque lunga.

Il problema è che il potere predittivo dei predittori è solo uno dei chip. E ce ne sono molte nella mia preelaborazione e ognuna richiede una serie di statistiche che la giustifichino.

Ho menzionato un altro problema, per il quale non riesco a trovare una soluzione da molto tempo.

 
СанСаныч Фоменко #:

Per un nuovo insegnante, no.

Sto cercando di risolvere il problema del coartazione dei valori dei predittori. Mi sembra che si possa verificare un errore di classificazione se il valore del predittore è leggermente diverso da quello su cui è stato addestrato il modello. Una volta ho provato a convertire tutti i predittori in forma nominale con lo stesso insegnante, ma non ho ottenuto alcun risultato. Tuttavia, il numero di valori delle variabili nominali era uno. Forse ne servono diverse centinaia? Sto lavorando, ma ci sono molte altre domande interessanti in mezzo.

"

Un modello ideale dovrebbe avere un basso bias e una bassa varianza. In realtà, però, esiste un cosiddetto "trade-off" tra bias e varianza. L'aumento della complessità del modello (ad esempio, l'aggiunta di più parametri) può ridurre il bias ma aumentare la varianza. Al contrario, la semplificazione del modello può ridurre la varianza ma aumentare il bias.


"

Ipoteticamente si può piegare l'albero a gomiti a un livello soddisfacente e affilare i giochi, ma non si va lontano perché non è più "da progetto".
 
Maxim Dmitrievsky #:

"

Un modello ideale dovrebbe avere un basso bias e una bassa varianza. In realtà, però, esiste un cosiddetto "trade-off" tra bias e varianza. L'aumento della complessità del modello (ad esempio, l'aggiunta di più parametri) può ridurre il bias ma aumentare la varianza. Al contrario, la semplificazione del modello può ridurre la varianza ma aumentare il bias.


"

Ipoteticamente si può piegare l'albero a gomiti a un livello soddisfacente e affilare i giochi, ma non si va lontano perché non è più "da progetto".

Per qualche motivo, la terza componente viene spesso dimenticata: l'errore irrecuperabile. Se è abbastanza grande (e mi sembra che ne abbiamo molti a causa della vicinanza dei prezzi all'SB), può essere più importante dei primi due.

In ogni caso, si tratta di elementi molto importanti che possono essere riassunti in una domanda: qual è la massima informazione che si può estrarre dal campione di prezzi (e dagli altri dati disponibili) di cui disponiamo?

 
Aleksey Nikolayev #:

Per qualche motivo si dimentica spesso la terza componente: l'errore irrecuperabile. Se è abbastanza grande (e mi sembra che nel nostro Paese non sia insignificante a causa della vicinanza dei prezzi al SB), può essere più importante delle prime due.

In ogni caso, si tratta di elementi molto importanti che possono essere riassunti in una domanda: qual è la massima informazione che si può estrarre dal campione di prezzi (e dagli altri dati disponibili) di cui disponiamo?

quindi non dovremmo cercare di prevedere tutti i casi, ma estrarre quelli che sono previsti attraverso il mo

Questo si chiama "effetto di triturazione eterogenea", che può essere paragonato non alla piegatura di un albero a gomiti, ma alla ricerca di parti funzionanti e allo scarto di quelle non funzionanti.

allora gli attributi di X diventano contestuali e non sono "predittori" di Y in senso classico. Ecco perché in kozul si chiamano "covariate".

Il risultato risponderà alla vostra domanda (a seconda di cosa misurare) sulla massima informazione. Di solito si misura in ATE o CATE.


 
Aleksey Nikolayev #:

Una domanda: qual è la quantità massima di informazioni che è possibile estrarre dal campione di prezzi (e dagli altri dati disponibili)?

Penso che sia necessario impostare il compito in modo appropriato.

Definire l'informazione

Definire la "massima informazione" (almeno per capire quando fermarsi).

Rendersi conto che ogni obiettivo avrà un set diverso, quindi dobbiamo dichiarare l'obiettivo.


Ma è una domanda interessante, mi piace.
 
Aleksey Nikolayev #:

Per qualche motivo si dimentica spesso la terza componente: l'errore irrecuperabile. Se è abbastanza grande (e mi sembra che nel nostro Paese non sia insignificante a causa della vicinanza dei prezzi al SB), può essere più importante delle prime due.

In ogni caso, si tratta di elementi molto importanti che possono essere riassunti in una domanda: qual è la massima informazione che si può estrarre dal campione di prezzi (e dagli altri dati disponibili) di cui disponiamo?

È una questione di ricerca dissertabile, non di costruzione di un robot che falcia la pasta.

Non abbiamo bisogno di un massimo di informazioni, ma di un minimo sufficiente. Pertanto, possiamo limitarci a quanto segue:

1. Creare un modello che dia un errore di classificazione inferiore al 20% in fase di classificazione. E va inteso che il "modello" comprende la preelaborazione completa dei predittori, nonché gli strumenti per la valutazione del modello.

2. Inserire il modello in un Expert Advisor che fornisca almeno lo stesso rapporto tra trade perdenti e profittevoli. Se il fattore di profitto è superiore a 4, resta ancora un passo da compiere.

3. Assicurarsi che nell'OOS non sia cambiato nulla e comprendere le ragioni di tale stabilità nell'OOS, che risiede nella preelaborazione, non nel modello.

E quali errori hanno portato al 20% - è interessante?

 

Non sarebbe più semplice classificare gli errori?

Più errori troviamo, più il modello rimarrà migliore. non una massimizzazione dell'informazione, ma qualitativa (scusate il gioco di parole).

 
mytarmailS #:
Credo che Snalo debba impostare il compito in modo corretto.

Definire le informazioni

Definire la "massima informazione" (almeno per capire quando fermarsi).

Rendersi conto che ogni obiettivo avrà un set diverso, quindi è necessario dichiarare l'obiettivo.


Ma è una domanda interessante, mi piace.

A mio parere, l'opzione di Maxim qui sopra è molto buona. Come ha giustamente notato San Sanych, non è l'informazione in sé a essere importante, ma il modo in cui aiuta a moltiplicare il deposito).

Se, per semplicità, consideriamo una strategia di trading come un elemento e Y come un profitto, allora la definizione (TS che massimizza l'aspettativa di profitto) diventa piuttosto banale.

 
СанСаныч Фоменко #:

Si tratta di una ricerca dissertabile, non di creare un robot che falcia la pasta.

Non abbiamo bisogno di informazioni massime, ma di un minimo sufficiente. Quindi possiamo limitarci a quanto segue:

1. Creare un modello che fornisca un errore di classificazione inferiore al 20% in fase di classificazione. Va inteso che il "modello" comprende la preelaborazione completa dei predittori e gli strumenti per la valutazione del modello.

2. Inserire il modello in un Expert Advisor che fornisca almeno lo stesso rapporto tra trade perdenti e profittevoli. Se il fattore di profitto è superiore a 4, resta ancora un passo da compiere.

3. Verificare sull'OOS che non sia cambiato nulla e capire le ragioni di tale stabilità sull'OOS, che risiede nella preelaborazione e non nel modello.

E quali errori hanno portato al 20% - è interessante?

Uno non interferisce in alcun modo con l'altro. Ovviamente il massimo non solo è irraggiungibile, ma addirittura impossibile da calcolare, ma possiamo cercare di stimarlo in qualche modo e confrontarlo almeno approssimativamente con lo spread, per esempio. Intendo una variante del massimo come quella proposta da Maxim.