L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2602

 
mytarmailS #:
Un esempio concreto:
C'è una regola logica che predice qualcosa con l'80% di probabilità sia sul treno che sul test e sulla validazione incrociata, ecc... Ma sui dati di convalida (nuovi dati assolutamente sconosciuti) la regola funziona a livello casuale...

C'è un'altra regola che si comporta allo stesso modo della prima su un treno, prova e passa la convalida anche senza problemi, cioè è un vero modello...

Domanda: come posso distinguere una regola da un'altra in fase di training, test, crosvalidazione... prima della fase di validazione...

Mi chiedo se ci sono dei segni con cui possiamo tracciare la linea di demarcazione tra l'uno e l'altro, magari qualche test statistico per la casualità o il determinismo ecc...

La questione della casualità/continuità è una pietra miliare per l'intera algo e per ML in algo.

Un sacco di trucchi e trucchetti di ogni tipo.


Il più semplice è guardare come hai ottenuto il risultato. Se il miglior risultato che hai ottenuto... scegliendo il miglior risultato dall'insieme - naturalmente, la probabilità di adattamento è molto alta (soprattutto se la maggior parte degli altri risultati sono circa nulla). I risultati del test. Come li hai avuti? - Naturalmente, se avete preso il primo 5% dei migliori sul vassoio, li avete fatti correre tutti sul test, avete selezionato il migliore sul test - naturalmente, la probabilità di adattamento non è ancora piccola (soprattutto se il risultato medio degli altri non è molto). Questo "come non farlo", sono sicuro, ridurrà molto decentemente la probabilità di essere sovralimentati. È per questo motivo che non vedo come il robot/modello di qualcun altro possa essere valutato sull'equità - in nessun modo.


Inoltre, come detto, tutti i tipi di trucchi e di scherzi.

 
Replikant_mih #:

La questione della casualità/legalità è una questione fondamentale per tutte le algo e per la ML nelle algo.

Ci sono tutti i tipi di trucchi e trucchetti.

Il più semplice è guardare come hai ottenuto il risultato. Se il miglior risultato che hai ottenuto... scegliendo il miglior risultato dall'insieme - naturalmente, la probabilità di adattamento è molto alta (soprattutto se la maggior parte degli altri risultati sono circa nulla). I risultati del test. Come li hai avuti? - Naturalmente, se avete preso il primo 5% dei migliori sul vassoio, li avete fatti correre tutti sul test, avete selezionato il migliore sul test - naturalmente, la probabilità di adattamento non è ancora piccola (soprattutto se il risultato medio degli altri non è molto). Questo "come non farlo", sono sicuro, ridurrà molto decentemente la probabilità di essere sovralimentati. È per questo motivo che non vedo come il robot/modello di qualcun altro possa essere valutato sull'equità - in nessun modo.

Inoltre, come detto, tutti i tipi di trucchi e di scherzi.

Sono tutte cose ovvie, oliate... Interessato a trucchi specifici

==============================

Per esempio, come variante, l'analisi della superficie di ottimizzazione (RP) di TC, regole, AMO e così via...

Per esempio, l'intersezione OD TC di due carri per obiettivo "fattore di recupero".

Naturalmente, questo TS non funziona, non lo è mai stato e non lo sarà mai


=======================================

Ed ecco un TS funzionante in PP, che è molto stabile, fa un profitto finora (Valery lo sa :) )


Per così dire, sentire la differenza.

 

Così ho l'idea ossessiva che se si vede l'OD del TC, si può dire che cos'è e se funzionerà sui nuovi dati...

Ma è lungo e complicato contare gli OD, forse può essere aggirato in un modo più elegante e meno dispendioso dal punto di vista delle risorse di calcolo.

 
mytarmailS #:

Così ho l'idea ossessiva che se si vede l'OD del TC, si può dire che cos'è e se funzionerà sui nuovi dati...

Ma è lungo e complicato calcolare il PO, forse è possibile aggirarlo in modo più elegante e meno laborioso in termini di risorse di calcolo.

Ho un'idea di come fanno gli algo-trader. Non ho idea di come facciano i datascientifici. E so esattamente come lo faccio)).


La superficie di ottimizzazione, come la capisco, è (in questo caso) uno spazio tridimensionale, dove 2 assi sono assi di parametri (modello, strategia) e uno è la metrica obiettivo. Sì, certo che si può entrare da lì. Ho un paio di modi, e se necessario posso pensare a qualcos'altro. Ora però ci arrivo dall'altra parte. E ovviamente non c'è nessuna voglia di condividere informazioni utili con qualcuno che entra con"È tutta roba ovvia, farfalle").

 
mytarmailS #:
Non è sempre possibile risalire alla causalità

Allora si possono fare solo ipotesi sulle cause e sulla presenza di un modello. Le cause sono primarie, il comportamento è secondario. Nell'AT a volte dimenticano il primato delle cause e prendono come modelli le ripetizioni casuali del comportamento, che non lo sono.

 
Replikant_mih #:

Ho un'idea di come fanno gli algo-trader. Non ho idea di come facciano i datascientifici. E so esattamente come lo faccio).


La superficie di ottimizzazione, come la capisco, è (in questo caso) uno spazio tridimensionale, dove 2 assi sono assi di parametri (modello, strategia) e uno è la metrica obiettivo. Sì, certo che si può entrare da lì. Ho un paio di modi, e se necessario posso pensare a qualcos'altro. Ora però ci arrivo dall'altra parte. E, naturalmente, non c'è nessuna voglia di condividere informazioni utili con qualcuno che entra con"Sono tutte cose ovvie, farfalle").

Guarda, se la tua risposta alla domanda è: Un sacco di trucchi e trucchetti. E poi, come detto, tutti i tipi di trucchi e di scherzi.

Grazie per questa conoscenza approfondita, che sicuramente non è "olio di burro".

Prova a rispondere su siti speciali come SA o CV, è interessante quanti plus otterrai...

Se sei così infastidito, puoi sempre piangere ))

 
mytarmailS #:

Guarda, se la tua risposta alla domanda è: Un sacco di trucchi e trucchetti. e oltre, come hai detto tu, ogni sorta di trucchi e tecniche.

Grazie per questa conoscenza approfondita, che sicuramente non è "butterfingers".

Prova a rispondere su siti speciali come SA o CV, è interessante quanti plus otterrai...

Se ti dà tanto fastidio, puoi sempre piangere ))

Sono contento che ti sia piaciuto).

 
Valeriy Yastremskiy #:

Allora ci possono essere solo ipotesi sulle cause e sulla presenza di un modello. Le cause sono primarie, il comportamento è secondario. Nell'AT a volte dimenticano il primato delle cause e prendono come modelli le ripetizioni casuali del comportamento, che non lo sono.

Sono d'accordo, è una questione complicata...

Ecco perché è necessario andare in matematica per avere una risposta, non "tanti trucchi e stratagemmi".

 

1) Penso che sia ovvio che non c'è e non può esserci alcun modo di provare che un modello stabilito nella storia funzionerà necessariamente in futuro.

2) L'esistenza di un metodo che stabilisce un modello deterministico (non casuale) per il futuro basato su dati del passato sarebbe una negazione di (1)

Abbiamo solo la convalida incrociata, che può solo stabilire l'omogeneità di un modello sulla storia. Possiamo solo interpolare il modello, non estrapolarlo. Abbiamo solo una PROPOSIZIONE molto debole che un modello ben interpolato risulterà essere ben estrapolato. Questa non è un'inferenza deduttiva, ma semplicemente induttiva - una variante dell'inferenza per analogia.

 
Aleksey Nikolayev #:

1) Penso che sia ovvio che non c'è e non può esserci alcun modo di provare che un modello stabilito nella storia funzionerà necessariamente in futuro.

2) L'esistenza di un metodo che stabilisce la determinatezza (non casualità) di un modello per il futuro dai dati del passato sarebbe una negazione di (1)


Allora qual è l'ovvietà della (1) e quali sono gli argomenti per la sua validità?