L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3104

 

Tutto il dolore di questo tipo di test A/B in un solo video

(non guardatelo per chi è particolarmente impressionabile)


 
Maxim Dmitrievsky #:

Tutte le difficoltà di questo tipo di test A/B in un solo video

(non guardatelo per chi è particolarmente impressionabile)


Non vi sembra che all'inizio parli di un esempio binario, ma nel codice prenda una serie di numeri da una distribuzione normale?

Inoltre, tutti i test di questo tipo dipendono da un generatore di numeri casuali, e bisogna tenerne conto. La natura dell'aspetto dei numeri può essere più complessa per ogni fenomeno, anche se può avere una distribuzione normale.

In questo approccio al problema, come egli dimostra, è più ragionevole quindi non misurare i "giorni", ma valutare la dinamica di arrivo alla soglia e il tempo di permanenza oltre la soglia.

In generale, sarebbe più utile osservare il fenomeno su dati reali per trarre conclusioni in merito.

 
Aleksey Vyazmikin #:

Non pensate che all'inizio stia parlando di un esempio binario, ma che nel codice stia prendendo esattamente la gamma di numeri di una distribuzione normale?

Inoltre, tutti i test di questo tipo dipendono da un generatore di numeri casuali, quindi anche questo dovrebbe essere preso in considerazione. La natura dell'aspetto dei numeri può essere più complessa per ogni fenomeno, anche se può avere una distribuzione normale.

In un approccio di questo tipo al problema, come mostra l'autore, è più ragionevole non misurare i "giorni", ma stimare la dinamica di arrivo alla soglia e il tempo di superamento della soglia.

In generale, sarebbe più utile osservare il fenomeno su dati reali per trarre conclusioni in merito.

Deve essere molto difficile quando non si sa mai di cosa si sta parlando e del contesto).

Il punto è che anche se si dispone di una traccia e di un test della stessa distribuzione, non è sempre possibile confermare o smentire un'ipotesi, ad esempio sulla robustezza del modello. per non parlare di quando si tratta di distribuzioni diverse.

A ciò si aggiungono i test multipli e la moltiplicazione della significatività statistica di tali test per zero.

 
Maxim Dmitrievsky #:

deve essere molto difficile quando non si sa mai di cosa si sta parlando? e il contesto )

e il punto è che anche se si dispone di una traccia e di un test della stessa distribuzione, non è sempre possibile confermare o smentire un'ipotesi, ad esempio, sulla robustezza del modello. per non parlare di quando provengono da distribuzioni diverse.

A questo si aggiungono i test multipli e si moltiplica per zero la significatività statistica di tali test.

Capisco. Sta parlando dell'essenza, e sta solo appendendo le orecchie....

 
Aleksey Vyazmikin #:

Vedo. Sta parlando dell'essenza, e sta solo appendendo le orecchie....

non coglie il punto.

 
Maxim Dmitrievsky #:

non hai capito il punto.

Quello che una persona dice lì, facendo conclusioni di ampia portata, è già chiaro, ma non si rende conto che il risultato dipende dall'algoritmo del generatore di numeri casuali.

L'unica conclusione che ha valore è che la modellazione al computer in forma primitiva non permette di avvicinarsi ai processi reali senza comprenderli.

Se dividesse la distribuzione in due parti con 0 e 1 e dimostrasse di avere un ordine di grandezza in più di unità, sarei sorpreso. Vede, dice una cosa e ne fa un'altra.

Proprio ora sto cercando di prevedere la probabilità di distribuzione (ho una classificazione) nel segmento quantistico per i prossimi 3 mesi in base all'effettivo cambiamento della distribuzione nel tempo, e con i test sono riuscito ad aumentare il 15% di precisione grazie a queste metriche, e penso che questo non sia il limite.

In generale, l'autore del video ha trovato una buona "scusa" per giustificare una conclusione errata dell'esperimento. Sì, è comoda, ma non è funzionale. Intendo dire che dalle sue parole è necessario fissare il tempo/numero di osservazioni e trarne una conclusione. In generale, non lo capisco proprio: a cosa serve, se non a giustificare il datore di lavoro.

 
Aleksey Vyazmikin #:

Quello che l'uomo sta dicendo, facendo conclusioni di ampia portata, è già chiaro, ma non si rende conto che il suo risultato dipende dall'algoritmo del generatore di numeri casuali.

Il p-hacking è un problema noto, che ha cercato di spiegare a dei nerd che non ne hanno capito l'essenza.

Non possiamo creare tonnellate di lettere senza senso? È già chiaro che non c'era comprensione.
 
Maxim Dmitrievsky #:

Il p-hacking è un problema noto, che ha cercato di spiegare a dei nerd che non hanno capito il punto.

Possiamo evitare di fare tonnellate di lettere senza senso? È già chiaro che non c'è stata comprensione.

È un peccato che lei continui a non capire quello che sto cercando di farle capire.

 
Non dire parolacce.
 
Maxim Dmitrievsky #:

Tutte le difficoltà di questo tipo di test A/B in un solo video

(non guardatelo per chi è particolarmente impressionabile)


È giunto il momento di passare tutti al lato chiaro, al matstat!)

Il lato oscuro, come sempre, si oppone) Oscuro nel senso che cerca sempre di ridurre tutto all'oscuro e al poco chiaro - nella versione estrema a un certo "flair").