L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3375

 
Maxim Kuznetsov #:

Dati discreti presentati sotto forma di tabella.

Non TO?

Allora mi sono perso direttamente...cosa sono i dati tabellari/non tabellari..... tabulare è una metrica lineare e la dipendenza di Y esclusivamente da X? allora sì, non funziona affatto, non esistono bestie del genere in natura.

I dati tabulari sono eterogenei, come un elenco di dipendenti. In cui sono elencati il sesso, l'età, lo stipendio, ecc. Più righe nei dati tabellari di solito non sono correlate tra loro; ad esempio, se si sommano più lavoratori, Optimus Prime non funzionerà. Ma se si sommano più pixel, si otterrà Optimus Prime.
 
Nel nostro caso, i dati originali sono serie temporali, non tabelle. Se non usiamo l'analisi delle notizie, se la usiamo, usiamo le tabelle.

Quindi, nel primo caso, sia NS che bousting sono adatti, forse NS è migliore, dipende dalla rappresentazione dei dati. Nel secondo caso, è meglio il bousting.

Abbiamo quindi imparato a distinguere tra la rappresentazione iniziale dei dati e quella successiva all'elaborazione.
 
Aleksey Nikolayev #:
Se possono essere scritti in una tabella, ma non in una matrice).
I NS funzionano meglio su dati omogenei. I dati tabellari possono essere scritti in una matrice se sono dello stesso tipo.
 
Per i dati tabellari, esiste un'architettura neuronica TabNet

Si posiziona come concorrente di boost.
L'ho provata, funziona bene, non fa skam...
 
Esistono reti di questo tipo, sì. Ma il nostro argomento richiede reti per lavorare con le sequenze piuttosto che con le tabelle. Perché sono sequenze fin dall'inizio.
 
Maxim Dmitrievsky #:
Esistono reti di questo tipo, sì. Ma il nostro argomento richiede reti per lavorare con le sequenze piuttosto che con le tabelle. Perché sono sequenze fin dall'inizio.

Sono in vena.

Può dimostrare che sono sequenze? A parte il fatto che sono sequenze.

 
I dati tabellari, a quanto mi risulta, sono stati ricavati da questo suggerimento

Sono i cosiddetti dati ordinati, cioè "tidy data".

Si tratta di una tabella in cui ogni riga è un'osservazione e la colonna è una caratteristica.

 
Maxim Dmitrievsky #:
Gli argomenti hanno bisogno di più reti per lavorare con le sequenze piuttosto che con le tabelle.
Non capisco, le sequenze non possono essere in formato tabella?
 
Maxim Dmitrievsky #:
Esistono reti di questo tipo, sì. Ma il nostro argomento richiede reti per lavorare con le sequenze piuttosto che con le tabelle. Perché si tratta di sequenze fin dall'inizio.

La prima opzione, le tabelle - fogli di calcolo Excel, ogni riga ha un indicatore temporale. La forma più familiare di dati finanziari.

La seconda opzione, le lettere scritte a mano. Imparare con un insegnante, con una lettera stampata come insegnante e una colonna sottostante di varianti scritte a mano di quella lettera.

Confronto tra il bousting e il NS. Quale è più adatto e per quale caso? O sono equivalenti?

PS.

Da Rattle, che ha rpart (albero semplice), rf, ada, SVM, glm, nnet (probabilmente il più semplice NS). Il risultato peggiore si ha con rpart, il secondo dalla fine è nnet, gli altri quattro sono circa uguali, dipende dai dati di input.

 
Maxim Kuznetsov #:

Sono di ottimo umore.

Puoi dimostrare che sono sequenze? A parte il fatto che sono sequenze.

Serie temporali è più preciso. Mi sembra che prima si debba offrire un'alternativa. Altrimenti o c'è qualcosa o non c'è niente.