L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3082

 
Maxim Dmitrievsky #:
È anche terapeuta di professione? No, sono una terapista a tempo pieno.

Sì, sto cercando clienti, vuole iscriversi?

In effetti, lei non accetta le critiche. Hai visto qualcosa di simile a quello che fai tu, con il filtraggio di porzioni scomode del campione, che nella tua mente ha dato scientificità al tuo approccio e ora lo difendi. Uno dei modi in cui lo difendete è attaccarlo, sminuendo e insultando il vostro avversario. Ammetto che c'è un progresso in questo campo - siete diventati più sobri - e posso persino lodarvi per questo.

Allo stesso tempo, la mia proposta di attività congiunta, cioè una proposta costruttiva volta ad arricchire la conoscenza dell'argomento in esame, viene definita una distrazione dal tema.

Qual è il tema di questo thread: dimostrare la bellezza e l'unicità delle menti dei singoli partecipanti? In altre parole, chiacchiere piuttosto che ricerca della verità, secondo lei?

 
Maxim Dmitrievsky #:
Sono molto chiaro su ciò che scrivo, altrimenti non lo scriverei. Non lo fai. Smettila di annaspare, sei fastidioso.
.
Studia il materiale, poi ne discuteremo. Se non ci riesci, non mi arrabbio. Masticarlo e metterlo in bocca è per gli altri.

Maxim, prima ho lanciato la traduzione che sono riuscito a ottenere. Da essa, francamente parlando, sono giunto a conclusioni simili a quelle di SanSanych Fomenko. Ammetto che è una traduzione distorta, come un sacco di cose ci suona strano poi sono il trattamento di campionamento, quindi il montaggio di indicatori ....

Ecco perché vi suggerisco di spiegare ciò che nessuno ha capito, con parole vostre, almeno con queste parole. Forse dopo questo percepirò le informazioni scritte in modo diverso.

Ecco un estratto della traduzione, è tutto chiaro?


 
СанСаныч Фоменко #:

Non c'è nell'articolo.

Viene descritto il solito fitting con diverse suddivisioni dei predittori originali, compresa la convalida incrociata. Una routine che è stata camuffata con le parole.

Ho una domanda per i conoscitori dell'apprendimento automatico. Se utilizzo i dati di un personaggio per l'addestramento, quelli di un altro personaggio per la validazione e quelli di un terzo personaggio per il test, è una buona pratica?

Inoltre, sto ottenendo i seguenti risultati dai dati di test: le celle verdi sono molto buone, quelle gialle sono buone, quelle rosse sono nella media.


Inoltre, una domanda sulla modifica dei dati per addestrare il modello. Ho notato che il modello ha difficoltà a trovare gli estremi, nel mio caso valori superiori a 60 e inferiori a 40.
Quindi trovo valori superiori a 60 e inferiori a 40 nei dati di addestramento, che aggiungo nuovamente ai dati di addestramento prima di inserirli nel modello, quindi la domanda è: posso migliorare la precisione del modello aumentando i dati di addestramento contenenti informazioni sugli estremi?

inputs_unique, indices = np.unique(inputs, axis=0, return_index=True)
outputs_unique = outputs[indices]

#  Find indices where outputs_unique values are greater than 60
indices_greater_than_60 = np.where(outputs_unique > 0.6)

#  Get the corresponding inputs_unique and outputs_unique values
filtered_inputs_greater = inputs_unique[indices_greater_than_60]
filtered_outputs_greater = outputs_unique[indices_greater_than_60]

#  Add filtered_inputs values to inputs_unique
inputs_unique = np.concatenate((inputs_unique, filtered_inputs_greater), axis=0)
#  Add filtered_outputs values to outputs_unique
outputs_unique = np.concatenate((outputs_unique, filtered_outputs_greater), axis=0)

#  Find indices where outputs_unique values are smaller than 40
indices_smaller_than_40 = np.where(outputs_unique < 0.4)

#  Get the corresponding inputs_unique and outputs_unique values
filtered_inputs_smaller = inputs_unique[indices_smaller_than_40]
filtered_outputs_smaller = outputs_unique[indices_smaller_than_40]

#  Add filtered_inputs values to inputs_unique
inputs_unique = np.concatenate((inputs_unique, filtered_inputs_smaller), axis=0)
#  Add filtered_outputs values to outputs_unique
outputs_unique = np.concatenate((outputs_unique, filtered_outputs_smaller), axis=0)
 
Chapter 1 Introduction | An R Companion for Introduction to Data Mining
  • Michael Hahsler
  • mhahsler.github.io
1.1 Used Software This companion book assumes that you have R and RStudio Desktop installed and that you are familiar with the basics of R, how to run R code and install packages. If you are new...
 

 
Lilita Bogachkova #:

Ho una domanda per gli esperti di apprendimento automatico. Se utilizzo i dati di un personaggio per l'addestramento, i dati di un altro personaggio per la convalida e i dati di un terzo personaggio per il test, è una buona pratica?

brevemente NO.

si addestra il modello per riconoscere i cocomeri, lo si testa sulle mele, lo si convalida su...

 
Lilita Bogachkova #:

Ho una domanda per gli esperti di apprendimento automatico. Se utilizzo i dati di un personaggio per l'addestramento, i dati di un altro personaggio per la convalida e i dati di un terzo personaggio per il test, è una buona pratica?

Provate a utilizzare lo stesso simbolo con l'aggiunta di rumore.

 
Rorschach #:

Provate a utilizzare lo stesso personaggio con l'aggiunta di rumore.

Penso che sia meglio spostare il tempo se non si tratta di ticchettii,

il rumore distorce i dati, e il rumore ha dei parametri e non è chiaro quali scegliere, e in generale, perché non fare delle citazioni dal rumore come ho fatto di recente?

 
Maxim Dmitrievsky #:

Per trasformare i parametri di disturbo in funzioni, si possono utilizzare i valori di uscita di RF o di qualsiasi algoritmo di base, come nell'articolo. Per i non informati: sostituire i valori dei parametri selezionati con i valori delle funzioni. A quel punto la regressione lineare (o qualsiasi altro algoritmo) sarà il meta-lerner attraverso cui valutare l'effetto del tritolo. Perché e come funziona tutto questo: imparate la matematica.

Per capirlo, è sufficiente iniziare a pensare con la propria testa. Ma Sanych ricomincerà a dire sciocchezze, perché vuole solo dire qualcosa senza pensare. Sanych, la tua mancanza di comprensione è così grande che citi i parametri RF come una sorta di prova, il che è assolutamente incredibile. Te l'ho scritto tre volte: lascia perdere la radiofrequenza. Per l'ultima volta: studia l'argomento, poi sproloquia. Altrimenti le stesse persone non istruite ti crederanno ciecamente.

E non risponda ai miei post con l'aplomb di chi sa tutto (che è fastidioso), perché non sa nulla e sembra il vaneggiamento di un ptuschnik.

Tutti i riferimenti alle fonti sono riportati nell'articolo. Avete bisogno di essere punzecchiati ad ogni parola come gattini ciechi? O siete adulti, dopotutto?

Sei tu che citi qualcos'altro....

Abbiamo addestrato bene il modello, abbiamo preso i predittori spontanei e li abbiamo sostituiti con i valori previsti dal modello, poi abbiamo addestrato di nuovo il modello. Confrontiamo il risultato tramite l'RMSE per i modelli/dati di regressione. Se il risultato migliora, i predittori sostituiti hanno cambiato le loro proprietà durante il periodo di addestramento, o cosa?

 
Lilita Bogachkova #:

Ho una domanda per gli esperti di apprendimento automatico. Se utilizzo i dati di un personaggio per l'addestramento, i dati di un altro personaggio per la convalida e i dati di un terzo personaggio per il test, è una buona pratica?

Inoltre, dai dati di test ottengo i seguenti risultati: le celle verdi sono molto buone, quelle gialle sono buone, quelle rosse sono medie.

Non sono un esperto, ma condividerò i miei pensieri.

Poche persone riescono a ottenere un modello che funziona con successo su diversi personaggi. Quindi può essere considerato un buon risultato se questo è davvero il caso. Presumo che il modello veda modelli che sono probabilisticamente ugualmente realizzati.

Lilita Bogachkova #:

E anche una domanda sulla modifica dei dati per addestrare il modello. Ho notato che il modello ha difficoltà a trovare gli estremi, nel mio caso valori superiori a 60 e inferiori a 40.
Quindi trovo valori superiori a 60 e inferiori a 40 nei dati di addestramento, che aggiungo nuovamente ai dati di addestramento prima di inserirli nel modello, quindi la domanda è: è possibile migliorare l'accuratezza del modello aumentando i dati di addestramento contenenti informazioni sugli estremi?

Se si aggiungono altri campioni, il modello può trovare un modello unificante in essi, se è presente nel prisma di predittori utilizzati.