L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2742

 
Aleksey Nikolayev #:

Credo di aver visto qualche accenno a un'applicazione per l'analisi della sopravvivenza.

Non l'ho fatto personalmente, ma una volta ho posto una domanda simile. Questo approccio mi sembra promettente, ma proviene da un ambito completamente diverso.

 
СанСаныч Фоменко #:

Dice classDist {caret}, cioè specifica una funzione particolare che fa parte del PACKAGE caret

Da quello che ho capito, non conoscete R. Allora perché stai perdendo tempo su questo thread e su MO in generale?

Senza la padronanza di R, la discussione sul MO non ha senso.

Ho taciuto sull'entropia solo perché l'entropia incrociata è una funzione di perdita standard per i modelli di classificazione.... Il MO non è implementato solo in R! (conoscere una libreria e non conoscere la natura delle entità su cui opera - si va senza capire la direzione del proprio movimento).

alla domanda ancora più difficile - perché vi dissociate categoricamente dalla statistica, quando dichiarate di parlare di"teoria dell'informazione"?... mentre è stata creata esattamente come una

Il campo si trova all'intersezione tra matematica , statistica , informatica , fisica , neurobiologia , ingegneria dell'informazione ed elettrotecnica.

in effetti, la discussione è priva di argomenti, se si opera per frammenti e per il proprio ego (e anche per qualcuno, non solo per se stessi), e non per l'oggetto del dialogo... il filo non cambia, purtroppo (non si aggiunge specificità e argomento nelle risposte)
 
Maxim Dmitrievsky #:
Ancora una volta questo ottuso portavoce richiama tutti alla verità, ma non ha ancora deciso quale

Hai già annoiato il moderatore a tal punto che sta demolendo tutto.

Non leggete i post provocatori dell'utente JeeyCi (il suo post è una provocazione e una richiesta di "continuare il banchetto").
Ieri ho cancellato diversi post con parolacce e cafonate con attacchi personali, guidato da questo - ho cancellato i post
di JeeyCi .

Ho fatto due avvertimenti nel thread, sono stati ignorati, e poi ho cancellato diversi post con parolacce.
L'unico post letterario (che fosse leggibile) è stato il tuo post - questo (che ha dato il via a tutto ieri):

Forum sul trading, sui sistemi di trading automatizzati e sul test delle strategie di trading

...

Maxim Dmitrievsky, 2022.09.10 12:15

Esistono selezioni basate su modelli, agnostiche e miste. Se si prende il modello agnostico, si tratta di correlazione e informazione reciproca (basata sull'entropia). Quest'ultima si differenzia dalla prima per la sua capacità di catturare le dipendenze non lineari, per il resto è la stessa cosa. In questo caso è difficile parlare di una relazione tra caratteristica e obiettivo, addirittura impossibile. È solo una correlazione. Ma è utile per eliminare le caratteristiche non informative.

È possibile farlo in una finestra scorrevole, o in una finestra sfuggente, o in una finestra scorrevole, o in una finestra sfuggente

Se si vuole determinare in modo specifico la causalità, si tratta di inferenza causale, che include l'uso di MO, che non so come applicare a una serie temporale, non avendo studiato l'argomento.

E tutti i metodi precedenti non funzionano per trovare la causalità, ma solo per l'addestramento ottimale degli algoritmi.

Quindi ancora una volta i cittadini non riescono a concentrarsi e a togliere le mosche dalle loro cotolette.

Del grande e onnipotente R abbiamo già sentito parlare molte volte. Ovviamente, se gli si mette dietro una scimmia, anch'essa può considerarsi uno statistico e un analista, tanto è grande.

Sì, ogni tanto cancello le parolacce, soprattutto se durano mezza giornata e due pagine di testo per esempio (come ieri).

----------------

Questo thread è molto popolare (viene letto anche sul forum di lingua inglese ed è considerato il thread chiave su questo argomento).
Quindi per favore - meno parolacce.

 
mytarmailS #:

Se si analizzano i TS dei trader più o meno di successo, si noterà che tutti fanno trading sui livelli.

Non ho visto un solo trader di successo che operi con l'aiuto di indicatori.

Un livello è un punto di ingresso chiaro e comprensibile con un chiaro stop....

Se riuscite a fare trading con un basso rischio, non avete bisogno di nient'altro, un basso rischio per trade/un'entrata precisa è la cosa più importante!

Con l'aiuto del MO si possono cercare i livelli di PD/SP e le entrate esatte, non è banale, non è semplice, non si può leggere nei blog sul MO, qui è necessario usare la propria testa....

Puoi anche disegnare i livelli sul grafico sb ed è anche una serie temporale. Ne abbiamo abbastanza di te, non ti rispondiamo più. Dici sciocchezze giorno dopo giorno.
 
mytarmailS #:

Ecco un esempio su un campione generato casualmente di 5 tratti e 1 obiettivo binario

selettore forrest e fiche

La coda dei task è stata scaricata un po' - è diventato possibile eseguire lo script. Lo eseguo e ottengo un errore.

> install.packages("randomForest")
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Installing package into ‘C:/Users/S_V_A/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Warning in install.packages :
  package ‘randomForest’ is not available (for R version 4.0.5)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/bin/windows/contrib/4.0:
  cannot open URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/PACKAGES'

> library(randomForest)
Error in library(randomForest) : нет пакета под названием ‘randomForest’

Ho capito bene che il programma vuole una vecchia versione di R 4.0?

Beh, ho cercato una vecchia versione ma non l'ho trovata. Una terribile incompatibilità è ovviamente ripugnante.

 
Aleksey Vyazmikin #:

La coda di attività è stata scaricata un po' - è diventato possibile eseguire lo script. Lo eseguo e ottengo un errore.

Ho capito bene che il programma vuole la vecchia versione R 4.0?

Io ho R-3.6.3.

Lo sto scrivendo sulla vecchia R-3.6.3 per motivi miei, quindi è un problema mio...

Non potevo immaginare che il pacchetto fosse stato rimosso da tap....

Aleksey Vyazmikin #:

Ho capito bene che il programma vuole la vecchia versione di R 4.0?

correttamente

Aleksey Vyazmikin #:

Beh, in generale ho cercato la vecchia versione e non l'ho trovata. Terribile incompatibilità è ripugnante, naturalmente.

Ascolta, forse non si può andare in commercio, con un tale smikalka??? ))

Con la compatibilità lì tutto va bene, python, per esempio, solo invidiare tale compatibilità....


Vedi anche

https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2

Provatelo sulla versione attuale

urlPackage <- "https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-12.tar.gz"
install.packages(urlPackage, repos=NULL, type="source") 

 
Per riassumere la teoria di Sanych (dato che lui stesso non è riuscito a formalizzarla correttamente e a fornire esempi):

*il suo modo di selezionare le caratteristiche si basa sulla correlazione, poiché "relazione" e "connessione" sono definizioni di correlazione.

*In questo modo facciamo un adattamento implicito alla storia, simile nel significato a LDA (analisi discriminante lineare) o PCA, semplifichiamo il processo di apprendimento, riduciamo l'errore.

*Non esiste nemmeno una teoria secondo cui il modello addestrato dovrebbe funzionare meglio su nuovi dati (non coinvolti nella stima dei legami tra caratteristiche e target), perché le caratteristiche sono state adattate al tratto o (peggio) alla storia disponibile.

*La situazione è in qualche modo migliorata dalla media dei CQ in una finestra scorrevole, come se si potesse stimare la diffusione e selezionare quelli più stabili. Almeno abbiamo qualche statistica su cui fare affidamento.

*Stavo pensando alla causalità o a una relazione statisticamente significativa, ma non è questo il caso del suo approccio.
 
Maxim Dmitrievsky #:
Per riassumere la teoria di Sanych (dato che lui stesso non è riuscito a formalizzarla correttamente e a fornire esempi):

*il suo modo di selezionare le caratteristiche si basa sulla correlazione, poiché "relazione" e "rapporto" sono definizioni di correlazione.

*In questo modo si fa un adattamento implicito alla storia, simile nel significato a LDA (analisi discriminante lineare) o PCA, si semplifica il processo di apprendimento, si riducono gli errori.

*Non esiste nemmeno una teoria secondo cui il modello addestrato dovrebbe funzionare meglio su nuovi dati (non coinvolti nella stima delle relazioni tra caratteristiche e target) perché le caratteristiche sono state precedentemente adattate al tratto o (peggio) all'intera storia disponibile.

*Per relazione intendevo causalità o una relazione statisticamente significativa, ma questo non è il caso del suo approccio.

Con tutto il rispetto, ma questa non è una sintesi (non è un riassunto o una sintesi). È pieno di atteggiamenti personali e attacchi infondati.

Si potrebbe pensare che qualcuno abbia una teoria valida in cui "un modello addestrato dovrebbe funzionare su nuovi dati" :-) e convalidata...sì.

 
Maxim Kuznetsov #:

con tutto il rispetto, ma questa non è una sintesi (non è un riassunto o una sintesi). Si tratta di un atteggiamento personale e di attacchi infondati.

Si potrebbe pensare che qualcuno abbia una teoria valida in cui "un modello addestrato dovrebbe funzionare su nuovi dati" :-) e validata...sì.

E se si legge con attenzione, si può vedere l'imboscata al punto 2, cioè l'adattamento iniziale alla storia. Ecco perché ha una caduta dell'errore di apprendimento.

Il punto 4 è un po' più ottimistico se non viene fatto su tutta la storia disponibile. Dovrebbe essere fatto solo per il campionamento delle traine, per la bontà dell'adattamento. Per ottenere una stima adeguata del modello su nuovi dati.

Non conosco nessuno che si occupi di psicologia, per cui non si sparge da nessuna parte. E non conosco nessuno personalmente.
 
СанСаныч Фоменко #:

La potenza non è sufficiente per raggiungere il livello EA. Ma il risultato dell'errore di adattamento del modello: dall'8% al 22% è un errore di adattamento che differisce di poco nella sezione di adattamento e fuori dal campione.

Questo suggerisce che l'adattamento all'intera storia è stato effettuato prima dell'addestramento. Se non è così, vi prego di correggermi. A quale intervallo sono state stimate/selezionate le caratteristiche e a quale intervallo è stato effettuato l'addestramento?

Ho un metodo simile, posso condividere i risultati questo fine settimana. Solo se c'è una comunicazione concreta piuttosto che un gioco di parole.