L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2745

 
JeeyCi #:


e i test statistici per i coefficienti di regressione a cosa servono? o a testare le ipotesi sull'uguaglianza di media e varianza? (se la PCA mostra ancora che la prima PC spiega una quota accettabile di varianza [la varianza residua è molto piccola] - allora si accetta e si verifica la conferma della significatività dei coefficienti di regressione...).

idealmente -- è chiaro che per avere una probabilità del 100% dovremmo usare relazioni funzionali piuttosto che di correlazione -- ma se studiamo un processo stocastico, i risultati saranno solo probabilistici e confermabili solo su un gran numero di dati di prova e solo fino a quando non apparirà un nuovo driver sul mercato.... [qui, tra l'altro, è molto importante anche la consapevolezza logica e fattuale, non solo l'analisi robusta].

L'adattamento alla storia è sempre presente, finché ci si basa sui dati storici..... ma possiamo sempre confrontare la varianza con la statistica F -- se la riduzione della varianza è molto più grande della varianza rimanente non spiegata, allora viene identificata una nuova regressione. (con dr SLOPE)... e funziona solo fino a un momento nel futuro e solo su grandi numeri... beh, o cambia lo stato dell'attore (se si usa DL)... ma l'autista sa bene che non deve aspettare... ma è meglio conoscere il driver che aspettare che il campione attuale venga raccolto per confermarlo.

L'ingegneria delle caratteristiche se rende logica, come avete giustamente notato, la logica "teorica" (sotto qualsiasi elaborazione statistica ci sono leggi logico-fisiche terrestri e la conoscenza umana, i modelli non cadono dall'aria) -- [ma qualcuno potrebbe essere ignorante] -- allora la FS nel processo di modellazione non disturberà molto né il modellatore né lo sviluppatore.... e non si può andare da nessuna parte senza la storia, per sapere cosa e quando è diventato un motore e cosa no - non serve molta intelligenza nella matematica superiore, ma solo la comprensione delle leggi del mercato del denaro e delle materie prime, dei settori privati e statali, altrimenti useremo l'apparato della matematica superiore applicata solo "dopo" per apprendere che la notizia che ha cambiato il mondo è già stata sentita una volta.... È solo che la reazione del mercato, compresa la reazione del mercato, è di solito in ritardo.

p.s..

a chi le parole e le lettere sono sconosciute, non legga un argomento sconosciuto di lettere sconosciute, per non aggrapparsi alle lettere - cerchi una macchina VM per il suo FS.... se poi dimostrate anche la validità statistica dei vostri risultati, e non solo la % di hit-to-point (non sempre imparziale, tra l'altro)), allora le conversazioni saranno diverse.... Ma per ora, sì, ognuno ha la sua terminologia....

Tutto è iniziato con il fatto che le persone volevano cooperare )) ha iniziato a risolvere, si è scoperto che ognuno nega tutto ciò che gli altri fanno. In più inventano nuove definizioni. Alla fine nessuno ha capito niente. In generale mi piace l'approccio di Sanych, quindi ho chiesto di entrare nello specifico. E anche con le denominazioni è un problema che ci sia una relazione e un collegamento, se non una correlazione.

È ovvio che egli tiene al suo know-how e non rivela i dettagli.
 
Maxim Dmitrievsky #:
Tutto è iniziato con persone che volevano una cooperativa). Inoltre inventano nuove definizioni. Alla fine nessuno ha capito nulla. In generale, mi piace l'approccio di Sanych, quindi ho chiesto di entrare nello specifico. E anche con le denominazioni, cos'è la relazione e la connessione, se non una correlazione.

Evidentemente tiene al suo know-how e non rivela i dettagli.

Per come la vedo io, ci sono due tipi di correlazione.

Il primo è quello causale, che è determinato da informazioni a priori sull'oggetto della ricerca provenienti dalla conoscenza dell'area tematica in questione, non da calcoli.

Il secondo tipo è la dipendenza probabilistica, che può essere calcolata a posteriori da alcuni dati ottenuti osservando il comportamento dell'oggetto. Il secondo tipo comprende la correlazione, la dipendenza deterministica (come caso estremo) e così via, compresa quella descritta dalle copule e da altri metodi. La base per lo studio di questo tipo è l'ipotesi che esista una distribuzione congiunta per i predittori e l'obiettivo.

 
Aleksey Nikolayev #:

A mio avviso esistono due tipi di comunicazione.

Il primo è quello causale, che è determinato da informazioni a priori sull'oggetto della ricerca provenienti dalla conoscenza dell'area tematica in questione, piuttosto che da alcuni calcoli.

Il secondo tipo è la dipendenza probabilistica, che può essere calcolata a posteriori da alcuni dati ottenuti osservando il comportamento dell'oggetto. Il secondo tipo comprende la correlazione, la dipendenza deterministica (come caso estremo) e così via, compresa quella descritta dalle copule e da altri metodi. La base per lo studio di questo tipo è l'ipotesi che esista una distribuzione congiunta per i predittori e l'obiettivo.

Corretto. Per mancanza di ipotesi a priori, si utilizza il secondo tipo. Mi chiedo come la veda Sanych. Ad esempio, il modo in cui vengono costruiti i target può essere semplicemente adattato a qualsiasi tratto e viceversa.

Il mio approccio è completamente personalizzato per tali manipolazioni, forse qualcosa può essere migliorato.
 
mytarmailS #:

Esiste una PCA che considera l'obiettivo, che evidenzierà le componenti che caratterizzano l'obiettivo,

non lo farà mai. Non tiene conto della relazione con l'obiettivo. - creerà solo una proiezione ortogonale nello spazio delle caratteristiche che spiega la massima varianza..... (Non sono sicuro se la rotazione debba essere fatta manualmente [mi sembra che ci fosse qualcosa al riguardo nel pacchetto Statistika - qualche pulsante] o se lo farà automaticamente - altre librerie potrebbero già avere la rotazione incorporata).


mytarmailS #:

ma la cosa triste è che il target è una variabile soggettiva e "fluttuerà" non appena la traccia sarà terminata.... e in che modo è diverso dal normale apprendimento con un insegnante?

Sì, purtroppo, avete le vostre interpretazioni dello scopo di questo metodo e i vostri modi e scopi di usarlo.... Non so come possa aiutarvi con queste opinioni... - quindi non c'è nemmeno bisogno di chiedermi altro.
 
JeeyCi #:
1)non lo farà mai: non tiene conto dei collegamenti con il target!!!! - creerà solo una proiezione nello spazio delle caratteristiche che spiega la massima varianza.... (Non sono sicuro se la rotazione debba essere fatta manualmente [credo che ci fosse qualcosa al riguardo nel pacchetto Statistika - qualche pulsante] o se la risolverà automaticamente - altre librerie potrebbero già avere la rotazione incorporata).


2)sì, triste - avete le vostre interpretazioni dello scopo di questo metodo e i vostri modi e scopi di usarlo... Non so come possa aiutarvi con tali punti di vista..... - quindi non c'è nemmeno bisogno di chiedermi altro.

1) Sto dicendo che ci sono rsa che tengono conto dell'obiettivo.

2) Non ho chiesto nulla, l'ho affermato.

 

mytarmailS #:

1) Sto dicendo che ci sonorsa che tengono conto deltargeting.

2) Non stavo chiedendo nulla, stavo affermando.

questi sono già algoritmi per legare artificialmente i PC al target - algoritmi diversi (software implementati a volte anche in modo diverso in librerie diverse)... come leghi il target alle caratteristiche è affar tuo, non rende il punto di PCA = "con il maestro" (il maestro è legato separatamente - infatti - in qualsiasi modo tu voglia) -- ancora una volta stiamo uscendo dal punto e stiamo entrando nell'argomento "gusto e colore..." (librerie). (biblioteche).

Non sono nemmeno sicuro che tu sappia se la tua libreria fa la rotazione o se devi codificarla tu stesso... quindi le affermazioni non verificate e incomplete/inesatte non interessano a nessuno qui, soprattutto quando cambiano il significato e l'essenza dei fenomeni/oggetti, dopo di che gridi che non capisci le parole... a quanto pare non capisci nemmeno le tue stesse parole con precisione

 
JeeyCi #:

Non sono nemmeno sicuro che tu stesso sappia se la tua libreria effettua la rotazione o se devi codificarla tu stesso....

non giudicare da solo

(Non sono sicuro se la rotazione debba essere fatta manualmente [credo che ci fosse qualcosa al riguardo nel pacchetto Statistika - qualche pulsante] o se lo farà automaticamente - nell'altro.

JeeyCi #:

quindi le affermazioni non verificate e incomplete/inesatte non interessano a nessuno.

E se non si è sicuri, allora non c'è il diritto di affermare nulla che sia verificato. cosa non lo è, chi è interessato, chi non lo è.... se la testa è in ordine ovviamente


ps E se c'è rotazione nella matrice è facile da controllare se c'è comprensione, ma a quanto pare c'è un problema con questo.....

 

Quindi verificatelo prima di scagliarvi contro le persone,

- se non lo capisci dalla prima volta, per favore riversa i tuoi toni guriani/imprecisi nel tuo codice e nei tuoi risultati, invece di cercare quelli estremi

 
Che differenza c'è con l'LDA? Tra virgolette, si ottiene un adattamento stretto che non funziona con i nuovi dati. Ma riduce quasi a zero l'errore del modello addestrato su di essi. Una situazione simile può verificarsi con l'approccio di Sanych. Il principio è lo stesso: adattare le mosche alle cotolette.

Ma una finestra scorrevole dovrebbe portare un po' di gioia se si raccolgono statistiche su di essa. Non riesco ancora a immaginarlo.
 

Una specie di picco di messaggi!


Ancora una volta.

Classifico i predittori in base alla capacità predittiva.

Uso il mio algoritmo perché gli algoritmi di numerosi pacchetti sono troppo lenti - il mio è meno accurato ma molto veloce.

La capacità predittiva NON è una correlazione e NON è il risultato della scelta dei predittori che i modelli producono.

L'abilità predittiva è correlazione di informazioni e NON:

1. La correlazione è la "somiglianza" di una serie stazionaria con un'altra, e c'è sempre un valore e non un valore di "nessuna relazione". La correlazione ha sempre un qualche valore, quindi si può facilmente usare la correlazione per trovare la relazione tra un insegnante e i fondi di caffè.

2. La selezione delle schede è la frequenza di utilizzo delle schede nella costruzione dei modelli. Se prendiamo dei predittori non correlati all'insegnante, otteniamo comunque una classifica di schede.

Un analogo alla mia comprensione del "potere predittivo" è per esempio caret::classDist(), che definisce le distanze di campionamento Mahalanobis per ogni classe di centri di gravità. Oppure woeBinning. Ci sono molti approcci e molti pacchetti in R. Ce ne sono altri basati sulla teoria dell'informazione.