L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1188

 
Dmitriy Skub:
Yuri, sei proprio fuori tema - la parola chiave qui è forchetta. Non ha niente a che fare con MO)

Fuori dal mondo, questo è sicuro. Ma è un argomento interessante. Abstract.

 
Yuriy Asaulenko:

L'automazione non è così facile lì, imho. Per quanto ho capito, è difficile con le soluzioni tipiche - ci sono troppe soluzioni possibili.

L'unica cosa che mi viene in mente è un DB su squadre e giocatori, di cui ci sono centinaia, entrambi)).

Diversi bookmakers una squadra può essere chiamata in modo diverso: Olympique, Marsiglia + in latino, almeno 4 varianti. Diversi prefissi FK - club di calcio, PFC - club di calcio professionale.

Automatizzare le forchette è una rottura di scatole.

 

è un po' troppo semplice.

In effetti, il punto di RL non sono nemmeno i pacchetti, ma l'approccio, cioè l'overshooting. Usato al posto della genetica, ma attraverso un approssimatore di tipo NS

la difficoltà principale è quella di campionare dalle giuste distribuzioni

 
Maxim Dmitrievsky:

è troppo semplice.

In effetti, il punto di RL non sono nemmeno i pacchetti, ma l'approccio, cioè l'overshooting. Usato al posto della genetica, ma attraverso un approssimatore di tipo NS

la difficoltà principale è quella di campionare dalle giuste distribuzioni

Beh, l'esempio semplice è abbastanza normale, perché l'esempio non ha bisogno di essere complicato, e il fatto che ci siano già pacchetti pronti è buono.... Non capisco nemmeno questo semplice esempio (( Non capisco perché le matrici dovrebbero essere riempite di probabilità e perché queste probabilità sono necessarie e come vengono calcolate

 
mytarmailS:

Beh, l'esempio semplice è abbastanza normale, perché l'esempio non dovrebbe essere complicato, e il fatto che ci siano già pacchetti pronti è buono.... Non capisco nemmeno questo semplice esempio (( Non capisco perché le matrici dovrebbero essere riempite di probabilità e perché queste probabilità sono necessarie e come vengono calcolate

probabilità di transizioni di stato, catene di Markov

come la probabilità di comprare in qualche condizione, o di vendere

la matrice è riempita con tutti gli stati possibili, poi si seleziona lo stato attuale e si guarda il segnale... è una tabella primitiva :)

 
Maxim Dmitrievsky:

probabilità di transizioni di stato, catene di Markov

Beh, ho capito che....

Non capisco il loro ruolo nel codice

 
mytarmailS:

Ho capito che....

Non capisco il loro ruolo nel codice.

Cosa intendi per ruoli? È una tabella di transizioni di stato e di probabilità

 
Maxim Dmitrievsky:

È una tabella di transizioni di stato e di probabilità.

Non so da dove vengano le probabilità di transizione, abbiamo 4 direzioni - sinistra, destra, su, giù. L'algoritmo deve trovare la strada "da qualche parte" con la giusta combinazione di direzioni. Anche prima che l'algoritmo inizi a cercare la giusta combinazione di probabilità ha creato una matrice con le probabilità di transizione, dove hanno preso queste probabilità?

Probabilmente sono molto stupido, ma comunque, se non ti dispiace che te lo chieda, perché non mi spieghi?

 
mytarmailS:

Non capisco da dove vengono le probabilità di transizione, abbiamo 4 direzioni - sinistra, destra, su, giù. L'algoritmo deve trovare la strada "da qualche parte" attraverso una corretta combinazione di direzioni. Anche prima che l'algoritmo inizi a cercare la giusta combinazione di probabilità ha creato una matrice con le probabilità di transizione, dove hanno preso queste probabilità?

Probabilmente sono solo un idiota, ma comunque, se non ti dispiace spiegare.

Leggete le basi, non su R, solo su internet.

Inizialmente le probabilità sono scelte casualmente, poi durante le iterazioni sono aggiornate con diversi metodi, principalmente il metodo TD, alla fine convergono verso un ottimo, cioè risolvono il problema originale, per esempio uscire dall'appartamento dove ci sono diverse stanze nel modo più veloce, senza andare in altre stanze. A questo scopo, si specifica una matrice di stati (matrice di valori) e una matrice di transizioni (matrice di politiche), cioè per ogni stato (essere in una certa stanza) ci possono essere diverse transizioni verso altre stanze e le loro probabilità. Dopo ogni azione, viene restituita una ricompensa numerica (buona-cattiva). L'essenza del metodo è massimizzare la ricompensa, cioè un agente è penalizzato per le transizioni sbagliate e premiato per quelle giuste

 
Maxim Dmitrievsky:

Non ho visto nulla nel thread sui criteri di informazione(bayesiani o Akaike). Forse sono usati di default (nei pacchetti MoD applicati)?