L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1271

 
Mi è venuta in mente l'idea che una distribuzione normale può essere prevista solo su processi completati (solo un pensiero - non ho controllato), e che il mercato non lo è, quindi tutte le ipotesi sulla sua distribuzione irregolare e sulla non stazionarietà sono solo congetture, che non possono essere testate mentre il mercato esiste.
 
Maxim Dmitrievsky:

Per il mercato, è formato esattamente allo stesso modo, perché la tecnologia è la stessa. Lasciate perdere "l'influenza", non viene insegnata esplicitamente nel modo in cui la immaginate voi. Ci sono insiemi di strategie, strategie ottimali, ecc. (in RL si chiamano politiche).

Se avessimo un creatore di bot potremmo fargli una serie di domande ed essere molto sorpresi dalle risposte. Tutte queste RL sono buone per imparare le influenze ambientali stazionarie, ma se stai giocando contro un altro giocatore, allora la RL nuda non funzionerà. Non ho studiato a fondo questo settore, potrei sbagliarmi. Ma c'è una chiara interazione con l'ambiente che cambia, non si può vedere dal comportamento dei bot non c'è aspettativa di nulla, non si può vedere affatto, c'è un controllo della probabilità di causare danni sia a voi che al vostro avversario, e ci sono errori di calcolo semplicemente e agire verso meno possibilità di esito negativo, ma non è la probabilità data dalla politica all'inizio del gioco - è l'influenza sull'ambiente che cambia.

 
Vi ho letto. Un paio di post e mi sono reso conto che la teoria va avanti. Ma sarete sorpresi quando inizierete a praticare. Costruire modelli e cercare nuove soluzioni non è niente in confronto al trading reale, quando si imposta tutto, lo si mette a posto e si aspetta...... Poi appare il primo segnale e il robot apre un trade. Ma la cosa peggiore è quando si analizza il risultato di questo commercio e la sua decisione (del robot). Continuerà a fare soldi o è ora di cambiarlo. Nella mia esperienza di solito trovo che dopo l'ottimizzazione fa uno o tre trade perdenti e poi inizia a salire. E in questi momenti, anche tu cominci ad agitarti e a controllare. Salirà o non salirà. Significa che nel trading reale si affrontano questi problemi a cui non si è mai pensato quando si cercava e si ottimizzava. Quindi, prima iniziate a praticare e più velocemente affronterete i problemi di un trader praticante. Naturalmente, I.M.O.
 
 
Ho guardato il video e il commento in russo, e sono stato persino sorpreso di avere un'idea molto corretta del comportamento - c'è la valutazione dei beni, c'è la probabilità del risultato, c'è il micro-controllo, e ci sono strategie iniziali spurie per lo sviluppo. C'è un'enfasi molto forte sulla selezione esattamente delle unità per combattere con l'efficienza del micro-controllo e apparentemente le più efficaci da un punto di vista economico, e in più altre non sono necessarie, poiché le battaglie vengono vinte rapidamente. In generale, è chiaro che ci sono diversi componenti, e molto probabilmente non un solo neurone, e diversi modelli responsabili di diverse componenti. E in più gli stessi sviluppatori hanno dichiarato che usano diversi modelli di strategie di base, in modo che ci sia una certa casualità.
 

Ciao a tutti. Dal momento che abbiamo stabilito che TUTTI qui sono abbastanza intelligenti e questo non è sarcasmo ma una dichiarazione di fatto. Il campo di ME non manca di intelligenza, quindi ho una domanda per la comunità. Qualcuno ha mai amministrato UBUNTU? Sto parlando dell'amministrazione. Il problema è questo. Durante l'ottimizzazione questo processo viene eseguito tante volte quanti sono i core nel sistema e li parallelizza.

Domanda: è possibile forzare 2 o 4 core a servire un processo in esecuzione non divisibile? Beh, sono solo io... forse qualcuno ne sa qualcosa...

 

Google sta lavorando oggi

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

Ok, ieri ho avuto un'altra discussione inutile

 
Maxim Dmitrievsky:

Google sta lavorando oggi

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

Ok, ieri ho avuto un'altra discussione inutile

Notate, sul grafico dell'aspettativa dell'esito della battaglia, c'è esattamente la probabilità di cui parlavo - situazionale, che attiva il feedback dei neuroni. Si può vedere chiaramente come questa probabilità cambia man mano che entrambe le parti esplorano e perdono unità - cioè c'è un costante ricalcolo dell'equilibrio di potere e delle proprie aspettative. Questa non è chiaramente una classica variante RL.


 
Aleksey Vyazmikin:

Notate che sul grafico dell'aspettativa di battaglia, c'è esattamente la probabilità di cui stavo parlando - la probabilità situazionale che attiva il feedback dei neuroni. Si può vedere chiaramente come questa probabilità cambia man mano che entrambe le parti esplorano e perdono unità - cioè c'è un costante ricalcolo dell'equilibrio di potere e delle proprie aspettative. Questa non è chiaramente una classica variante RL.


Quindi sei così maldestro, pensavo fosse quello che stavo cercando di dirti :D

Leggete anche l'equilibrio di Nash nel link, ho descritto l'algoritmo 1 in 1 ieri, senza nemmeno leggere

il punto è che il gioco non ha una stima di probabilità e il gioco ha un'EFFICIENZA :)) torna indietro e leggi il tuo post

L'ovvio è il classico RL profondo LOL, smettila di parlare di spazzatura quando non sei in argomento

 
Maxim Dmitrievsky:

Sei così maldestro che ho pensato che fosse quello che stavo cercando di spiegarti :D

leggete anche l'equilibrio di Nash nel link, ho descritto l'algoritmo 1 in 1 ieri, senza nemmeno leggerlo

il punto è che il gioco non ha una stima della probabilità e il gioco ha un'EFFICIENZA :)) torna indietro e leggi il tuo post

L'unica cosa che vedi è un classico RL profondo LOL, smettila di dire sciocchezze quando non sei in tema.

Questo è un forum per il trading, sistemi di trading automatico e test di strategie di trading

Sono sempre stato interessato al trading sul mercato Forex e sono convinto che questo sia il modo migliore per insegnare il machine learning.

Aleksey Vyazmikin, 2019.01.25 17:15

Io la vedo in modo leggermente diverso, il giocattolo ha convenzionalmente una valutazione matematica di ogni lato che consiste di molti fattori - il numero di bot e il loro potenziale, i beni, il denaro, e l'obiettivo dell'avversario di diminuire questa cifra di valutazione in modo da mantenere la sua cifra di valutazione più alta di quella dell'avversario, cioè di spendere meno energia per il risultato. Questo risulta in un sistema reciprocamente influente, dove è chiaro che sacrificando un'unità si diminuisce il valore stimato delle risorse dell'avversario di più del valore stimato dell'unità, allora questa è la decisione giusta, e se non lo è, allora non è quella giusta. E nel trading non abbiamo garanzie, solo probabilità, ma in un giocattolo ci sono garanzie matematiche che possono essere calcolate.

Non possiamo influenzare la situazione, ma nel gioco possiamo, anche creando noi stessi situazioni vantaggiose.

Forum sul trading, sistemi di trading automatico e strategie di trading di prova

Machine learning nel trading: teoria e pratica (trading e non solo)

Aleksey Vyazmikin, 2019.01.26 00:06

Se avessimo un creatore di bot, potremmo fargli una serie di domande e saremmo molto sorpresi dalle risposte. Tutte queste RL sono buone per imparare fattori di influenza stazionari sull'ambiente, ma se state giocando contro un altro giocatore, allora la RL nuda non funzionerà. Non ho studiato a fondo questo settore, potrei sbagliarmi. Ma c'è una chiara interazione con l'ambiente che cambia, non si vede dal comportamento dei bot che c'è un'aspettativa di qualcosa, non si vede affatto, c'è un controllo della probabilità di causare danni sia a te che all'avversario, e ci sono errori di calcolo semplicemente e agendo verso una minore probabilità di un risultato negativo, ma non è la probabilità impostata dalla politica all'inizio del gioco - è l'effetto sull'ambiente che cambia.


Non so, forse il tuo cervello è abituato a pensare con i concetti dei libri, ma io trovo più facile operare con argomenti meno nobili, così l'ho descritto con parole mie.