L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1269

 

Dai creatori di AlphaGo Zero fresco, godetevi la visione :)


 
Maxim Dmitrievsky:

Fresco dai creatori di AlphaGo Zero, godetevi la visione :)


Ci sono istruzioni dettagliate su come creare/allenare/collegare i modelli per Star Kraft?

 
Maxim Dmitrievsky:

Credo di non giocare, mi limito a guardare le partite.

A giudicare dai replay, l'Alpha Trader, se fatto, scambierà meglio di qualsiasi borsa di dadi

Mi sembra che fare un robot del genere possa far acquisire nuove competenze in MO, ed è semplicemente interessante. Io stesso ho giocato a StarCraft 2 un paio di volte da quando sono usciti i nuovi capitoli (lì la storia è spezzata in più parti). Quando si gioca contro l'IA, spesso vince non attraverso la logica dell'azione, ma controllando le unità - una persona fisicamente non può controllare l'intera mappa e ogni unità contemporaneamente.

 
Vladimir Perervenko:

Non controllo il mio, non conosco quello degli altri. L'articolo citato sopra non ha abbastanza informazioni per essere riproducibile e il codice è troppo complicato. Penso che tutto possa essere implementato con i livelli standard dei pacchetti, senza usare R6.

Buona fortuna

Non capisco quale fortuna mi auguri.

Si prega di fare una demo almeno

Se il risultato del lavoro dell'esperto con elementi di MO è accettabile, allora rileggerò tutto il ramo dall'inizio alla fine.

 
Maxim Dmitrievsky:

Questo non è il caso qui, è esattamente vicino a ciò che un umano vede e fa - campo visivo limitato, apm medio è inferiore a quello del giocatore professionista. cioè è la battaglia delle intelligenze, cioè strategie, non velocità (dove la macchina naturalmente vincerà sempre)

E l'IA incorporata in SC è solo avversari strapazzati e poco interessanti. Questo, al contrario, gioca come un essere umano. Non distinguerei un giocatore professionista da questa IA, cioè test di Turing superato )))

Anche visualizzato la nuvola di neuroni attivi del cervello elettronico


Dallo schermo non si possono trarre conclusioni univoche. Sì, forse per controllare solo ciò che si adatta allo schermo - nessun problema, per questi scopi utilizzare i tasti di scelta rapida su una unità / struttura o gruppo di unità, allora non è necessario osservarli visivamente a questo punto, e si può coordinare sulla mappa, che è anche sempre visibile sullo schermo. Chisha tutti in mikrokontrol, personalmente ho guardato un paio di video e non ho visto qualcosa di intelligente lì in termini di strategia, ma l'uso del potenziale delle singole unità c'è rivelato sul pieno. Cioè, l'enfasi è sulla valutazione della minaccia potenziale e le opzioni per contrastarla - a seconda del ramo di sviluppo nemico sviluppa il proprio ramo, più un modulo separato sull'economia - diversi metodi visto, e il controllo, e penso che i primi due moduli (sviluppo del ramo e l'economia) sono programmati o applicati logica fuzzy, qualcosa di relativamente goffo per la stabilità, ma il controllo si verifica sulla situazione e ci solo lavoro AI in pieno. A proposito, non è chiaro come vengono trasmesse le informazioni sugli oggetti, come vengono riassunte per prendere una decisione e tenere conto del loro movimento, i chip e gli obiettivi non sono chiari.

 
A proposito, a volte gioco a Warcraft III sulla rete di blizard e lì sono spesso accusato di AI, mi chiedo se può essere applicato anche lì. E se è usato, mi chiedo quante volte ho giocato con tale IA.
 
Maxim Dmitrievsky:

Lì, tra l'altro, originariamente l'intera mappa era posta sullo schermo per il bot, e poi l'hanno reso come un giocatore e poi il bot ha iniziato a temporeggiare e l'uomo ha vinto (alla fine del video). Ben girato male mb per questa situazione. D'altra parte come valutare l'efficacia - una volta che certi strati portano al successo allora il bot li sceglie

Penso che se si rendono i vincoli di controllo commisurati a una persona, i bot batteranno l'utente medio, perché il comportamento della folla è simile e sarà il più frequente. A proposito, quando ho provato a giocare con mio figlio sulla rete per un clan contro i bot giocattolo Warcraft 3, poi all'inizio era altrettanto difficile (e prima che ho avuto una ricchezza di esperienza nei giochi di clan in battaglia contro gli esseri umani), ma poi abituarsi al comportamento del bot e gradualmente superato lui utilizzando soluzioni non standard (per esempio tagliare attraverso gli alberi alla miniera, proteggendo così le unità da attacchi da terra). Quindi mi chiedo quanto peso si debba dare alle strategie non standard, in modo che possano essere prese in considerazione nel MO, cioè bisogna separare i comportamenti standard da quelli non standard e avere un approccio diverso nei loro confronti, e allo stesso tempo non interferire tra loro. È come una tendenza e un piatto - un modello è molto difficile da allenare entrambi contemporaneamente, almeno io non so come.

 
Maxim Dmitrievsky:

Non credo che abbia alcun peso. Se le situazioni sono rare, il bot ignorerà semplicemente tali opzioni. Se una persona si adatta alle strategie del bot, allora il bot ha bisogno di allenarsi continuamente per adattarsi allo strato di una persona, altrimenti non sarà una situazione di parità).

Non lo so, poi si scopre che molto dipende dal campione, se il campione è diverso, poi i bot si comporteranno in modo diverso in un combattimento con l'altro, cioè qui non è solo l'allenamento ma anche il fattore fortuna (chi si è allenato su cosa).

Quindi non è sempre possibile vedere (stimare correttamente) il risultato dell'allenamento, poiché non c'è un campione valido per confrontare i risultati.

 
Maxim Dmitrievsky:

Sì, è così che l'apprendimento avviene lì - attraverso le reti avversarie, più o meno così. L'IA gioca contro l'IA migliaia di volte, riproducendo molte strategie diverse. Alla fine, la rete elabora le migliori strategie. Se un numero di partite supera il numero di partite giocate da un giocatore professionista (pari a 200 anni di gioco come si dice), il vantaggio statistico sarà molto probabilmente dalla parte del bot, poiché ha considerato più combinazioni. Ma la probabilità di trovare un unico strato vincente rimane ancora naturalmente l'uomo

L'argomento è interessante, ma avvolto nel mistero :) Il trading è diverso in quanto non possiamo influenzare il mercato con il nostro comportamento e non abbiamo la possibilità di correggere gli errori, forse con la media delle posizioni...

 
Maxim Dmitrievsky:

Se si rompe il grafico in migliaia e milioni di pezzi e si fa giocare il bot contro di esso molte volte, forse imparerà a batterlo sempre, ancora una volta dipende dalla fic

Io la vedo in modo leggermente diverso, il gioco ha convenzionalmente un punteggio matematico per ogni parte che consiste di molti fattori - il numero di bot e il loro potenziale, i beni, il denaro, e l'obiettivo dell'avversario di ridurre questo punteggio in modo da mantenere il suo punteggio più alto di quello dell'avversario, cioè spendere meno energia per il risultato. Questo risulta in un sistema reciprocamente influente, dove è chiaro che sacrificando un'unità si diminuisce il valore stimato delle risorse dell'avversario di più del valore stimato dell'unità, allora questa è la decisione giusta, e se non lo è, allora non è quella giusta. Nel trading non abbiamo garanzie, solo probabilità, mentre nei giocattoli ci sono garanzie matematiche che possono essere calcolate.

Non possiamo influenzare la situazione, mentre in un gioco possiamo, anche creando noi stessi situazioni vantaggiose.