L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1273

 
Aleksey Vyazmikin:

Non so come pensiate, ma i termini distorcono solo l'essenza del pensiero, a meno che non si tratti di assiomi, stabiliti da tempo e non verificabili.

Non puoi dare un'analogia, fare riferimento alla terminologia è improduttivo.

Tutte le analogie si infrangono contro il muro delle vostre fantasie. Ieri te ne ho date tante, ma non ne hai capita nemmeno una.

Stirlitz continuava a stare in piedi, era la tortura preferita di Mueller.

Se vi piace pensare che un agente stia influenzando il suo avversario di proposito, che sia una sorta di strategia speciale, allora pensate

e semplicemente passa in rassegna le sue opzioni, giocando più volte con gli avversari, e per ogni caso individua le strategie migliori (se vince viene premiato), se perde viene penalizzato. Di conseguenza, ha esperienza sotto forma di un NS ben rodato che tiene conto di un sacco di combinazioni di gioco diverse e può prevedere il risultato di ognuna, quindi agisce secondo le migliori previsioni. Se l'avversario cambia lo strato, il NS lo vede e reagisce con un altro strato, attivando altri neuroni. E allo stesso modo, quando il mercato cambia la NS fa previsioni diverse.

 
Aleksey Vyazmikin:

Non so come pensi, ma i termini distorcono solo l'essenza del pensiero, a meno che non si tratti di assiomi, stabiliti da tempo e non verificabili.

Non si può dare un'analogia, fare riferimento alla terminologia è improduttivo.

Alexey, stai spammando, e capisco perché, durante tutto il tempo che hai scritto un sacco di lettere qui, hai scritto una sola riga di codice che supportasse le tue parole e congetture?

Sono abbastanza sicuro di non averlo fatto.

La cosa triste è che quando si chiede del materiale per sensibilizzare su un tema attuale lo si scarta facilmente perché è in una lingua che non si conosce, quanto può essere difficile usare dei traduttori?

Per quanto riguarda le probabilità, basta che una rete neurale sia addestrata su scenari storici con esito noto al 100% e solo dopo l'applicazione della rete addestrata, si ottiene una risposta per la situazione non al 100%, ma probabilistica, poi in base alla logica che sarà lei, sarà lei (un'altra rete) a decidere cosa fare, così alla fine si ottiene una rete vivente, le sue decisioni e i suoi esiti non saranno possibili da prevedere.

 
Maxim Dmitrievsky:

tutte le analogie infrangeranno il muro delle vostre fantasie. Ieri te ne ho date tante, ma non ne hai capita nemmeno una.

Stirlitz continuava a stare in piedi, era la tortura preferita di Mueller.

Se vi piace pensare che un agente stia influenzando il suo avversario di proposito, che sia una sorta di strategia speciale, allora pensate

e semplicemente passa in rassegna le sue opzioni, giocando più volte con gli avversari, e per ogni caso individua le strategie migliori (se vince viene premiato), se perde viene penalizzato. Di conseguenza, ha esperienza sotto forma di un NS ben rodato che ha preso in considerazione un sacco di combinazioni di gioco diverse e può prevedere il risultato di ognuna, quindi agisce secondo le migliori previsioni. Se l'avversario cambia lo strato, il NS lo vede e reagisce con un altro strato, attivando altri neuroni. Allo stesso modo, quando il mercato cambia, la NS cambia le sue previsioni.

Lei lo scrive correttamente, sto discutendo su questo? No, sto sostenendo che la scelta viene da quelle azioni che possono avere un impatto sull'ambiente, avversario o inazione. Sì, si riceve una ricompensa per influenzare l'avversario e quindi cambiare la probabilità del risultato complessivo dell'evento (gioco), mentre il commerciante non ha esattamente tale opportunità in azione e questo influenza significativamente il vettore di azione. Forse se dividiamo l'azione in tre gruppi, vediamo che è l'impatto sull'avversario che contribuisce maggiormente al risultato complessivo, cioè è l'azione significativa che porta al risultato positivo complessivo che influenza maggiormente il risultato.

Se non sono riuscito a farmi capire di nuovo, penso di averci provato abbastanza, dato che sto già creando un'imposizione, mentre volevo solo condividere le mie osservazioni.

 
Farkhat Guzairov:

Alexey, per essere onesti stai solo spammando e capisco perché, per tutto il tempo che hai scritto qui un sacco di lettere, hai scritto una sola riga di codice che potrebbe sostenere le tue parole e congetture?

Sono abbastanza sicuro di non averlo fatto.

La cosa triste è che quando si chiede del materiale per sensibilizzare su un tema attuale lo si scarta facilmente perché è in una lingua che non si conosce, quanto può essere difficile usare dei traduttori?

A proposito di probabilità, basta che una rete neurale sia addestrata su scenari storici con esito noto al 100% e dopo l'applicazione della rete addestrata, si ottiene una risposta alla situazione non è al 100%, ma probabilistica, poi in base alla logica che verrà messa in atto, sarà lei (un'altra rete) a decidere cosa fare, così alla fine si ottiene una rete viva, le decisioni e gli esiti non saranno possibili da prevedere.

No non ho scritto alcun codice sul gioco StarCraft 2, non poteva nemmeno trovare come fare bot, cioè l'intelletto ci può essere programmato da trigger, e l'intervento diretto nel codice, sorta di vietato, che è segnalato, ma è possibile accedere alla memoria utilizzata StarCraft (1) e ci sono un lungo tempo concorsi. Tuttavia, qualcuno qui ha postato del codice sul gioco?

Sì, il materiale mi è stato dato (Maxim è buono in termini di lavoro con la letteratura/informazione straniera), ma ho chiesto una definizione del termine, e inoltre, ho stimato il materiale come contenente più informazioni di quelle che potevo trovare sulle distese dell'Internet di lingua russa.

Non ho capito il suo messaggio sui principi di MoD. Cosa intendeva dire?

 
Aleksey Vyazmikin:

No, non ho scritto alcun codice sul gioco StarCraft 2, non sono nemmeno riuscito a trovare come sono fatti i bot, cioè l'intelligenza lì può essere programmata con dei trigger, e l'interferenza diretta con il codice è in un certo senso vietata, come riportato, ma è possibile accedere alla memoria usata da StarCraft (1) e ci sono lunghe gare in corso. Tuttavia, qualcuno qui ha postato del codice sul gioco?

Riguardo a StarCraft 2, nessuno sta manomettendo direttamente il codice del gioco, né esiste un'API per recuperare dati dal gioco, le cose sono molto più semplici. I bot imparano sulla base di immagini grafiche, solo screenshot, cioè ottengono esattamente le stesse informazioni di una persona, ma le usano in modo molto più efficiente del giocatore medio.

 
Farkhat Guzairov:

Riguardo a StarCraft 2, nessuno sta manomettendo direttamente il codice del gioco, né esiste un'API per recuperare dati dal gioco, tutto è molto più semplice. I bot imparano sulla base di immagini grafiche, semplicemente degli screenshot, il che significa che ottengono esattamente la stessa quantità di informazioni di un umano, ma le gestiscono in modo molto più efficiente di un giocatore statistico medio.

Parlo principalmente dell'applicazione del modello. Potete leggere qui.

История соревнований ИИ по Starcraft
История соревнований ИИ по Starcraft
  • habr.com
Начиная с первого Starcraft AI Competition, проведённого в 2010 году, тема искусственного интеллекта в стратегиях реального времени (RTS) становится всё более популярной. Участники таких соревнований представляют своих ИИ-ботов Starcraft, которые сражаются в стандартной версии Starcraft: Broodwar. Эти соревнования по играм RTS, вдохновлённые...
 
Aleksey Vyazmikin:

Parlo principalmente dell'applicazione del modello. Potete leggerlo qui, per esempio.

Nel mio post sul codice, stavo facendo una domanda retorica, perché molto è stato scritto in questo thread, ma pochissime persone hanno finito per essere in grado di applicare almeno il 5% di ciò che è stato discusso qui. Ha fatto qualcosa personalmente come risultato?

Riguardo ai modelli applicabili, sì, sono tutti simili (giochi, previsioni del tempo, mercati ecc.), la questione qui è cosa si alimenta nel MO piuttosto che come sarà gestito all'interno del MO, la gente ancora non capisce come finirà con quello che ottiene dal MO, questo è l'intero problema. In questo senso è più facile con i giochi, perché c'è una matrice pronta di dati di input, ma in tutti gli altri settori bisogna inventare i propri metodi di pre-elaborazione.

 
Farkhat Guzairov:

Nel mio post sul codice, stavo facendo una domanda retorica perché molto è stato scritto in questo thread, ma pochissime persone hanno finito per essere in grado di applicare almeno il 5% di ciò che è stato discusso qui. Ha fatto qualcosa personalmente come risultato?

Riguardo ai modelli applicabili, sì, sono tutti simili (giochi, previsioni del tempo, mercati ecc.), la questione qui è cosa si alimenta nel MO piuttosto che come sarà gestito all'interno del MO, la gente ancora non capisce come finirà con quello che otterrà dal MO, questo è l'intero problema. In questo senso è più facile con i giochi, perché c'è già una matrice pronta di dati di input, ma in tutte le altre aree devi inventarti i tuoi metodi di pre-elaborazione.

Bene, lei stesso non ha letto le informazioni con le quali ha iniziato a discutere, e sopra mi ha accusato. Ok, tutte le persone sono uguali.

Ancora una volta non capisco la domanda, su "tu personalmente hai fatto qualcosa come risultato" - svolgerla, in che tipo di risultato, e cosa avrei dovuto fare personalmente? Se stai parlando della mia applicazione di MO, allora sì, sto lavorando su questo tema in diversi modi (creazione di modelli, selezione, applicazione) - ho scritto molto qui sui miei risultati.

Questo è il punto, non tutti i modelli sono simili, ma i predittori sono, sì, estremamente significativi. Un sistema complesso è composto da diversi modelli, compresi diversi tipi (alberi/NS), dicono gli stessi esperti di Yandex, per esempio.

 

A proposito, notate che l'uomo stava perdendo facendo errori nelle azioni (cliccando storto/dimenticando di attivare un'abilità), ma è stato in grado di vincere utilizzando una mossa tattica non standard - distrarre costantemente l'avversario atterrando nella parte posteriore della base dell'avversario, che lo ha costretto a schierare le sue truppe per attaccare la base dell'uomo, che ha dato il tempo all'uomo di sviluppare le sue unità ad un livello superiore, come risultato ha potuto infliggere danni significativi all'avversario e vincere la partita.

Questo è anche il modo in cui picchi inaspettati e falsi proboys distraggono il trader dal suo obiettivo.

 
Aleksey Vyazmikin:

A proposito, notate che l'uomo stava perdendo facendo errori nelle azioni (cliccando storto/dimenticando di attivare un'abilità), ma è stato in grado di vincere utilizzando una mossa tattica non standard - distrarre costantemente l'avversario atterrando nella parte posteriore della base dell'avversario, che lo ha costretto a schierare le sue truppe per attaccare la base dell'uomo, che ha dato il tempo all'uomo di sviluppare le sue unità ad un livello superiore, come risultato ha potuto infliggere danni significativi all'avversario e vincere la partita.

Proprio così, picchi inaspettati e falsi proboti distraggono il trader dall'obiettivo.

Così entro la prossima partita, questo comportamento non standard sarà già battuto dal bot, è chiaro che al momento un uomo può battere l'IA a spese di un comportamento non standard, ma non appena l'IA "dice" "Perché è possibile farlo", l'uomo avrà un momento difficile.