Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1269

 

Dos criadores do AlphaGo Zero fresco, aproveite para assistir :)


 
Maxim Dmitrievsky:

Fresco dos criadores do AlphaGo Zero, divirta-se a vê-lo :)


Existe alguma instrução detalhada sobre como criar/conectar modelos para o Star Kraft?

 
Maxim Dmitrievsky:

Acho que eu não jogo, só vejo os jogos.

A julgar pelas repetições, o Alfa Trader, se for feito, trocará melhor do que qualquer saco de dados.

Parece-me que fazer um robô assim pode adquirir novas habilidades em MO, e é simplesmente interessante. Eu mesmo já joguei StarCraft 2 algumas vezes desde que os novos capítulos saíram (lá a história está dividida em várias partes). Ao jogar contra a IA, muitas vezes ele ganha não através da lógica de ação, mas controlando unidades - uma pessoa fisicamente não pode controlar o mapa inteiro e cada unidade de uma vez.

 
Vladimir Perervenko:

Eu não monitorizo os meus, não conheço os dos outros. O artigo citado acima não tem informação suficiente para ser reproduzível e o código é muito complicado. Eu acho que tudo pode ser implementado com camadas padrão de pacotes, sem usar o R6.

Boa sorte.

Não percebo que boa sorte me desejas.

Por favor, faça uma demonstração, pelo menos

Se o resultado do trabalho do especialista com elementos de MO for aceitável, então eu vou reler todo o ramo do início ao fim.

 
Maxim Dmitrievsky:

Este não é o caso aqui, é exactamente o que um humano vê e faz - campo de visão limitado, o apm médio é inferior ao do jogador profissional. ou seja, é a batalha das inteligências, ou seja, das estratégias, e não das velocidades (onde a máquina irá, claro, ganhar sempre)

E a IA embutida em SC é apenas oponentes desinteressantes. Este, pelo contrário, joga como um ser humano. Eu não distinguiria um jogador profissional desta IA, ou seja, o teste de Turing passou ))))

Até visualizou a nuvem de neurónios activos do cérebro electrónico.


A partir do ecrã não é possível tirar conclusões inequívocas. Sim, talvez para controlar apenas o que cabe na tela - sem problemas, para estes fins use as hotkeys em uma unidade / estrutura ou grupo de unidades, então não é necessário observá-los visualmente neste ponto, e você pode coordenar no mapa, que também é sempre visível na tela. Chisha tudo em mikrokontrol, eu pessoalmente assisti a alguns vídeos e não vi algo inteligente lá em termos de estratégia, mas o uso do potencial de unidades individuais lá é revelado na íntegra. Ou seja, a ênfase lá é na avaliação da ameaça potencial e opções para combatê-la - dependendo do ramo de desenvolvimento inimigo desenvolve seu próprio ramo, mais um módulo separado sobre a economia - métodos diferentes vistos, e controle, e eu acho que os dois primeiros módulos (desenvolvimento do ramo e economia) são programados ou aplicados lógica difusa, algo relativamente desajeitado para a estabilidade, mas o controle ocorre sobre a situação e lá apenas funciona AI em sua totalidade. A propósito, não está claro como a informação sobre os objetos é transmitida, como eles são resumidos para tomar uma decisão e levar em conta o seu movimento, os chips e os alvos não são claros.

 
A propósito, eu às vezes jogo Warcraft III na rede do Blizard e lá eu sou freqüentemente acusado de IA, eu me pergunto se ele pode ser aplicado lá também. E se for usado, pergunto-me quantas vezes brinco com tal IA.
 
Maxim Dmitrievsky:

Ali, a propósito, originalmente todo o mapa foi colocado na tela para o bot, e então eles o fizeram como um jogador e então o bot começou a empatar e o homem ganhou (no final do vídeo). Bem filmado, Mb mau para esta situação. Por outro lado, como avaliar a eficácia - uma vez que certos estratos levam ao sucesso, então o bot escolheu-os

Eu acho que se você fizer as restrições de controle proporcionais a uma pessoa, os bots vão bater o usuário médio, porque o comportamento da multidão é semelhante e será o mais freqüente. A propósito, quando eu tentei jogar com meu filho na rede por um clã contra bots toy Warcraft 3, então no início foi igualmente difícil (e antes disso eu tinha uma rica experiência em jogos de clã em batalha contra humanos), mas depois me acostumei ao comportamento do bot e gradualmente o superei usando soluções não-padronizadas (por exemplo, cortar através das árvores até a mina, protegendo assim as unidades do ataque a partir do chão). É por isso que me pergunto, que peso pode ser dado às estratégias não-padronizadas, para que elas possam ser levadas em conta durante o MoD, ou seja, preciso separar os comportamentos padrão dos não-padronizados e ter uma abordagem diferente e, ao mesmo tempo, não interferir uns com os outros. É como uma tendência e um apartamento - um modelo é muito difícil de treinar ambos ao mesmo tempo, pelo menos não sei como.

 
Maxim Dmitrievsky:

Acho que não tem peso nenhum. Se as situações forem raras, o bot simplesmente ignorará tais opções. Se uma pessoa se adapta a estratégias de bot, então o bot precisa treinar o tempo todo para se adequar ao estrato de uma pessoa, caso contrário, não será uma situação de igualdade).

Eu não sei, então acontece que muito depende da amostra, se a amostra for diferente, então os bots se comportarão de forma diferente em uma luta entre si, ou seja, aqui não é só o treinamento, mas também o fator sorte (quem treinou sobre o quê).

Portanto, nem sempre é visível (possível estimar corretamente) o resultado do treinamento, já que não há uma amostra válida para comparar resultados.

 
Maxim Dmitrievsky:

Sim, é assim que a aprendizagem acontece lá - através de redes adversárias, mais ou menos assim. A IA joga contra a IA milhares de vezes, reproduzindo muitas estratégias diferentes. Eventualmente, a rede trabalha com as melhores estratégias. Se um número de jogos exceder um número de jogos jogados por um jogador profissional (igual a 200 anos de jogo, como se diz), a vantagem estatística muito provavelmente estará do lado do bot, já que ele considerou mais combinações. Mas a probabilidade de encontrar um estrato vencedor único ainda permanece, claro, o homem

O tema é interessante, mas envolto em mistério :) Negociar é diferente porque não podemos influenciar o mercado com o nosso comportamento e não temos a possibilidade de corrigir erros, talvez com a média das posições...

 
Maxim Dmitrievsky:

Se você quebra o gráfico em milhares e milhões de pedaços e faz o bot jogar contra ele que muitas vezes, talvez ele vai aprender a bater o tempo todo, mais uma vez depende da fic

Eu vejo o jogo de forma ligeiramente diferente, convencionalmente o jogo tem uma pontuação matemática para cada lado que consiste em muitos fatores - o número de bots e seu potencial, ativos, dinheiro e o objetivo do adversário de reduzir essa pontuação de forma a manter sua pontuação mais alta que a do adversário, ou seja, gastar menos energia no resultado. Isto resulta num sistema mutuamente influente, onde é claro que ao sacrificar uma unidade você irá diminuir o valor estimado do ativo do oponente em mais do que o valor estimado da unidade, então esta é a decisão certa, e se não for, então não é a decisão certa. No comércio não temos garantias, apenas probabilidades, enquanto nos brinquedos existem garantias matemáticas que podem ser calculadas.

Não podemos influenciar a situação, enquanto em um jogo podemos, incluindo a criação de situações lucrativas nós mesmos.