Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1271

 
Veio à mente a idéia de que uma distribuição normal só pode ser esperada em processos concluídos (apenas um pensamento - não checaram), e que o mercado não o é, portanto todas as suposições sobre sua distribuição desigual e não-estacionariedade são apenas suposições, que não podem ser testadas enquanto o mercado existir.
 
Maxim Dmitrievsky:

Para o mercado, ele é treinado exatamente da mesma forma, porque a tecnologia é a mesma. Esqueça a "influência", ela não é explicitamente ensinada da forma como você a imagina. Existem conjuntos de estratégias, estratégias óptimas, etc. (em RL são chamadas políticas).

Se tivéssemos um criador de bot, poderíamos fazer-lhe uma série de perguntas e ficar muito surpreendidos com as respostas. Todos esses RLs são bons em aprender influências ambientais estacionárias, mas se você estiver jogando contra outro jogador, então RL nu não vai funcionar aqui. Eu não estudei esta área em profundidade, pode estar enganado. Mas há uma clara interação com o ambiente em mudança, você não pode ver do comportamento dos bots, não há expectativa de nada, você não pode ver nada, há um controle de probabilidade de causar danos tanto para você quanto para seu oponente, e há erros de cálculo simplesmente e agir no sentido de menos possibilidade de resultado negativo, mas não é a probabilidade dada pela política no início do jogo - é a influência sobre o ambiente em mudança.

 
Tenho andado a ler-vos. Um par de postos e percebeu que a teoria não pára. Mas você ficará surpreso quando começar a praticar. Construir modelos e procurar novas soluções não é nada comparado com a negociação real, quando você prepara tudo, coloca no lugar e espera por ....... Então o primeiro sinal aparece e o robô abre uma troca. Mas o pior é quando se analisa o resultado desta troca e a sua decisão (robô). Vai continuar a ganhar dinheiro ou está na hora de o mudar. Na minha experiência, normalmente descubro que após a otimização ele faz um ou três negócios perdidos e depois começa a subir. E em tais momentos, também começas a fazer barulho e a verificar. Vai subir ou não. Significa que você enfrenta tais problemas em negociações reais que você nunca pensou quando estava procurando e otimizando. Portanto, quanto mais cedo você começar a praticar, mais rápido você enfrentará os problemas de um comerciante praticante. Naturalmente, I.M.O.
 
 
Vi o vídeo e os comentários em russo e fiquei até surpreendido por ter uma ideia muito correcta do comportamento - há avaliação de activos, há probabilidade de resultado, há micro-controlo e há estratégias iniciais espúrias para o desenvolvimento. Há uma ênfase muito forte na selecção exacta das unidades a combater com a eficiência do micro-controlo e aparentemente as mais eficazes do ponto de vista económico, e mais outras não são necessárias, uma vez que as batalhas são ganhas rapidamente. Em geral, há claramente uma série de componentes, e muito provavelmente não um neurônio, e diferentes modelos responsáveis por diferentes componentes. Além disso, os próprios desenvolvedores afirmaram que usam diferentes modelos de estratégias básicas, de modo que haveria algum tipo de aleatoriedade.
 

Olá a todos. Desde que estabelecemos que TODOS aqui são bastante inteligentes e isto não é um sarcasmo, mas uma afirmação de facto. O campo da EM não falta em inteligência, por isso tenho uma pergunta para a comunidade. Alguém já administrou UBUNTU? Estou a falar de administração. O problema é este. Durante a otimização, este processo é executado tantas vezes quanto há núcleos no sistema e os paralela.

Pergunta: é possível forçar 2 ou 4 núcleos para servir um processo não divisível? Bem, isso sou só eu... talvez alguém saiba disso...

 

O Google está trabalhando hoje

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

OK, ontem voltei a ter uma discussão fútil.

 
Maxim Dmitrievsky:

O Google está trabalhando hoje

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

OK, ontem voltei a ter uma discussão fútil.

Note que, no gráfico de expectativa do resultado da batalha, há exatamente a probabilidade que eu estava falando - situacional, que ativa o feedback dos neurônios. Você pode ver claramente como essa probabilidade muda à medida que ambos os lados escoam e perdem unidades - ou seja, há um recálculo constante do equilíbrio de poder e das expectativas de cada um. Esta não é, claramente, uma variante clássica do RL.


 
Aleksey Vyazmikin:

Nota no gráfico de expectativa de batalha, há exatamente a probabilidade que eu estava falando - a probabilidade situacional que ativa o feedback dos neurônios. Você pode ver claramente como essa probabilidade muda à medida que ambos os lados escoam e perdem unidades - ou seja, há um recálculo constante do equilíbrio de poder e das expectativas de cada um. Esta não é, claramente, uma variante clássica do RL.


Então és tão desajeitado, pensei que era isso que te estava a tentar dizer :D

Leia também sobre o equilíbrio de Nash no link, ontem descrevi o algoritmo 1 em 1, sem sequer ler

a questão é que o jogo não tem estimativa de probabilidade e o jogo tem EFICIÊNCIA :)) volta atrás e lê o teu post

O óbvio é um clássico RL LOL profundo, pára de dizer disparates quando não estás a falar do assunto

 
Maxim Dmitrievsky:

Então você é tão desajeitado que eu pensei que era isso que eu estava tentando explicar para você :D

li também sobre o equilíbrio de Nash no link, ontem descrevi o algoritmo 1 em 1, sem sequer o ler

a questão é que o jogo não tem estimativa de probabilidade e o jogo tem EFICIÊNCIA :)) volta atrás e lê o teu post

A única coisa que você vê é um clássico RL LOL profundo, pare de falar bobagens quando não está no assunto.

Este é um fórum para negociação, sistemas de negociação automatizados e teste de estratégias de negociação.

Sempre estive interessado em negociar no mercado Forex e estou convencido de que esta é a melhor maneira de ensinar a aprendizagem da máquina.

Aleksey Vyazmikin, 2019.01.25 17:15

Eu vejo de forma ligeiramente diferente, no brinquedo há convencionalmente uma avaliação matemática de cada lado que consiste em muitos fatores - o número de bots e seu potencial, ativos, dinheiro e o objetivo do oponente de diminuir esse número de avaliação de forma a manter seu número de avaliação mais alto que o do oponente, ou seja, gastar menos energia no resultado. Isto resulta num sistema mutuamente influente, onde é claro que ao sacrificar uma unidade você vai diminuir o valor estimado do ativo do oponente em mais do que o valor estimado da unidade, então esta é a decisão certa, e se não, então não é a decisão certa. E no comércio não temos garantias, apenas probabilidades, mas num brinquedo há garantias matemáticas que podem ser calculadas.

Não podemos influenciar a situação, mas no jogo podemos, inclusive criando situações vantajosas nós mesmos.

Fórum sobre negociação, sistemas de negociação automatizados e teste de estratégias de negociação

Aprendizagem da máquina no comércio: teoria e prática (comércio e não só)

Aleksey Vyazmikin, 2019.01.26 00:06

Se tivéssemos um criador de bot, poderíamos fazer-lhe uma série de perguntas e ficaríamos muito surpreendidos com as respostas. Todos estes RLs são bons a aprender factores de influência estacionários no ambiente, mas se estás a jogar contra outro jogador, então RL nu não vai funcionar aqui. Eu não estudei esta área em profundidade, pode estar enganado. Mas há uma clara interação com o ambiente em mudança, você não pode ver pelo comportamento dos bots que há uma expectativa de nada, você não pode ver nada, há um controle de probabilidade de causar danos a você e ao seu oponente, e há erros de cálculo simplesmente e agindo para uma probabilidade menor de um resultado negativo, mas essa não é a probabilidade dada pela política no início do jogo - é o efeito sobre o ambiente em mudança.


Não sei, talvez seu cérebro esteja acostumado a pensar com conceitos de livros, mas acho mais fácil operar com assuntos menos sublimes, então eu o descrevi em minhas próprias palavras.