Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1272

 
Maxim Dmitrievsky:

Estou cansado de discutir sobre coisas óbvias, eles têm tudo escrito no artigo. Que todos o entendam como quiserem.

Se um pouco mais de abstracção, ficará claro porque jogar contra o mercado é a mesma coisa.

E sugiro discuti-lo pelo menos em termos que eles próprios usam, não em termos inteligentemente inventados. Caso contrário, o argumento não é nada.

Aqui tente encontrar analogias para a negociação e o jogo, mesmo tendo em conta a mesma dinâmica do seu equilíbrio de probabilidades, que é influenciada por ambos os lados do processo. Vamos examinar o problema em detalhes em vez de usar a terminologia.

 
Aleksey Vyazmikin:

Tente encontrar analogias para a negociação e o jogo, mesmo com a mesma dinâmica do seu equilíbrio de probabilidades, que são influenciadas por ambos os lados do processo. Vamos olhar para o problema objectivamente, em vez de usar a terminologia como capa.

Pela última vez, não vou escrever mais nada.

O agente RL não se importa com o que está a jogar - o mercado ou outro adversário no SC, ele não o entende porque é um programa. O resto é apenas o seu "know-how".

não importa se o adversário é estático ou dinâmico, de qualquer forma o agente aprenderá a política ideal

Vais recompor-te e vais descobrir o que se passa. Um dia.

 
Maxim Dmitrievsky:

Pela última vez, não vou dizer mais nada.

O agente RL não se importa com o que está a jogar - o mercado ou outro adversário no SC, ele não o entende porque é um programa. O resto é apenas o seu "know-how".

não importa se o adversário é estático ou dinâmico, de qualquer forma o agente aprenderá a política ideal

Vais recompor-te e vais descobrir o que se passa. Um dia.

O nome do método de treinamento é secundário. Há muito tempo que ando a tentar falar contigo sobre preditores.

E como você pode não entender que NS pode aprender a influenciar a situação e, dependendo da eficácia da influência, influenciar a probabilidade do resultado do evento. E essa é apenas a vantagem de uma rede desse tipo - a capacidade de influenciar a situação. Em cada frame é tomada uma decisão sobre o que fazer para melhorar o desempenho alvo (esse mesmo gráfico), o processo de atividade é multistep, a probabilidade final de vitória ou derrota não é determinada no início do jogo, mas está em constante mudança, inclusive devido às ações dos jogadores, e aqui está a maior diferença da negociação.

Não estou dizendo que você não pode usar o método PL para ensinar negociação, estou falando da eficácia de uma rede que influencia a situação para atingir seu alvo e não apenas adivinha passivamente o que o adversário fará (para onde o preço irá).

 
Maxim Dmitrievsky:

Porquê mostrar emoção, é melhor escrever uma refutação fundamentada aos meus argumentos.

 
Aleksey Vyazmikin:

Isto é chamado de POLÍTICA OPCIONAL ou ESTRATÉGIA, que leva em conta todos os possíveis comportamentos inimigos

Leia um livro, não se envergonhe. Eu já te escrevi 100 vezes, o que estás a tentar expressar encaixa num par de palavras.

Não seja tão engraçado.

 
Maxim Dmitrievsky:

Isto é chamado de POLÍTICA OPTIMAL ou ESTRATÉGIA, que leva em conta todos os possíveis comportamentos inimigos.

Lê um livro, não te envergonhes. Eu já te escrevi 100 vezes, o que estás a tentar expressar encaixa num par de palavras.

Não gozes comigo dessa maneira.

Eu não estou familiarizado com o termo, a Internet é igualmente relutante em dizer algo - dê-me um link, deixe-me ver se é realmente chamado assim.

E se a minha descrição se encaixa num determinado termo, não compreendo as suas objecções substantivas. Não se trata dos termos, mas da influência sobre a situação para atingir o objectivo a longo prazo - ganhar o jogo através de uma cadeia de acções, que pode variar dependendo das acções do inimigo.

Trata-se do ambiente diferente no qual a tomada de decisões ocorre - em um você pode interagir com o ambiente e no outro você não pode - apenas observar através do vidro.
 
 

Você não sabe que eu não leio livros estrangeiros... Eu folheei-os, sim, são mais avançados que os da Internet em russo.

 
Maxim Dmitrievsky:

se mais da metade das palavras extras forem retiradas e a cadeia de ações (cadeias de Markov) com transições probabilísticas for deixada, então é melhor

o resto dos disparates podem ser deixados de fora

A divisão agente/ambiente está sempre lá, não há observações através do vidro. Mais uma vez, um nível abstrato que não está disponível para todos. E aqui novamente você está barrando a sua testa contra a parede porque você está inventando em vez de estudar.

Pela última vez escrevo e paro este bacanalia: não há influência, há probabilidades de transições e aproximações de políticas.

Não sei como você pensa, mas os termos só distorcem a essência do pensamento, se não for um axioma há muito estabelecido e que não pode ser verificado.

Você não pode fornecer uma analogia, a referência à terminologia é improdutiva.

 
Aleksey Vyazmikin:

Porque você não sabe que eu não leio livros estrangeiros... Eu olhei através deles, sim, há coisas mais avançadas lá do que na internet em língua russa.

Bem, não há mais nenhum lugar para ler. Sutton, Barto"treinamento com reforço" é traduzido online, apenas um livro antigo, mas útil também.