Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1068

 
FxTrader562:
A propósito, estou a tentar usar 1000 funcionalidades e o treino já está a decorrer há 1 hora.

você pode definir apenas 1 agenteCRLAgents *ag1=novo CRLAgents("RlExp1iter",1,100,50,regularizar,aprender);


e no conjunto de biblioteca #define _models 1

por isso será rápido

 
Maxim Dmitrievsky:

certeza de que você pode usar valores diferentes para cada preditor, é apenas um exemplo simples, cada valor próximo = 1 valor de preditor divergente

Então o número 100 ou 1000 ou 500 etc. tem de ser o mesmo, tanto nos códigos anexados como na declaração.certo?

 
FxTrader562:

Então o número 100 ou 1000 ou 500 etc. tem de ser o mesmo, tanto nos códigos anexados como na declaração.certo?

sim

 
Maxim Dmitrievsky:

sim

Ok, mas no seu código de amostra e implementação atual não tenho certeza do que exatamente está acontecendo durante o treinamento e qual é a diferença entre agentes e modelos:))

Espero que explique isto no seu artigo quando o publicar. Quero dizer, o que um agente está a fazer e o que um modelo está a fazer usando grãos...

 
FxTrader562:

Ok, mas no seu código de amostra e implementação atual não tenho certeza do que exatamente está acontecendo durante o treinamento e qual é a diferença entre agentes e modelos:))

Espero que explique isto no seu artigo quando o publicar. Quero dizer, o que um agente está a fazer e o que um modelo está a fazer usando grãos...

cada agente RL pode ter preditores únicos, então o resultado médio de todos os agentes

número de modelos - número de iterações de transformações com cos. Esquece isso agora, porque nós fazemos gdmh

 
Maxim Dmitrievsky:

cada agente RL pode ter preditores únicos, então o resultado médio de todos os agentes

número de modelos - número de iterações de transformações com cos. Forrot sobre isso agora, porque nós fazemos gdmh

Sim, certo... Você pode tentar usar a GDMH e me avisar se você progredir ou ficar preso na implementação, porque de qualquer forma, finalmente, depois de ver os resultados AO VIVO, podemos tirar algumas conclusões sobre o algo.

A propósito, tente usar o log natural em caso de fórmulas de optimização e treino. Na minha experiência, a utilização de Mathpow() de expoentes parece convergir uma solução muito rapidamente.

 
FxTrader562:

Sim, certo... Você pode tentar usar a GDMH e me avisar se você progredir ou ficar preso na implementação, porque de qualquer forma, finalmente, depois de ver os resultados AO VIVO, podemos tirar algumas conclusões sobre o algo... Mas olhando para o algo da GDMH, parece muito promissor...

A propósito, tente usar o log natural em caso de fórmulas de optimização e treino. Na minha experiência, a utilização de Mathpow() de expoentes parece converter uma solução muito rapidamente.

Também pode usar polinómios trigonométricos. Isto é algo como "eiliminação recursiva de características", não realmente gdmh... algo médio )

porque gdmh seu algoritmo quadrático linear, mas nós usamos RDF
 
Maxim Dmitrievsky:

também pode usar polinómios trigonométricos. Isto será algo como "eiliminação recursiva de características", não realmente gdmh... algo médio )

Eu não sei sobre isso...eu tenho que ler para entender :))...Na verdade, eu não sabia nada sobre GDMH e você acabou de me contar ontem e eu acabei de aprender e escrever o código...Eu acho que estou aprendendo rápido:)))))

o que eu estou me referindo é quando você está se aproximando de uma função aleatória para obter uma solução, então usando log natural ou expoente geralmente converge rapidamente...por quê? porque essa é a definição e propósito do log natural ou ln ou exponencial() ou e

Aqui está um exemplo de código a que me estou a referir:

duplo x=MathRandomUniform(0,1,unierr);

probabilidade dupla = 1/(1+exp(MathPow(x,3)));

Eu entendo um pouco a GDMH...mas o RDF ainda não está 100% claro. Eu estava apenas a tentar implementar Monte Carlo em vez de RDF, mas se pudermos fazê-lo por RDF, então não vejo o uso de Monte Carlo. O que você acha que é melhor, monte carlo ou RDF?

Mas vou resumir aqui o que espero deste algo:

1. ele pegará os indicadores ou fechará os preços e os quebrará em pequenos pedaços e criará polinômios ou funções aproximadas durante o treinamento.

2.Quando a executarmos na negociação, então para cada vela, verificará os dados do treino passado e descobrirá qual a peça polinomial que está a corresponder ao nosso preço actual e preverá o que vai acontecer a seguir e deverá iterar

 
FxTrader562:

Eu não sei sobre isso...eu tenho que ler para entender:))

o que eu estou me referindo é quando você está se aproximando de uma função aleatória para obter uma solução, então usando log natural ou expoente geralmente converge rapidamente...por quê? porque essa é a definição e propósito do log natural ou ln ou exponencial() ou e

Aqui está um exemplo de código a que me estou a referir:

double x=MathRandomUniform(0,1,unierr);

probabilidade dupla = 1/(1+exp(MathPow(x,3)));

Eu entendo um pouco a GDMH...mas o RDF ainda não está 100% claro. Eu estava apenas a tentar implementar Monte Carlo em vez de RDF, mas se pudermos fazê-lo por RDF, então não vejo o uso de Monte Carlo. O que você acha que é melhor, monte carlo ou RDF?

Mas vou resumir aqui o que espero deste algo:

1. ele pegará os indicadores ou fechará os preços e os quebrará em pequenos pedaços e criará polinômios ou funções aproximadas durante o treinamento.

2.Quando a executarmos na negociação, então para cada vela, verificará os dados do treino passado e descobrirá qual a peça polinomial que está a corresponder ao nosso preço actual e preverá o que vai acontecer a seguir e deverá iterar

O RDF aproxima diretamente a polisia do agente, por outro lado o q-learning com cadeias Monte Carlo ou TD e Markov fazem-no com demasiadas iterações, pelo que pode demorar muito mais

1,2 sim, absolutamente certo.

 
Maxim Dmitrievsky:

RDF aproxima diretamente o polissilabro do agente, por outro lado q-learning com monte carlo ou TD o faz com demasiadas iterações, por isso pode demorar muito mais

1,2 sim, absolutamente certo.

Então você quer dizer que o RDF é melhor e mais rápido que o Monte carlo, que é definitivamente necessário para decisões de negociação instantâneas ao fechar a vela.... Então nós estamos no caminho certo para criar a versão forex

de "ALPHA ZERO" ...vamos ver:)))))))))