Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 598

 
Aleksey Terentev:
1) Como estão as coisas em treinamento? Não vejo como os pesos são aplicados.
2) Os pesos do próprio neurônio estão disponíveis?
3) Como meio, você pode tomar a derivada do MA de fechamento ou rápido da ordem 1-4. Ou incrementos.
4) Eu colocaria o tamanho da camada oculta igual à entrada.

os pesos sobem para as víboras, tudo é clássico, depois o peso é alimentado para a função de ativação. foi apenas inconveniente assinar tudo no touchpad

como um "ambiente" - aqui assumimos uma ação já realizada pelos NS externamente, por exemplo, uma transação... ou seja, memória do sistema para n ações para trás; o mesmo vale para o feedback - que ação levou a que resultado

por isso vou fazer uma camada interna igual à de entrada... e talvez adicionar outra mais tarde.

 
Yuriy Asaulenko:

Você só estará perdendo seu tempo. Não vai funcionar com dados reais.

Por exemplo: Uma resposta errada da NS, e isso afectará todas as respostas subsequentes.


Bem, na verdade não, só ns levará em conta a seriedade e eficácia das transações como um fator adicional... esta é apenas uma opção, não estou dizendo que é final

É por isso que estou a pedir outras ideias.

+ é um elemento adaptativo incorporado... como um transistor

e a NS principal tem outros fi

 
Maxim Dmitrievsky:

os pesos sobem para as víboras, tudo é clássico, depois o peso é alimentado para a função de ativação. foi apenas inconveniente assinar tudo no touchpad

como um "ambiente" - aqui assumimos uma ação já realizada pelos NS externamente, por exemplo, uma transação... ou seja, memória do sistema para n ações para trás; o mesmo vale para o feedback - que ação levou a que resultado

por isso vou colocar uma camada interior igual à de entrada... e posso adicionar outra mais tarde.

Depois, como opção, a soma dos lucros em pips. Um comércio bem sucedido -> aumentar, e vice versa.
Mas aqui a subtileza é que neste caso devemos pensar em adicionar a função Q, porque deve ser considerada como uma recompensa. Ou obter uma fórmula de aprendizagem com a recompensa em mente.
 
Aleksey Terentev:
Então que tal a soma do lucro em pips. Um comércio bem sucedido -> aumentar, e vice versa.
Mas aqui o problema é que neste caso devemos pensar em usar o Q-function, porque deve ser considerado como uma recompensa. Ou obter uma fórmula de aprendizagem com a recompensa em mente.

Sim, ok :) boa opção.

Até agora a fórmula é simples - neurónios separados, aos quais são alimentados os resultados do comércio passado, nem mesmo os neurónios, mas simplesmente os valores são adicionados ao combinador. Ainda não li realmente sobre o coolerunning

 
Maxim Dmitrievsky:

Sim, ok :) boa opção.

Até agora a fórmula é simples - neurónios separados, aos quais são alimentados os resultados passados da troca, nem mesmo os neurónios, mas simplesmente são adicionados valores ao viciador. Ainda não li realmente sobre os coolerings

Você cria dois NS idênticos, treinando um com imagens tradicionais e o outro com transferência direta de pesos, dosados de acordo com os resultados da previsão do primeiro, ou seja, o segundo deve aprender apenas com a experiência positiva.
 
Ivan Negreshniy:
Você cria dois NS idênticos, ensina um pelo imaginário tradicional e o outro pela transferência direta de escalas, dosados de acordo com o resultado da previsão do primeiro, ou seja, o segundo deve aprender apenas com a experiência positiva.

Existe uma tal variante, primeiro vários NS são treinados em períodos diferentes, depois são combinados em um... encaixe sofisticado :)

Eu gostaria que ele entendesse quando começar a funcionar muito instável e que se reorganizasse.

 
Maxim Dmitrievsky:

Existe uma tal variante, primeiro vários NS são treinados em períodos diferentes, depois são combinados em um... encaixe sofisticado :)

Eu quero que ele entenda quando começar a trabalhar com muita astúcia e a afinar a si mesmo.

Você obviamente tem a estrutura errada para tais propósitos.
 
Yuriy Asaulenko:
Você obviamente tem a estrutura errada para tais propósitos.

como é que o fazes?

 
Maxim Dmitrievsky:

como é que o fazes?

Eu não faço ideia). Mas, definitivamente não é assim.
 
Maxim Dmitrievsky:

Existe uma tal variante, primeiro vários NS são treinados em períodos diferentes, depois são combinados em um... encaixe sofisticado :)

Eu gostaria que ele entendesse quando começar a trabalhar com afinco e se reconstruir.

Em primeiro lugar - não é exatamente um ajuste, pois está provado que as comissões funcionam melhor, pode ser explicado, por exemplo, sobre desvios de sinais opostos de modelos separados, levando a uma maior precisão. Em segundo lugar, o NS tandem proposto é um modelo único e auto-adaptável que também provou ser benéfico nos métodos de aprendizagem de reforço.