Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 414

 
elibrarius:

Porque é que não se sabe? O número de clusters a dividir é definido como valor de entrada no início: K - número desejado de clusters, K>=1

Suponha que eu tenha dividido os dados em 4 grupos, o que devo fazer com eles?


Quero dizer que não sei de antemão que classe pertence ao que na amostra... o que fazer com eles depois em termos de negociação não sei, pode ser ver que casos pertencem a vender sinais e quais a comprar, o que é mais, e assim por diante...
 
Aleksey Terentev:
Os pacotes ML que conheci permitiram-me alterar a função de activação da camada.
Basicamente, se você tiver conhecimento suficiente e se a biblioteca permitir, você pode herdar a classe de neurônio e registrar lá sua função de ativação.
Mas esses são métodos extremos.

Eu queria me enfiar e escrever algumas das minhas camadas recorrentes - ainda bem que ganhei juízo. =)
 
Aleksey Terentev:
Basicamente, se você tiver conhecimento suficiente, e se a biblioteca permitir, você pode herdar a classe de neurônio e escrever lá sua função de ativação.
Mas estes são métodos extremos.

Uma vez eu quis entrar e escrever algumas das minhas camadas recorrentes, mas é bom que eu tenha caído em si. =)
Há apenas uma selecção inicial do tipo de rede por tipo de saída, não há necessidade de reescrever nada (e todas as camadas internas estão ligadas por cabo como não lineares)
 

O softmax dividiu os sinais normalmente, não como antes havia poucas compras e poucas vendas, agora é igual. Mas ainda está a perder dinheiro, preciso de trabalhar melhor os preditores e os alvos.


 
Rapazes, sobre as duas saídas com probabilidades. Eu acho que você está absolutamente certo, para comprar uma saída é 0,9, então para vender outra saída é 0,1. Mas porque precisamos dela é uma pergunta interessante. Em um gráfico fora da amostra, ambas as entradas darão 0,9 o que então???? O mais provável é que haja um nervosismo para a frente e para trás. Também acontece no mercado quando há incerteza. O mercado não sabe para onde ir, e o sinal já apareceu. E como se costuma dizer, obtém-se mais informação...
 
Você quer que eu escreva um longo post sobre como reconhecer o mercado completamente????? De qualquer forma uma idéia de como você pode tentar, além disso seria mais rápido de fazer em dois três computadores, considere o cálculo paralelo, eu tenho-o em 3 núcleos...
 

Lembro-me de alguém me repreender por ter de orientar o meu modelo todas as manhãs para poder trabalhar com ele no futuro. Aqui está como o meu modelo hetero funcionou hoje. Mau, dizes tu, claro que te vou dizer... Agora espelhe-o na sua cabeça e comece a negociar a partir do terceiro sinal. Como agora????? E você diz que o método de orientação é uma treta....

E não há necessidade de mimar a Avózinha!!!! :-)))))

 

Muito bem, agora que estás no ponto, vou dizer-te uma ideia sobre a recolha de dados para processamento. É realmente difícil treinar um modelo com um alto nível de generalização numa área suficientemente grande, porque o mercado é um organismo vivo e blá, blá, blá, blá. Quanto mais longo o período de treino, pior é o desempenho do modelo, mas mais longo. Objetivo: Fazer um modelo de longo prazo. Divisão ou método dois, porém para aqueles que utilizam um comitê de duas redes.

Temos três estados: "Sim", "Não" e "Não sei", quando as grelhas aparecem em direcções diferentes.

Nós treinamos a rede em toda a secção, no nosso caso 452 entradas. A rede aprendeu este conjunto em 55-60%, assumindo que as respostas "Não Sabe" no conjunto de treinamento foram 50%, então 226 sinais que a rede não pôde aprender. OK, agora nós construímos um novo modelo SOMENTE sobre os estados "Não sei", ou seja, tentamos construir o modelo sobre estados tão quase-estatais que enganaram o primeiro modelo. O resultado é aproximadamente o mesmo de 226, apenas metade será reconhecida, o resto terá o estado "Não sei", depois construirá o modelo novamente. o resultado é 113, depois 56, depois 28, depois 14. Em 14 entradas não conhecidas por nenhum dos modelos anteriores, o Jprediction Optimizer calcula normalmente até 100% de generalizabilidade.

Como resultado, temos um "Sistema Padrão" que reconhece todo o mercado em um período de três meses.

Aqui está outra maneira, além do "Contexto do dia" Como você pode dividir o mercado em subespaços e realizar treinamentos obtendo exatamente o "Sistema Padrão" Aqui está um exemplo....

 

Para ser honesto, eu fiz a subdivisão um pouco diferente aqui, mas a essência permanece a mesma.

Havia um arquivo geral de 288 linhas, eu o dividi em três amostras, o número de registros da amostra de treinamento é especificado na linha Tootal patterns.

* Sensitivity of generalization abiliy: 74.07407407407408%
* Specificity of generalization ability: 70.96774193548387%
* Generalization ability: 72.41379310344827%
* TruePositives: 20
* FalsePositives: 7
* TrueNegatives: 22
* FalseNegatives: 9
* Total patterns in out of samples with statistics: 58

O último:

* Sensitivity of generalization abiliy: 61.904761904761905%
* Specificity of generalization ability: 60.0%
* Generalization ability: 60.869565217391305%
* TruePositives: 39
* FalsePositives: 24
* TrueNegatives: 45
* FalseNegatives: 30
* Total patterns in out of samples with statistics: 138

E o último.

* Sensitivity of generalization abiliy: 69.04761904761905%
* Specificity of generalization ability: 66.0%
* Generalization ability: 67.3913043478261%
* TruePositives: 29
* FalsePositives: 13
* TrueNegatives: 33
* FalseNegatives: 17
* Total patterns in out of samples with statistics: 92

Sem condições cada um deles deve ganhar, mas preste atenção ao número total de negócios nesta área 54 peças (estratégia básica). E foi isto que aconteceu quando todos eles trabalharam juntos ao mesmo tempo.


 
É tudo um site fora da amostra a partir das 05.29 em 15 minutos. Já está na sua terceira semana. Mas se não ganhar mais então é basicamente uma ninharia na abordagem, mas eu acredito...... :-)