Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 109

 
Segundo isso, o pensamento ocorreu no fim-de-semana. Na verdade, quanto mais frequentemente a rede diz "não sei", mais se aproxima o momento de treiná-la em excesso. No início do OOS, quase todos os sinais são interpretados sem ambiguidade, mas com o tempo a rede começa cada vez mais a dizer "não sei", o que indica que novos dados estão a chegar, o que é difícil de interpretar. Quando um certo nível de "não sei" é atingido, a rede é treinada de novo. Uma coisa muito útil ....
 
Toda a conversa sobre a atenuação gradual do modelo no OOS e a utilidade desta informação no comércio parece pouco convincente sem falar da pré-selecção dos preditores.
 
SanSanych Fomenko:
Toda a conversa sobre o desvanecimento gradual do modelo no OOS e a utilidade desta informação no comércio parece pouco convincente sem falar da pré-seleção dos preditores.
Então, qual é a escolha? Vamos escolher um modelo com o nível máximo de generalização, ver como ele se desempenha no intervalo de treinamento. O euviti deve crescer uniformemente... E depois há a sorte. Não há lugar nenhum sem ele...
 
Andrey Dik:

Ato.

Se um modelo dá sinais errados no OOS, é uma indicação de treinamento defeituoso, não o fato de que o mercado tenha mudado.

Eu concordo com isso. Mas como se analisam os sinais de duas redes? Não está muito claro? Quanto é que eles divergem ou estão em uníssono?
 
Alexey Burnakov:
Eu concordo com isto. Como se analisam os sinais de duas grelhas? Não está muito claro? Como é que eles divergem ou estão em uníssono?

Trazendo os sinais para um padrão comum como este:

VENDER COMPRAR Interpretação

-1 0 vender

0 0 cerca

0 1 compra

-1 1 vedação

Em um modelo bem treinado, os sinais raramente se contradizem. Não é exigido deles igual número de sinais na área de formação e, em regra, eles são diferentes, o que é compreensível, porque o mercado pode ter tendências globais prolongadas. Mas restrinjo o número de sinais de uma grelha para não exceder 2 vezes o número de sinais da outra. Eu não posso responder porque é 2 vezes, mas é uma relação empírica. Por exemplo, se a tendência muda de ascendente para descendente, a quantidade de sinais para vender aumenta e os sinais para comprar começam a mentir, ocorre uma contradição e a quantidade de transações diminui - este é um sinal de que é necessário um novo treinamento.

 
Andrey Dik:

Trazendo os sinais para um padrão comum como este:

VENDER COMPRAR Interpretação

-1 0 vender

0 0 cerca

0 1 compra

-1 1 vedação

Em um modelo bem treinado, os sinais raramente se contradizem. Não é exigido deles igual número de sinais na área de formação e, em regra, eles são diferentes, o que é compreensível, porque o mercado pode ter tendências globais prolongadas. Mas restrinjo o número de sinais de uma grelha para não exceder 2 vezes o número de sinais da outra. Eu não posso responder porque é 2 vezes, mas é uma relação empírica. Por exemplo, se a tendência muda de ascendente para descendente, a quantidade de sinais de venda aumenta e os sinais de compra começam a mentir, ocorre uma contradição e a quantidade de transações diminui - este é um sinal de que é necessário um novo treinamento.

Obrigado. Isto pode ser uma ideia funcional.
 
Combinador:

Sim, mas não sobre a configuração neurônica.

Andrei parece estar insinuando em alguns insumos tão poderosos que qualquer modelo não lhes dará resultados bons e não retardados.

Ou talvez ele se esteja a referir a outra coisa. Mas uma resposta mais detalhada seria apreciada.

 

Novo jPrediction 9.00 Lançado

Citação do manual do usuário:

"Diferenças entre o jPrediction e outros softwares de aprendizagem de máquinas

A principal diferença entre jPrediction é a ausência de qualquer configuração definida pelo usuário, o que permite livrar-se do fator humano na forma de erros humanos, tanto no processo de configuração e seleção de algoritmos quanto no processo de seleção de arquiteturas de redes neurais. Todo o processo de aprendizagem da máquina em jPrediction é totalmente automatizado e não requer nenhum conhecimento especial dos utilizadores ou da sua intervenção.

Funções desempenhadas por jPrediction no modo automático

  1. Leitura e análise de um arquivo com múltiplos exemplos para construir um modelo de classificação matemática;
  2. Normalização dos dados antes da aprendizagem da máquina;
  3. Dividindo o conjunto de todos os exemplos da amostra em dois subconjuntos: um subconjunto de treinamento e um subconjunto de teste;
  4. Equilíbrio de exemplos do subconjunto de treinamento;
  5. Formação da arquitectura da rede neural;
  6. Treinamento de um conjunto de modelos sobre um subconjunto de casos de treinamento com diferentes combinações de preditores (fatores);
  7. Redução da arquitectura da rede neural - remoção de elementos supérfluos;
  8. Teste de um conjunto de modelos em um subconjunto de exemplos e computação de habilidades de generalização;
  9. Seleção do melhor modelo de acordo com o critério de máxima generalização.

Uma vez que, do conjunto de modelos, cada um deles diferente de qualquer outra combinação de preditores, apenas aquele com máxima capacidade de generalização é seleccionado, a redução (selecção) dos preditores mais significativos é assim automaticamente realizada".

Deve ser dito que a partir da versão 8, jPrediction não tem limitações no número máximo de preditores na amostra de treinamento. Antes da versão 8, o número de palpiteiros na amostra de treinamento era limitado a dez.

Antes da versão 8, o jPrediction era um modelo único. Ou seja, foi retirada uma amostra e apenas um único modelo foi treinado e testado nele.

Desde a versão 8, o jPrediction tornou-se multi-modelo, ou seja, treina e testa muitos modelos diferentes, em diferentes partes da amostra, e cada parte contém diferentes combinações de preditores. Um destes modelos daria a máxima generalização sobre a parte de teste da amostra.

O problema foi que se diferentes combinações de preditores forem tomadas, então uma busca completa de combinações resulta numa chamada "explosão" combinatória (do termo combinatória), ou seja, com cada preditor adicional duas vezes mais modelos precisam ser treinados e testados do que sem ele. É bastante óbvio quando o número de preditores na amostra é medido em dezenas e até centenas, torna-se problemático esperar pelo treino e teste de todos os modelos combinatórios em tempo razoável.

O problema da "explosão" combinatória em jPrediction foi resolvido não tentando todas as combinações possíveis, mas pelo método de busca sequencial. A essência do método é a seguinte:

Suponha que tenhamos encontrado alguma combinação contendo N preditores com o máximo de generalização, tentando todas as combinações possíveis de N e menos preditores. Temos de lhe adicionar o preditor N+1. Para isto, adicionamos um a um todos os preditores da amostra que não foram incluídos na combinação e medimos a sua capacidade de generalização. Se no processo de tal pesquisa encontrarmos uma combinação com preditores N+1 cuja capacidade de generalização seja superior à melhor combinação de preditores N, podemos encontrar uma combinação com preditores N+2 da mesma forma. E se eles não o encontraram, então é claro que não vale a pena procurar mais e o algoritmo de tentar combinações pára na melhor combinação de N preditores. Como resultado, o algoritmo de busca de combinações de preditores para o modelo pára muito mais cedo em comparação com a tentativa completa de todas as combinações possíveis. A economia adicional de recursos computacionais ocorre devido ao fato de que a busca começa a partir de um pequeno número de preditores no sentido de aumentar esse número. E quanto menos preditores forem necessários para o treinamento, menos tempo e poder computacional é necessário para construir os modelos.

Esse é o tipo de tarte.

Se você estiver interessado, o arquivo ZIP anexo contém o manual do usuário jPrediction 9 em russo em formato PDF:

Arquivos anexados:
 
Fixe! És o único que está a arrastar tudo? O termo "redução" não é claro. Se você olhar para a tecnologia, é uma redução múltipla de algo. E contigo, é uma selecção.
 
Yury Reshetov:

O novo jPrediction 9.00 Release foi lançado


Tudo bem, exceto uma pequena coisa: não há comparação com outros modelos.

Eu ofereço os meus serviços para comparação

1. Você prepara um arquivo Excel de entrada contendo os preditores e a variável alvo

2. Você faz o cálculo

3. Você me envia o arquivo de entrada.

4. Eu faço os cálculos usando a randomforest, ada, SVM

Nós comparamos.