Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1248

 

Eu acho que se o sobretreinamento é uma consequência de lembrar o mercado devido ao ruído, então lembrar o mercado requer uma certa quantidade de memória na forma de uma floresta de árvores de decisão e impulso, e modelos como árvore única e rede neural com um pequeno número de neurônios devem ser menos sobretreinados. Acontece então que existe uma quantidade crítica de dados que não pode ser descrita por, digamos, uma folha - o que é essa quantidade de 1% ou 10% - de toda a amostra (treinamento, teste, controle) é a questão. Então talvez devêssemos avaliar os dados em termos da quantidade de memória necessária para lembrar esses dados e tentar fazer do modelo uma ordem de magnitude menor desse volume crítico? Como fazê-lo - não sei, talvez deva haver algo semelhante com o arquivamento - se o arquivador comprime uma amostra de 10mb em 1mb, o modelo não deve ser superior a 102.4 kb. E, então, sabendo que o modelo não só memorizou a amostra, mas também encontrou nele regularidades, podemos ser menos críticos quanto aos testes em uma amostra independente e concluir não sobre o excesso de treinamento, mas sobre a falta de dados sobre a amostra para treinamento, pois não houve situações descrevendo o estado atual do mercado e, portanto, simplesmente não havia possibilidade de encontrar tal padrão usando os preditores disponíveis.

 
Agora fazer um modelo manual baseado nas folhas recebidas e acontece que cerca de 20 folhas para comprar e 5 folhas como filtro podem gerar cada ano de 2014 a 2018, e aqui estou eu a pensar, não pode haver sobretreinamento e não há folhas suficientes para encaixar de alguma forma... Então este é um padrão que vai perder a sua validade em 2019?
 
Maxim Dmitrievsky:

um padrão deve ter alguns pré-requisitos fundamentais, por exemplo, alguns ciclos no mercado são fundamentais, ou a reação às notícias, volatilidade intradiária... coisas como essa

E se as regularidades não são claras de onde elas vêm, então não está claro o que vai acontecer a seguir.

Modelos em árvores e tratam da questão da identificação de padrões, um preditor conta sobre um evento e um conjunto de certos eventos dá um padrão. Só que esta é uma regularidade que não vem do campo dos fenómenos físicos e não pode ser constante porque pode ser afectada por factores desconhecidos (fenómenos não descritos pelos preditores disponíveis).

Em geral a questão é que o evento estatisticamente recorrente é detectado pelos métodos de classificação MO, e é um pouco melhor do que apenas adequar o mercado com indicadores otimizadores, ou não?
 
Maxim Dmitrievsky:

A correlação entre o número de saias curtas no verão e o bem-estar financeiro dos cidadãos pode ser de 90%, mas não significa uma correlação, muito menos um padrão.

OK, vamos substituir a palavra "padrão" por "presságio" como uma correlação incognoscível com o evento.

Maxim Dmitrievsky:

O otimizador também é um MO.

Então, você equaciona os dois métodos?

 
Maxim Dmitrievsky:

não sou eu, é a forma como é... o optimizador minimiza qualquer f-função, o optimizador da rede neural optimiza os pesos f-função

Se estamos falando apenas da otimização dos filtros TC, então podemos concordar parcialmente sobre as mesmas ações, mas se o ponto de entrada/saída também for otimizado, então a situação é ligeiramente diferente do MO usual.

 
Maxim Dmitrievsky:

A este respeito, é necessário estudar a mineração de dados e sua aplicação aos mercados, se for possível, pois a curva de mineração de dados 1 também é meio que o topo da mais burra, mas algumas informações podem ser extraídas )

Estudar para poder candidatar-se em outra área?

 
Maxim Dmitrievsky:

para entender como extrair algo útil dos dados

Então eu notei anteriormente que extraí algo útil - talvez seja um grão de ouro, talvez seja um acaso... quem sabe... e não há maneira de saber ao certo.

 
Assumindo que os mercados são todos iguais e que o comportamento dos preços tem padrões semelhantes, porque não combinar uma dúzia de instrumentos em uma amostra e procurar "sinais" comuns em todos os mercados?
 
Vizard_:

É assim que é feito - é generalizado. "Padrões" são padrões encontrados a partir de diferentes amostras... Então, você acabou de corresponder numa amostra de tendências, e agora está a dar-nos uma dor de cabeça))))) Mas ainda precisa de preparar os dados cuidadosamente, para a ideia... Embora você possa ser infalível, mas é improvável...

Eu tive treinamento para 2016-2017 e depois acabei de verificar as fichas para 2014-2018 e selecionei as que eram rentáveis a cada ano e que preenchiam uma série de outros critérios (crescimento geral/não houve um grande saque). Por isso pergunto-me se um modelo desses pode ser usado.

Quanto a combinar diferentes instrumentos, tantos preditores aqui é o ganho em pips em diferentes intervalos de tempo, e não vai funcionar com diferentes instrumentos...

 
Maxim Dmitrievsky:

Todos os mercados são diferentes, claro, assim como os padrões, e o que funciona para um é uma perda para o outro.

Para assumir algo, você precisa assumir algo como base para uma suposição tão grosseira.

Então eu assumo que o assunto é o mesmo em todo lugar - um comerciante, então por que ele mudaria seu comportamento dependendo do instrumento? Se ele usa análise técnica ou qualquer outro método, mas ele usa este método em qualquer lugar, é diferente que ele possa usar um conjunto de métodos em momentos diferentes e é mais fácil encaixar um método em um instrumento e quando o trader (imagem coletiva) muda para outro, o modelo irá quebrar.