Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 131

 

A versão 10 do classificador ternário jPrediction foi lançada

A validação cruzada é implementada na nova versão.

Devido à validação cruzada, a capacidade de generalização no OOS em comparação com a versão 9 melhorou acentuadamente, especialmente em dados não estacionários. Ao mesmo tempo, a capacidade de generalização de acordo com os resultados dos testes em diferentes partes da amostra, que é dada como características do modelo nas versões 9 e 10, permaneceu praticamente inalterada.

Como as alterações não afetaram a interface do usuário, as instruções para usuários da versão 9 permanecem válidas. Links para baixar novas versões do jPrediction, bem como seu código fonte, podem ser encontrados nas instruções.

 

Awl Writer:
1) simplesmente compara as duas séries temporais por valores absolutos, ou seja, é necessário um deslocamento pré-normalização e uma escala no eixo vertical, e depende muito da implementação particular.

2) Por exemplo, aqui https://www.mql5.com/ru/code/10755 leva 2 peças de comprimento fixo para comparação

3) e não leva em conta que um deles pode ser mais longo, o outro mais curto

4), e a quantidade de cálculo pode ser muito reduzida, etc. Podemos falar de agrupamento por parâmetros específicos DTW - não apenas o "grau de semelhança" de dois fragmentos pode ser calculado, mas também a relação de escalas horizontais.

1) Bem, antes de uma comparação de similaridade de duas séries pelo algoritmo DTW, a normalização só é feita, naturalmente, da forma habitual... os que substituem os valores absolutos dos preços na faixa dizem de 0 a 1 , o que você quer dizer com a normalização doturno e da escala ? explique por favor

2) Obrigado pelo link, estou no mínimo chocado, tenho exatamente a mesma idéia do autor, fiz exatamente a mesma pesquisa, passei exatamente pelo mesmo caminho evolutivo, da correlação regular para DTW, me dá arrepios... estávamos a fazer a mesma coisa, a pensar na mesma coisa em momentos diferentes, em lugares diferentes, a formigar...

3) Sim, não foi levado em conta, embora seria correto considerar, mas eu acho que por que o autor não o implementou, o fato é que se você começar a pensar mais profundamente: "mas como implementá-lo", então sai um monte de perguntas que não têm respostas ...

porque não é só procurar semelhanças com DTW em segmentos de comprimento fixo, como fiz no clustering ou o autor deste artigo, mas é muito mais complicado...

aqui estão algumas perguntas que vêm à baila

1. Como comparar a semelhança do padrão de preços atual com os padrões históricos, se não só temos que caminhar na história e buscar semelhanças, mas também expandir/diminuir dinamicamente o padrão atual e o padrão histórico com o qual estamos comparando?

2. como lutar pessoalmente com energia insuficiente deduzida para DTW mesmo em comprimento fixo de dois segmentos, e com variante ( 1.) a carga aumenta milhares de vezes sem exagero....

4) Como????

 
mytarmailS:

1. Você pode trazer os valores da série para a faixa [0;1], mas é melhor imho eliminar o componente constante subtraindo a média (MA) de cada elemento, e dividindo cada elemento pelo desvio padrão. O navegador, um parasita como aquele, destruiu parte do texto.

3-4. Se você olhar para a essência do algoritmo, como a matriz é preenchida, muito se tornará claro. Comparamos dois segmentos de igual comprimento, que têm início e fim fixos. Podemos fixar o início e fazer o fim flutuar, e introduzir uma restrição de fator de escala de 0,5 a 2 no algoritmo - você terá DTW com restrições. O resultado não será um, mas dois números, e isso nos dará um preditor adicional. Como reduzir a quantidade de cálculos - encontrar "pontos singulares" (extrema), puxá-los um para o outro e assim jogar fora uma grande parte da área da matriz, veja os links para mais detalhes. Veja também wikipedia Dynamic Time Warping, seção Referências.

 
Alexey Burnakov:

Cavalheiros, uma nova tarefa da minha parte:

Aqui está um conjunto de dados em formato .R: https://drive.google.com/open?id=0B_Au3ANgcG7CcjZVRU9fbUZyUkE

Há aproximadamente 40.000 filas, 101 colunas no conjunto. A coluna mais à direita é a variável de destino. À esquerda estão 100 entradas.

Eu sugiro que você tente construir um modelo de regressão prevendo o valor da 101ª coluna com base nas 100 colunas restantes, nas primeiras 20.000 observações.

Nas restantes 20.000+ observações, o modelo construído deve mostrar um R^2 de pelo menos 0,5.

Eu então revelo a forma como os dados são gerados e dou a minha solução.

A dica são os dados da série cronológica. A entrada é de 100 amostras, previstas 1 à frente. Não se trata de preços ou cotações ou seus derivados.

Alexei

Quem tentou? Os meus colegas e eu queremos treinar uma NS de convolução. Há algum mapeamento em curso. Temos esperança.

Uma espécie de aplicação não convencional do método. Por outro lado, nós simplesmente apresentamos uma "imagem" unidimensional como entrada e podemos mapear os "pixels" vizinhos e suas várias interações lá.

 
Alexey Burnakov:

Quem já tentou? Os meus colegas e eu queremos treinar uma NS de convolução. Há algum mapeamento em curso. Esperamos que sim.

Uma espécie de aplicação não convencional do método. Por outro lado, nós simplesmente apresentamos uma "imagem" unidimensional como entrada e podemos mapear os "pixels" vizinhos e suas várias interações lá.

Então deixe os colegas tentarem, ou é fraco?
 
Alexey Burnakov:

Os meus colegas e eu queremos treinar uma NS de convolução. Há algum mapeamento em curso. Esperamos que sim.

Interessante, à espera de impressões...
 
mytarmailS:


1. Como podemos comparar a semelhança do padrão de preços actual com os padrões históricos, se não só temos de andar pela história e procurar semelhanças, mas também expandir/diminuir dinamicamente tanto o padrão actual como o padrão histórico com o qual estamos a comparar?


Qual é a necessidade disso? Se um padrão tem uma analogia na história, então deve ser o mesmo que é em termos de duração. Pelo menos estava à procura de secções proporcionais quando fiz uma pesquisa de padrões.
 
Youri Tarshecki:
Porquê tanta necessidade? Se um padrão tem uma analogia na história, então ele também deve corresponder na sua duração. Pelo menos eu estava à procura de secções proporcionais quando fiz uma pesquisa de padrões.

1) Bem, pelo menos porque nenhum padrão é exatamente o mesmo no mercado,

2) e porque a dtw oferece uma oportunidade tão grande

3) e porque todos sabemos o resultado da procura de padrões idênticos por tamanho, incluindo você... ou vais surpreender-me? :)

 
Evento:
Então deixa os teus colegas tentarem, ou isso é fraco?
O que queres dizer, passageiro? Você não quer tentar, ou à sua maneira. Estou a trabalhar na minha própria tarefa e estou interessado.
 
mytarmailS:
Interessante, ansioso pelas impressões...
O que mais você diria? Estás à espera dos resultados?