Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2474

 
mytarmailS #: Ninguém está interessado no facto de explicar porque é que os modelos não funcionam com novos dados, porque é que os comerciantes estão sempre a perder, a mecânica do próprio mercado é revelada... não ??? não está interessado ???

https://www.mql5.com/ru/forum/231011

https://squeezemetrics.com/download/The_Implied_Order_Book.pdf

Кукл :)
Кукл :)
  • 2018.03.07
  • www.mql5.com
Провел миниисследование на тему Кукла :) Если кто не верит в хождение за стопами, то вот вам с вертушки :) Конкретно на рисунке, пытался представит...
 
Evgeniy Ilin #:

Há aqui alguma verdade, mas eu verifiquei o meu modelo, o principal é saber com qual frente estamos a contar....

Não entendo bem, mas o problema é meu, não estudei bem, pareço um pouco diferente dos algoritmos de negociação, mais das regras sociais e das regras ou fórmulas de busca genética, como regressão simbólica, etc. Mas se você conseguiu fazer modelos simples funcionarem com novos dados, é muito interessante ouvir falar sobre isso...

Obrigado por ler...

Também adoro Maitreid, vi o seu vídeo provavelmente 8 vezes, nem uma única palavra extra...

Quanto ao boneco, acho que é muito mais simples: a troca vive com a comissão, e se a maioria das pessoas quer comprar, e esta compra pede abaixo do preço atual, a troca é rentável para satisfazer os compradores, porque há mais deles, então a comissão (dinheiro) pode ganhar mais, então o preço desce e vice versa com os vendedores ...

Como o faz, apenas imprime o preço ou manipula o copo ou outra coisa que não sei, mas acho que o resultado final é o mesmo...

É por isso que o preço é contrário às posições dos participantes.

 
mytarmailS #:

Eu realmente não entendo você, mas é problema meu que eu não estudei bem, eu olho um pouco diferente para algoritmos de negociação, mais para regras sociais e regras ou fórmulas de busca genética, como regressão simbólica, etc. Mas se você conseguiu fazer modelos regulares funcionarem em novos dados, é muito interessante ouvir sobre isso.

Sim eu tenho, a qualidade não é como na trama de treinamento, mas sempre parte dessa qualidade é mantida, e na minha pesquisa de 10 anos de história pode ser de até um ano, em média 2-3 meses funciona para uma qualidade razoavelmente boa, em relação à trama de treinamento percentual 60-70 em média, provavelmente. Uma rede neural dará melhores resultados, mas já há necessidade de adicionar estes critérios de requalificação, de introduzir dados combinados algo como pesos, de dar certo peso à quantidade de dados, depois qualidade do backsest final, por exemplo, expectativa ou profitka e, claro, complexidade do algoritmo final, que acabou por se revelar (quantidade de todos os pesos de todos os perceptrons, por exemplo). Para consegui-lo em uma rede neural, o tipo de neurônios deve ser o mais diferente possível, e o número de camadas e sua composição deve ser arbitrária, nesse caso é possível. Basicamente todos usam redes neurais de arquitetura fixa, mas por alguma razão não entendem que a arquitetura também deve ser flexível, ao destruir essa flexibilidade destruímos a possibilidade de minimizar a reciclagem. Em geral o mesmo critério pode, naturalmente, ser aplicado a modelos simples, mesmo que seja necessário, então você terá um bom avanço, meu modelo dá um par de meses de lucro à frente e as configurações podem ser atualizadas em um dia. Um dos principais truques é levar o máximo de dados possível (10 anos de história ou mais), neste caso há uma busca por padrões globais, e eles são baseados na física do mercado e, na maioria dos casos, ainda funcionam por muito tempo.

 
Evgeniy Ilin #:

Consegui, a qualidade não é.....

Preciso de ferro forte, tenho o tecto de ferro, mas há uma solução para este problema.

Se você não leu, vai gostar, tenho certeza que tem idéias interessantes sobre os critérios para a qualidade do modelo.

 
mytarmailS #:

Eu preciso de ferro forte, eu também tenho problemas com o hardware, mas há uma solução para este problema.

Realmente eu preciso de servidores) mas não os tenho (acabei de fazer todos eles em netbook morto), preciso de um tempo longo e doloroso para ler. Mas por si só não há outra maneira, ou você pega energia de algum lugar e carrega-os com força, neste caso você tem que verificar 20-30 configurações pelo menos, e melhor perto de cem, e para cada sinal pendurado e monitor, mais estável que vai passar uma seleção natural e sair, em seguida, tentar adicionar mais energia. Não há outra maneira, senão é só um caminho para lugar nenhum, como muitos já escreveram aqui... pode realmente esticar-se por muitos anos sem saber onde escavar. A alternativa é uma licenciatura em ciências do fórum e tagarelice sobre as fases da lua e a sua influência no mercado no espírito dos espectáculos de Prokopenko )))) Qual é a solução, senão um segredo?

 
Evgeniy Ilin #:

Qual é a solução, se não é um segredo?

No livro a que me liguei, a solução é descrita de forma mais inteligente... Eu realmente recomendo a sua leitura...

Em termos simples a solução é elementar, você precisa dividir o problema, por exemplo, agrupar os dados e treinar modelos diferentes para cada agrupamento.

Ou ainda um exemplo mais simples: Há 5 dias de negociação em uma semana, então treinamos um modelo diariamente às segundas-feiras, o segundo às terças-feiras, etc. Portanto, reduzimos a amostra de treinamento 5 vezes e temos 2 anos de treinamento, não 10 anos, e assim depende da nossa imaginação.

 
mytarmailS #:

O livro a que liguei descreve esta solução de forma mais inteligente... Eu realmente recomendo a sua leitura...

Em termos simples, a solução é elementar: você precisa dividir o problema, por exemplo, agrupar os dados e treinar modelos diferentes para cada agrupamento.

Ou ainda um exemplo mais simples: em uma semana de 5 dias de negociação, treinamos um modelo estritamente para as segundas-feiras, o segundo para as terças-feiras, etc. Acabou por reduzir a amostra de treinamento de 5 vezes e já 10 anos, e 2 anos de treinamento, e assim por diante é a imaginação ...

Não o li, mas foi tudo implementado, fi-lo pela mesma razão, precisava de reduzir o tamanho da amostra, mas ainda assim consegui analisar profundamente a história, mas fi-lo experimentalmente quando compreendi que não sou suficientemente forte no meu computador e posso fazê-lo melhor )))), mais multithreading e coisas do género... tudo para tirar o máximo proveito disso.

 
Evgeniy Ilin #:

Não o li, mas já foi implementado na minha casa. Fi-lo pelo mesmo motivo, tive de reduzir a amostragem de alguma forma, mas ainda assim ser capaz de analisar profundamente a história, mas cheguei a ele experimentalmente quando percebi que o meu computador não é suficientemente forte e posso fazê-lo melhor )))), mais multithreading e coisas do género... tudo para tirar o máximo proveito disso.

bem, então

)))


=====

A sério, o livro descreve como descarregar mais eficientemente sem perda de qualidade, mas é pouco provável que poupe ... Acho que está na hora de mudar para algoritmos eurísticos...

ou algo como uma base de conhecimento, esta é a menor divisão, minhas idéias e pensamentos vão nesta direção, como variantes de eventos e sinais serão para dezenas de gigabytes, e um modelo com 20 milhões de sinais não pode ser treinado...)) então uma base de conhecimento parece uma saída para a "maldição da dimensão" para mim

 
mytarmailS #:

ou algo como uma base de conhecimento, essa é a menor paixão, minhas idéias e pensamentos vão nessa direção, pois haverá dezenas de gigabytes de variantes e sinais de eventos, e um modelo com 20 milhões de sinais não pode ser treinado...)

Esquece os sinais. A meu ver, é uma quantidade escalar (ou seja, uma expressão matemática, mesmo que seja lógica, pode ser reduzida a uma matemática, só a precisão sofrerá). Todos esses valores escalares ou lógicos são derivados do preço, porque não temos outros dados e tentar usar dados adicionais pode simplesmente piorar a previsão, porque os dados são diferentes e podem ser de fontes diferentes, caso em que não está claro quais dados devem ser priorizados. Qualquer série numérica pode conter todas as outras séries numéricas dentro dela, se todas as formas possíveis de transformar essa série forem utilizadas... tente entender isto. Neste caso, não dê ao algoritmo este espaço, mas deixe-o encontrar estas características por si só... não precisas de nenhuma base, precisas de poder. Se houver um sistema e ele funcionar pelo menos parcialmente, o próximo passo é a descentralização dos cálculos. Os trabalhadores precisam estar em rede e a base de dados ajuda, mas deve funcionar como um repositório para resultados comuns. Isto já soa a mineração.

 
Evgeniy Ilin #:

Esquece os atributos. Meu entendimento é que é uma quantidade escalar (ou em outras palavras, uma expressão matemática, mesmo que seja lógica, pode ser reduzida a matemática, apenas a precisão sofrerá). Todos esses valores escalares ou lógicos são derivados do preço, porque não temos outros dados e tentar usar dados adicionais pode simplesmente piorar a previsão, porque os dados são diferentes e podem ser de fontes diferentes, caso em que não está claro quais dados devem ser priorizados. Qualquer série numérica pode conter todas as outras séries numéricas dentro dela, se todas as formas possíveis de transformar essa série forem utilizadas... tente entender isto. Neste caso, não precisa de dar ao algoritmo este espaço de funcionalidade, precisa de deixar que ele encontre estas funcionalidades por si só... não precisas de nenhuma base, precisas de poder. Se houver um sistema e ele funcionar pelo menos parcialmente, o próximo passo é a descentralização dos cálculos. Os trabalhadores precisam estar em rede e a base de dados ajudaria, mas precisa funcionar como um repositório para resultados comuns. Isto já soa a mineração.

Não entendo muito bem a tua visão, por isso não vou discutir...

Eu vejo o meu algoritmo como uma sequência de eventos, o evento é uma regra de registo, a sequência não é cronometrada, ou está lá ou não.

(como um trader que estabelece um nível, o preço pode chegar a ele em 5 minutos ou em um dia, mas a situação é a mesma)

Portanto, o conjunto de tais sequências de trabalho será o TS.

Mas para encontrar tais sequências "não dimensionais" precisamos de passar por triliões de variantes, a solução que vejo - criar uma base de conhecimento no seu disco rígido...


Penso que todas as formações "típicas" de qualquer algoritmo numa janela em movimento não são variantes funcionais, uma vez que o mercado não é estável. A saída será uma média móvel com uma memória do passado, que nunca se repetirá no futuro devido à não-estacionariedade...