Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2038

 
Maxim Dmitrievsky:

não há nada a discutir, porque em qualquer quadro normal fez e mostrou, com um mínimo de código

não discuto aqui modelos feitos por mim, apenas modelos maduros como catbust ou redes neurais modernas

Nem sequer é interessante discutir esta confusão do rato com redes neurais mql, porque o mundo está muito à frente, e todos os anos a distância duplica.

Suponha que você me diga: "Eu tenho um modelo em fluxo tensor"... Eu digo "bom, eu posso fazer o mesmo modelo em uma Tocha por 5 minutos e verificar". E dizes-me que construíste algo em mql. Para que preciso dessa informação? Como é suposto eu recriá-la?

Por que você não admite que eu tenho um modelo quetensorfloat/torch vai levar mais dois anos para construir eeu vou triplicar a produção?)

de algum livro de Edgar Peters, não literalmente, claro - "O escriturário/corretor passará uma nota de cinco libras deitado em alguma rua, porque na sua teoria de probabilidade não deveria estar lá...")

Boa sorte.



 
elibrarius:

Quanto mais linhas houver, mais profundidade é necessária.
Se há gigabytes, então milhões de linhas. Na profundidade 6, a folha final será 1/64 do número total de exemplos/cordas, ou seja, dezenas de milhares se a entrada for de milhões.

Assim, a CB constrói conjuntos, ou seja, o corte acontece nos dois sentidos, e o corte depende do número de árvores em geral, eles recomendam uma profundidade máxima de 10.

 
dr.mr.mom:

porque não admite que eu tenho um modelo quetensiona/estica mais uns anos e triplico a diferença, porque não o faz?)

já é um desânimo a falar, infelizmente.

 
Aleksey Vyazmikin:

Assim, a CB constrói conjuntos, ou seja, o corte acontece nos dois sentidos, e a afiação depende do número de árvores em geral eles recomendam uma profundidade máxima de 10.

Aparentemente, isto não é uma recomendação para milhões de linhas. Tenta 15.

 
elibrarius:

Aparentemente, não é para milhões de linhas de conselhos. Tenta 15.

Isto é apenas para amostras muito grandes em largura e profundidade.

Estou dizendo que a aprendizagem é fácil, mas os padrões detectados pela aprendizagem não são confirmados na amostra de controle.

 
Aleksey Vyazmikin:

Isto é apenas para amostras muito grandes em largura e profundidade.

Estou dizendo que aprender é fácil, mas os padrões detectados no aprendizado não são confirmados na amostra de controle.

Na minha opinião, o número de colunas não é tão importante para a profundidade. Apenas para um grande número de filas você precisa aumentar a profundidade. Quanto às colunas, você pode ter até um milhão. Todos eles serão verificados e apenas os melhores serão selecionados.
 
Igor Makanu:

geralmente não há problema com a análise da informação do mercado... exceto pela ganância do pesquisador, que acredita que o mercado só dá informações a ele e precisa processar todos os dados, ou seja, aqui a tarefa é formalizada como procurando um padrão de repetição, outros dados devem ser descartados (não utilizados)

com a decisão é triste - gerar TS que passará no teste e é possível avançar, mas encontrar ligações entre as estatísticas do testador de estratégia e o tempo de persistência do TS ou a possibilidade de determinar a conformidade do TS com o contexto do mercado - esse é o problema

ou seja, enquanto você escreve o problema está no futuro.


penso que, em geral, fizemos um pequeno progresso na formalização do problema,

em princípio não é difícil fazer uma descarga de estatísticas de testes e tentar treinar NS em Python,

Determinação do contexto do mercado, imho it is as you wrote - apenas a decisão de um trader, ou seja, duvido que possa ser formalizada, ou que possa ser investigada por um algoritmo

Com átomos é mais simples em 2 níveis de átomos de moléculas de matéria em inorgânicos e moléculas de matéria em moléculas grandes e muitos átomos em orgânicos. Na análise do mercado estatal, as entidades empresariais são pessoas. e as pessoas são mais complicadas do que os átomos e seus componentes.

 
elibrarius:
Na minha opinião, o número de colunas não é tão importante para a profundidade. Apenas um grande número de filas deve aumentar a profundidade. Mas as colunas podem chegar a ser de um milhão. Todos eles serão verificados e apenas alguns dos melhores serão escolhidos.

No total, o resultado é o seguinte - 2 árvores no total

A métrica

Avaliando a importância dos preditores de acordo com o método selecionado

Em anexo está um modelo C++ e bin e uma tabela de quantização.

Parece-me que a amostra ou precisa ser misturada, ou isto é o máximo - confundido pela diferença de métricas entre as amostras de teste e as amostras de exame.

Arquivos anexados:
model.zip  19 kb
 
Valeriy Yastremskiy:

Com átomos é mais fácil em dois níveis átomos de moléculas de matéria em inorgânicos e moléculas de matéria em moléculas grandes e muitos átomos em orgânicos.

É exactamente assim, mas desde que se considere os átomos, e assim que se decida considerar uma malha de cristal, "está tudo acabado" - na maioria dos casos é muito difícil resolver o problema, li uma vez, pela forma como utilizam as redes neurais - são obtidos resultados mais rápidos do processo de modelação

É o mesmo com os mercados, enquanto nós olhamos para um ou dois ticks, não há muitas variantes - seja para cima ou para baixo, tudo se torna complicado se procedermos aos estudos "aqui abriram uma ordem, e aqui fecharam-na")))

Valeriy Yastremskiy:

Na análise de mercado dos estados, as entidades empresariais são pessoas. e as pessoas são mais complexas do que os átomos e seus constituintes. definitivamente mais complexas do que a química orgânica.

Sim, é uma estrutura viva, mas tem um modelo de comportamento - que se chame padrão ou contexto de mercado, não o ponto.

você pode estudar o comportamento na história, agora cabe a você decidir o que fazer no futuro.

 
Aleksey Vyazmikin:

Este é o resultado geral - 2 árvores no total

Métrica

Estimativa da importância dos preditores de acordo com o método selecionado

Modelo anexo C++ e modelo de caixote do lixo, e tabela de quantização.

Parece-me que a amostra ou precisa ser embaralhada, ou este é o máximo - confundida pela diferença de métricas entre o teste e a amostra do exame.

Agitar dentro do trem ou teste é possível, mas não faz sentido, e entre o trem e o teste não faz. Misturou-os lá por acaso, algo muito bom para teste com exame.

A diferença é que o mercado nem sempre é o mesmo, mas ele muda. O principal é o lucro médio).