Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2846

 
Andrey Dik #:
É claro que existe alguma fórmula, talvez até secreta, mas se fosse possível atribuir pesos aos componentes do critério complexo.... mmm, fabuloso.

A julgar pela descrição, pode-se entender que primeiro uma parte das melhores passagens por um critério é selecionada, depois, dentre as selecionadas, uma parte das melhores passagens pelo segundo critério é selecionada, e assim por diante.

"Ele permite que você selecione as melhores passagens passo a passo: primeiro pelo número de negociações, depois, a partir dessa amostra, pela expectativa de lucratividade, depois pelo fator de recuperação, e assim por diante."

 
Aleksey Nikolayev #:

A julgar pela descrição, pode-se entender que primeiro uma parte das melhores passagens é selecionada de acordo com um critério, depois, dentre as selecionadas, é selecionada uma parte das melhores passagens de acordo com o segundo critério, e assim por diante.

"Ele permite que você selecione as melhores passagens passo a passo: primeiro pelo número de negociações, depois, a partir dessa amostra, pela expectativa de lucratividade da matriz, depois pelo fator de recuperação e assim por diante."

o critério é calculado de uma vez, em cada passagem da otimização, e não no final da otimização, levando em conta todos os resultados de cada passagem separadamente. é por isso que há uma inconsistência entre o fato e a descrição na ajuda.
 
Maxim Dmitrievsky #:

Não vi imediatamente nenhuma diferença ou vantagem

Uma nova maneira de gerar dados tabulares. Ela é muito melhor? Ou o GMM ainda está fora da competição?

https://github.com/kathrinse/be_great

 
Evgeni Gavrilovi #:

Uma nova maneira de gerar dados tabulares. Ela é muito melhor? Ou o GMM ainda está fora da competição?

https://github.com/kathrinse/be_great

Não sei, não analiso dados tabulares
Não é bom para séries temporais
Algum T-gan provavelmente seria melhor

⚙️ Redes adversárias ger adoras de transformadores de séries temporais


Github: https://github.com/jsyoon0823/TimeGAN


Artigo: https://arxiv.org/abs/2205.11164v1


Dados de ações: https://finance.yahoo.com/quote/GOOG/history


Dados de energia: http://archive.ics.uci.edu/ml/datasets/Appliances+energy+prediction



@ai_machinelearning_big_data


 
Maxim Dmitrievsky #:
Alguns T-gan provavelmente seriam melhores

E como você verifica a plausibilidade? Comparando as distribuições dos dados reais e sintéticos separadamente para cada série?

 
Evgeni Gavrilovi #:

Como você verifica a probabilidade? Comparando as distribuições dos dados reais e sintéticos separadamente para cada série?

Já vi uma comparação visual via PCA em algum lugar, mas não me lembro de imediato. Talvez mais tarde.
 
Evgeni Gavrilovi #:

Como você verifica a probabilidade? Compare as distribuições dos dados reais e sintéticos separadamente para cada série?

https://hackernoon.com/a-gan-approach-to-synthetic-time-series-data-pe2r33fd

A GAN approach To Synthetic Time-Series Data | HackerNoon
A GAN approach To Synthetic Time-Series Data | HackerNoon
  • hackernoon.com
Although sequential data is pretty common to be found and highly useful, there are many reasons that lead to not leverage it
 

Que preditores podem ser inventados para histogramas?

Eu os anexei como arquivos, pois as imagens não querem ser inseridas - provavelmente outro bug.

Arquivos anexados:
 
Aleksey Vyazmikin #:

Que preditores podemos criar para histogramas?

)))))))
Qual é a diferença entre um histograma e pontos? Tenho vergonha de perguntar, além da visualização
 
mytarmailS #:
)))))))
Qual é a diferença entre um histograma e pontos? Tenho vergonha de perguntar, além da visualização

Você pode visualizar qualquer forma com pontos. A visualização é necessária para estimular o pensamento abstrato, que estimula a geração de ideias.

De fato, no histograma há um preditor binário da amostra, as barras vermelhas significam que o sinal desapareceu (zero), e sua altura significa por quanto tempo não houve sinal "1" na amostra.

Presumo que o caráter diferente da distribuição de frequência da ocorrência do sinal na amostra possa servir para classificar o uso posterior desse preditor no treinamento. Dessa forma, o preditor pode ser excluído ou recomendado para uso somente para a construção de divisões de raiz superior.

É por isso que os preditores são necessários para descrever histogramas. Sim, também podemos criar preditores para o equilíbrio TP+FP - as ideias para sua descrição também são interessantes, exceto as já conhecidas.