Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3281
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
correlações cruzadas não normalizadas )
covariância cruzada.Bem, você precisa de Pearson.
Bem, você precisa da Pearson.
Não tenho certeza de como fazer isso e estou com sono.
Algo semelhante.
Não tenho certeza de como fazer isso e estou com sono.
algo semelhante
Sim, não é isso.
Certo, errado.
É quase algo, procure, estou indo.
Tentando encontrar rapidamente cadeias curtas semelhantes em uma cadeia longa.
Essa implementação via Alglib leva mais de seis segundos para procurar strings curtas semelhantes (300) na milionésima string.
Eu o acelerei.
Resultado.
Agora em 300 milissegundos.
Agora em 300 milissegundos.
Quando nenhuma matriz consegue fazer isso.
São necessários três segundos para encontrar cadeias de 30K semelhantes em uma cadeia de 10M.
Quando nenhuma matriz consegue lidar com isso.
São necessários três segundos para encontrar cadeias de 30K semelhantes em uma cadeia de 10M.
300/1M não é fft, 30K/10M é fft.
Quando nenhuma matriz consegue lidar com isso.
São necessários três segundos para encontrar cadeias de caracteres semelhantes de comprimento 30K em uma cadeia de 10M.
Resultado impressionante!
Peguei uma amostra de 2010 a 2023 (47 mil linhas), dividi-a em três partes em ordem cronológica e decidi ver o que aconteceria se trocássemos essas partes.
O tamanho das subamostras é treinamento - 60%, teste - 20% e exame - 20%.
Fiz essas combinações (-1) - essa é a ordem padrão - cronológica. Cada subamostra tem sua própria cor.
Treinei 101 modelos com Seed diferente para cada conjunto de amostras e obtive o seguinte resultado
Todas as métricas são padrão, e pode-se observar que é difícil determinar o lucro médio dos modelos (AVR Profit), bem como a porcentagem de modelos cujo lucro excede 3.000 pontos na última amostra que não participou do treinamento.
Talvez a taxa de sucesso relativa das variantes -1 e 0 no tamanho da amostra de treinamento deva ser reduzida? Em geral, parece que o Recall reage a isso.
Em sua opinião, os resultados de tais combinações devem ser comparáveis entre si em nosso caso? Ou os dados estão irremediavelmente desatualizados?