Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1330

 
Aleksey Vyazmikin:

Estou mais intrigado com outra pergunta - por que os gráficos são muito parecidos em diferentes modelos em diferentes amostras, parece que os modelos conseguem pegar algum padrão óbvio, que aparece com frequência e em diferentes tamanhos de amostra (pelo menos esta peça está constantemente na janela), e é este padrão que o modelo explora.

Concluí por mim mesmo que é bem possível alocar 30% a 70% da amostra de todos os dados para um gráfico de validação em busca de padrões interessantes, mas parece que 30% ainda é o ideal.

talvez porque você tem o mesmo modelo, mas com uma semente diferente? ))

Se o modelo for randomizado, isso não significa que o valor inicial do gerador irá afetar fortemente o resultado.

Os modelos normais quase não mudam, é completamente aleatório. É só uma verificação de robustez.

Todas estas conclusões poderiam ter sido tiradas sem fazer nada, sem experiências, mas puramente da teoria.

30\70 são resultados puramente aleatórios. A conclusão de que entre 30 e 70 está assimmptoticamente perto de 50. Aconteceu que era uma subamostra.

 
Maxim Dmitrievsky:

Talvez porque você tem o mesmo modelo, mas com uma semente diferente? ))

Se o modelo for randomizado, isso não significa que o valor inicial do gerador irá afetar fortemente o resultado.

Os modelos normais quase não mudam, é completamente aleatório. É só uma verificação de robustez.

Todas estas conclusões poderiam ter sido tiradas sem fazer nada, sem experiências, mas puramente da teoria.

Se você olhar com cuidado, você pode ver que os resultados financeiros dos modelos em uma amostra podem variar muito - de 5000 a 1500, ou seja, significativamente, o que significa que a Semente tem um impacto sobre os modelos. Assumo que são os modelos seleccionados que são semelhantes (vou verificar), e têm margens de lucro ligeiramente diferentes, mas quase todos os modelos são planos no meio, o que é surpreendente - estão enganados nas mesmas margens (anomalia nos novos dados?).

Não entendo a afirmação "modelos normais dificilmente mudarão, modelos totalmente aleatórios mudarão" - a segunda parte da afirmação contradiz a primeira.

Maxim Dmitrievsky:

30\70 são resultados puramente aleatórios. A conclusão de que entre 30 e 70 está assimmptoticamente perto de 50. É só uma subamostra.

Esse é o ponto - aleatório ou não, ou seja, depende do conteúdo da amostra nesta seção ou do volume de dados nas amostras, isso é o que precisamos entender, o que tem mais influência.

 
Aleksey Vyazmikin:

Se você olhar com cuidado, você pode ver que os resultados financeiros dos modelos na mesma amostra podem ser muito diferentes - de 5000 a 1500, ou seja, significativamente, o que significa que a Semente afeta os modelos. Assumo que são os modelos seleccionados que são semelhantes (vou verificar), e têm margens de lucro ligeiramente diferentes, mas quase todos os modelos são planos no meio, o que é surpreendente - estão enganados nas mesmas margens (anomalia nos novos dados?).

Não entendo a afirmação "modelos normais dificilmente mudarão, modelos absolutamente aleatórios mudarão" - a segunda parte da afirmação contradiz a primeira.

Esse é o ponto - aleatório ou não, ou seja, depende do conteúdo da amostra naquele gráfico ou da quantidade de dados nas amostras, isso é o que precisa ser entendido, o que tem mais impacto.

Os modelos com baixo erro, ou seja, modelos qualitativos, não são afetados pela mudança de semente. Se você tiver um valor Random em torno de 0,5 você terá muitos modelos diferentes porque você vai alimentar em excesso para cada espirro de aleatoriedade.

 
Maxim Dmitrievsky:

modelos com baixo erro, ou seja, modelos de qualidade, não são afetados pelas mudanças de sementes. Se o Random está por volta de 0,5 então você terá muitos modelos diferentes, porque o excesso de roupa para cada espirro de Random

Isto é provavelmente verdade para 99% de Precisão, enquanto o meu Recall é baixo - 20% para uma boa medida, ou seja, potencialmente a maioria dos 1's não são detectados e não há entradas, por isso espera-se que modelos diferentes funcionem dentro do intervalo 0-100 com janela de 20%.

 
Aleksey Vyazmikin:

Isto é provavelmente relevante a 99% de Precisão, mas a minha Recall é baixa - 20% para uma boa medida, ou seja, potencialmente a maioria dos 1's não são detectados e não são feitas entradas, por isso espera-se que modelos diferentes funcionem entre 0 e 100 com uma janela de 20%.

este não é o caminho a seguir, você deve reduzir o erro geral do modelo e não reinventar a roda

então todos os tipos de abordagens estranhas cairão sozinhas.

Escrevi 50 vezes - não há necessidade de reinventar a roda, este caminho não leva a lado nenhum.
 
Maxim Dmitrievsky:

este não é o caminho a seguir, você tem que reduzir o erro geral do modelo e não inventar uma bicicleta

então todas estas abordagens estranhas vão cair por si mesmas.

Eu disse-te 50 vezes - não há necessidade de reinventar a roda, este caminho não leva a lado nenhum.

Estou ouvindo atentamente, o que mais você pode usar para reduzir o erro?

Eu altero a composição da amostra para estes fins, altero as configurações de criação do modelo - o que mais posso fazer?

 

Qualquer pessoa que se pergunte como a semente afeta os modelos - pegue uma amostra de 30%, todos os modelos - clique na animação


 
Maxim Dmitrievsky:

este não é o caminho a seguir, você deve reduzir o erro geral do modelo e não reinventar a roda

então todos os tipos de abordagens estranhas cairão sozinhas.

Escrevi 50 vezes - não há necessidade de reinventar a roda, este caminho não leva a lado nenhum.
Eu discordo. Se os métodos padrão de IO funcionassem no mercado, todos ganhariam dinheiro com eles.
Aleksey Vyazmikin:

Mas tem de se inventar bicicletas durante o dia. E dormir à noite. Salve a sua saúde.
 
Elibrarius:
Eu discordo. Se os métodos padrão de IO funcionassem no mercado, todos ganhariam dinheiro com eles.
Mas a maquilhagem das bicicletas deve ser feita durante o dia. E dormir à noite. Salve a sua saúde.

O problema não é com os métodos padrão, mas com uma falta de compreensão básica do que você está tentando fazer com eles e com que processo você está trabalhando

ou seja, falta de educação tanto económica como matemática.

por isso é como uma partícula Browniana a vaguear por aí... talvez por aqui ou por ali...

E todos se recusam a ler livros "complicados", especialmente em inglês.

 
Maxim Dmitrievsky:

O problema não é com os métodos padrão, mas com um mal-entendido básico do que você está tentando fazer com eles.

um exemplo de estupidez é a saída em ziguezague.

A máquina nuclear da Reshetov é a mesma bicicleta que alguns aqui usam. E parece ser mais bem sucedido em lidar com o mercado do que algo padrão.

Então eu sou a favor das bicicletas! ) Mas é claro, você precisa entender o que fazer com eles também.