Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 582

 
Grigoriy Chaunin:

Aprendi que a aprendizagem de máquinas usa algo como a construção de recursos. Não se pode ir longe só no preço. O atributo no nosso caso é uma função do preço. A questão é quais as funções a utilizar. A simples passagem por indicadores com parâmetros diferentes não é uma opção. Estou interessado em materiais sobre este assunto. O Google normalmente produz muito lixo, ou melhor, não dá nada sobre o assunto. Eu procurei no Runet. Talvez alguém conheça os materiais sobre o assunto.

PS. Você tem que começar do início. É quando você aprendeu a construir sinais não ao acaso, você pode passar para a seleção deles.

Olha para isto, isto, isto e talvez isto.

Boa sorte e leia mais.

 
Maxim Dmitrievsky:

Maxim, você lê atentamente os posts doVizard_? Este tipo faz coisas de génio - olha para o meu fio condutor.

 
Vladimir Perervenko:
Devias ver isto, isto, isto e talvez isto.

Boa sorte e leia mais.


Li tudo, o problema é que o significado das características varia muito de amostra para amostra, e todas estas manipulações são boas para análise estatística e não para negociação real.

apenas uma simples otimização, em outras palavras.

Desculpe :D

 
Alexander_K2:

Maxim, você lê atentamente os posts doVizard_? Este tipo faz coisas de génio - olha para o meu fio condutor.


Sim, mas ele é tão excelente que não me consigo fartar dele nesta fase :) + ele escreveu que é impossível ganhar mais de 20% por ano... Acho que você deve sempre começar com essas declarações e depois entrar em detalhes :)

 
Vladimir Perervenko:
isto, isto, isto e talvez isto.

Boa sorte e leia mais.


Percebi que não conseguia encontrar uma resposta para a minha pergunta. Onde eu consegui ler, dizem que é uma arte. O problema é que existem muitos indicadores e ainda mais parâmetros que podem ser definidos. Devo tentar todas as combinações possíveis usando o método de busca? Não sei como o fazer. Não sei como fazê-lo. Você ainda precisa criar regras de seleção inicial e depois disso deve trabalhar com indicadores selecionados por método de seleção de característica.

 
Maxim Dmitrievsky:

Eu li tudo, o problema é que a importância das características varia muito de amostra para amostra,

Tens a certeza que os sinais sequer existem? Ou, por exemplo, pode haver muitas outras. Naturalmente, neste caso, você não será capaz de pegá-los com uma busca e combinações, e a única maneira é o sistema determiná-los por si só. Nesta perspectiva, procurar certos preditores e suas combinações parece um negócio louco (bem, sempre os encontraremos com sucesso na história, é claro).

Vejo apenas um caminho a seguir aqui - o sistema tem de identificar este conjunto de atributos por si só durante o treino, e não para si, mas para si próprio. E a nossa tarefa é apenas preparar os dados para o treino. A única tarefa de tal preparação é informar ao sistema alguns dados a priori, reduzindo assim o campo de aplicabilidade do sistema. Ou, em outras palavras, para cortar os intervalos onde as transações são claramente inadequadas.

Devemos apenas afirmar claramente o problema, mas não tentar resolvê-lo para o sistema. Imho, é demasiado complicado até tentar resolvê-lo pela força bruta.

 
SanSanych Fomenko:

Gostaria de salientar que a ada dá melhores resultados do que a rf: tanto mais precisa quanto menos propensa a supertreinamento. E tu devias usar a Ada, não a Rf.

Então não é só uma questão de empilhar as coisas.

O GARCH é demasiado complicado. Até agora tenho feito o meu caminho através da ARIMA, e também da GARCH e da distribuição.

SanSanych nos levou para as densas florestas aleatórias e nos deixou lá, e agora diz que não havia nenhuma necessidade de ir para a floresta. Bem, tal como a Susanin.

E eu estava prestes a fazê-los).

 
Yuriy Asaulenko:

Tens a certeza que os sinais sequer existem? Ou, por exemplo, pode haver muitas outras. Naturalmente, neste caso, você não será capaz de pegá-los com uma busca e combinações, e a única maneira é o sistema determiná-los por si só. Nesta perspectiva, procurar certos preditores e suas combinações parece um negócio louco (bem, sempre os encontraremos com sucesso na história, é claro).

Vejo apenas um caminho a seguir aqui - o sistema tem de identificar este conjunto de atributos por si só durante o treino, e não para si, mas para si próprio. E a nossa tarefa é apenas preparar os dados para o treino. A única tarefa de tal preparação é informar ao sistema alguns dados a priori, reduzindo assim o campo de aplicabilidade do sistema. Ou, em outras palavras, para cortar os intervalos onde as transações são claramente inadequadas.

Devemos apenas afirmar claramente o problema, mas não tentar resolvê-lo para o sistema. Imho, lá é demasiado complicado até para tentar resolvê-lo pela força bruta.

Eu nunca tenho a certeza de nada :)

OK, digamos que a principal característica é o próprio preço. Nossa tarefa (digamos, classificação) é encontrar tal combinação de compra/venda, que seria estável na história e daria lucro, certo? e o correspondente a esses negócios de volta na forma de algum padrão. Ao mesmo tempo, você, por exemplo, usa um determinado conjunto de funcionalidades (cerca de 20). E como você faz o próprio sistema selecionar esses atributos?

Em essência, esta é uma simples tarefa de optimização, sem qualquer hipótese de "inteligência artificial". Eu tenho muitas versões de tais sistemas, terminei a última ontem. O resultado é o mesmo - desempenho instável fora da amostra, e a capacidade de alcançar quase 100% de precisão na aprendizagem, e qualquer precisão (à escolha), mas a precisão reduzida não indica menos sobretreinamento. E você não precisa usar R e modelos abstrusos complexos, o resultado será exatamente o mesmo.

 
Maxim Dmitrievsky:

Sim, mas é tão superior que não vou arrastá-lo para dentro nesta fase :) + ele escreveu que é impossível ganhar mais de 20% por ano... Acho que você deve sempre começar com tais afirmações e depois ir mais fundo nos detalhes :)

Eu não sei. Eu fiz 20% em 2,5 dias. E fi-lo em dois negócios perdidos.
 
Maxim Dmitrievsky:

Eu nunca tenho a certeza de nada :)

OK, digamos que o principal atributo é o próprio preço. A nossa tarefa (digamos classificações) é encontrar uma tal combinação de compra/venda, que seja estável na história e dê lucro, certo? Ao mesmo tempo, você, por exemplo, usa um determinado conjunto de funcionalidades (cerca de 20). Qual é a razão para isso? E como você faz o sistema selecionar esses atributos?

De onde tiraste isso? De onde você tirou isso?

Eu não uso sinais para o sistema. Eu só uso sinais para cortar áreas da série temporal (e do treinamento e do funcionamento), onde não há necessidade de analisar absolutamente nada.

O próprio NS mastiga a série cronológica diretamente.

Eu já escrevi e até citei um livro -NS faz tarefas altamente especializadas em combinação com os métodos habituais.