Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2426

 
mytarmailS:

Agora a resposta à primeira pergunta.

Obrigado!

Vou tentar perceber, mas é difícil perceber logo - a sintaxe do código é bem diferente do C++, no entanto.

 
elibrarius:

Não acha que está a afinar o seu modelo para a versão mais bem sucedida no teste?

Em que momento achas que estou a afinar para testar? Amostragem "teste" é usado para parar o treinamento, em Projetos, exceto um, ele não existe, então eu o usei no treinamento final - bem, você pode substituí-lo por um número fixo de árvores - 50/100/300/500/800 e ver o resultado em todas as amostras, então você acredita que vai obter resultados significativamente piores?

 
Aleksey Vyazmikin:

Obrigado!

Vou tentar perceber, mas é difícil perceber logo, porque a sintaxe do código é bem diferente da do C++.

Muitas funções desconhecidas porque a língua é de alto nível.
Mas o que você escreve em 300 linhas em C++ posso escrever em 3 linhas)

 
Aleksey Vyazmikin:

Em que altura é que eu me afino para testar, na sua opinião? A amostra "teste" é usada para parar o treinamento, em Projetos, exceto um, ele não está lá, então eu o usei no treinamento final - bem, você pode substituí-lo por um número fixo de árvores - 50/100/300/500/800 e ver o resultado em todas as amostras, então você acha que o resultado será muito pior?

Sim - parar o treinamento também é um teste de adaptação. Não conheço outros detalhes do seu sistema, não posso dizer mais nada.
Na validação cruzada todos os dados são um teste e todos eles também são trens. É só um de cada vez. Você só queria aumentar a trama da bandeja em 40%.
 
mytarmailS:
Muitas funções desconhecidas, porque a língua é de alto nível.
Mas o que você escreve em 300 linhas em c+++ eu posso escrever em 3 linhas ))

Não creio que todas as minhas perversões possam ser facilmente implementadas em R :)

 
elibrarius:
Sim - parar o treinamento também é um teste de ajuste. Não conheço outros detalhes do seu sistema, não posso dizer mais nada

Concordo que em teoria aumenta o resultado na amostra do exame, mas estou avaliando o resultado na amostra do exame!

Bem, acho que já tratei de todos os detalhes, se tiveres alguma pergunta, por favor pergunta.

elibrarius:
Na validação cruzada, todos os dados são um teste e todos eles são também um treino. É só um de cada vez. Você só queria aumentar a trama da bandeja em 40%.

Bem, qual é o seu propósito para usar a validação cruzada? Vejo seu ponto até o ponto de procurar hiperparâmetros do modelo, pois mostrará em média quais são as melhores configurações de todas as parcelas aleatórias.

 
Aleksey Vyazmikin:

Eu não acho que você pode facilmente implementar todas as minhas perversões em R :)

Ahahaha))))

Se eu conseguir perceber as minhas perversões, as tuas são como um descanso)

 
Aleksey Vyazmikin:

OK, qual é o propósito de usar a validação cruzada? Eu vejo o seu propósito até encontrar os hiperparâmetros do modelo, pois ele mostrará em média quais são os melhores de todos os cenários em parcelas aleatórias.

É exactamente para isso que é. Precisa de mais alguma coisa? E um conjunto específico de características. Com atributos diferentes, é provável que os hiperparâmetros sejam diferentes. Se você escolher aqueles com os melhores hiperparâmetros, você precisa trabalhar com eles.

Aleksey Vyazmikin:
Bem, eu acho que descrevi todos os detalhes, se você tiver alguma dúvida.

Eu sou demasiado preguiçoso para entrar em detalhes.

 
mytarmailS:

Ahahaha))))

Se eu posso implementar minhas próprias perversões, as suas são como um descanso)

Bem, aqui estou eu, desde que fiz um script para preparar os dados, ainda preciso fazer um arquivo listando as colunas excluídas, que incluem:

1. Colunas com preditores correlacionados (a propósito, como se escolhe qual coluna descartar, digamos 5 preditores correlacionados?).

2. Colunas descartadas da primeira tabela de arquivos, exceto a coluna com o alvo.

Além disso, a coluna com a etiqueta de destino deve ser escrita no arquivo, de preferência pesquisada pelo nome da coluna.

A estrutura do arquivo é

5336    Auxiliary
5337    Auxiliary
5338    Label
5339    Auxiliary
5340    Auxiliary
 
elibrarius:

É exactamente para isso que é. Precisa de mais alguma coisa? E um conjunto específico de características. Com atributos diferentes, é provável que os hiperparâmetros sejam diferentes. Os que você seleciona com os melhores hiperparâmetros são os que você precisa colocar para trabalhar.

Sou demasiado preguiçoso para me aprofundar demasiado.

Preciso de seleccionar os preditores certos em menos tempo. Passar novamente pelos preditores é aumentar o tempo de processamento em cem vezes. O meu método baseia-se na lógica de que um bom preditor (incluindo um adequado para um determinado método de aprendizagem) será exigido pelo modelo em todos os intervalos de amostragem, o que exclui o ajuste à área de amostragem.