Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2427

 
Aleksey Vyazmikin:

Bem, já que estou fazendo um script para preparar os dados, ainda preciso fazer um arquivo listando as colunas excluídas, que incluem:

1. Colunas com preditores correlacionados (a propósito, como escolher qual coluna cair, digamos 5 preditores correlacionados?).

2. Colunas descartadas da primeira tabela de arquivos, exceto a coluna com o alvo.

Além disso, a coluna com a etiqueta de destino deve ser escrita no arquivo, de preferência pesquisada pelo nome da coluna.

A estrutura do arquivo é a seguinte

Que isto se torne o teu trabalho de casa)...
O código tem tudo para isto.
Para perguntas, há o site stackowerflow e outros ...
Não tortures o velhote))
 
Aleksey Vyazmikin:

Preciso de seleccionar os preditores certos em menos tempo. Passar novamente pelos preditores é aumentar o tempo de processamento em cem vezes. O meu método baseia-se na lógica de que um bom preditor (incluindo um adequado para um determinado método de aprendizagem) será exigido pelo modelo em todos os intervalos da amostra, o que elimina o ajuste à área da amostra.

Para o termos em tudo, precisamos de o validar transversalmente. E você só verifica por teste ou exame.
Se você cruzar validar a 10% de uma amostra, você tem que treinar 10 vezes, e não centenas. E se fizeres 20%, tens de o ensinar 5 vezes.

 
elibrarius:

É preciso cruzar com a validação para poder fazer tudo isso. E você só verifica com um teste ou um exame.
Se você cruzar validar a 10% da amostra, você precisa treinar 10 vezes, e não centenas. E se 20%, então 5 vezes.

Divido a amostra em 8 secções e construo 100 modelos diferentes para cada secção, depois analiso os modelos e vejo quais os preditores que eram procurados - o que significa que foram utilizados para encontrar um padrão, faço uma média do valor estimado, e depois utilizo os restantes preditores para treinar toda a amostra. A lógica por detrás disto é que uma vez encontrados padrões destes preditores numa determinada área, então o modelo será capaz de generalizar a estes preditores de forma uniforme em toda a amostra, em vez de se ajustar a áreas da amostra como é normalmente o caso.

O seu método constrói o modelo em pequena parte da amostra, os modelos serão construídos de forma diferente em cada parte da amostra, porque serão selecionados os melhores preditores que se ajustam a determinada área de treinamento, e considerando o fato de que a amostra não é perfeita (representativa), podemos dizer que desta forma investiga apenas parte da informação disponível que pode ou não se repetir no futuro, o meu método permitirá aprender mais informações sobre o mercado e o sobretreinamento será menor. Além disso, se no CatBoost não se fixar a tabela quântica, então cada vez em geral o treinamento será sobre diferentes preditores devido a diferentes construções de tabelas quânticas para o local de concreto da amostra.

 
mytarmailS:

agora a resposta à primeira pergunta

Eu não sei o que está errado - jura.

Error in get.findCorrelation(data = df1, not.used.colums = c("Target_100_Buy",  : 
  could not find function "get.findCorrelation"
 
Aleksey Vyazmikin:

Eu não sei o que está errado - jura.

Executar o código para criar uma função, depois a própria função
 
mytarmailS:
Execute o código de criação da função e depois a própria função

Está a funcionar, obrigado.

mytarmailS:
Que seja o teu trabalho de casa)...
O código tem tudo para isso...
Há stackowerflow e outros locais para perguntas...
Não tortures um homem velho))

Eu só poderia usar exemplos concretos para descobrir isso, senão é melhor resolver o problema na MQL.

 
O tópico mais místico do fórum agora com comunicação telepática.
Afinal, eles treinaram a máquina - a máquina deu-lhes superpoderes.


 
Account_:
O tópico do fórum mais místico agora com comunicação telepática.
Afinal, eles treinaram a máquina - a máquina deu-lhes superpoderes.


Sim, eu pensei que estava a imaginar coisas :-) Bem, isso foi uma boa conversa, e o mais importante informativo :-)
 
Ninguém admitiu que tipo de máquina está a ser ensinada aqui ou o que
 
Vladimir Baskakov:
Ninguém admitiu que tipo de máquina está sendo ensinada aqui e o que

Também me pergunto porque é que cada espantalho que vende a sua maldita máquina de calcular a média pensa que é seu dever promover-se neste fio, é uma iniciação ou não? ))