Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 22

 
Eu próprio não estou contente com isso, é temporário. Se eu aprender a selecionar parâmetros indicadores, vou mudar de D1 para períodos menores e poderei obter muito mais observações no mesmo intervalo de tempo.
 
Olá a todos! Se alguém estiver interessado, vou falar-vos da minha pesquisa...

Quanto à ideia do aglomerado nada saiu, colando peças de um aglomerado não se observou homogeneidade, porque não sei...Acho que preciso estudar análise espectral com frequências, amplitudes e fases, acho que Fourier o fará, então se houver alguém que conheça o assunto, terei prazer em comunicar, não é assim! Procurando um professor!! Então, o assunto está mais lento até agora

====================================

A seguir, na pesquisa de RF.

Eu joguei com as configurações do modelo RF, ou seja, o número de splits e kol. Mas decidi re-treinar o mesmo modelo com os mesmos parâmetros, não tinha inteligência suficiente para salvar o primeiro modelo bom (então eu re-treinei o modelo e obtive um resultado muito médio, depois toda a noite re-treinei o modelo (cerca de 100 vezes) na esperança de encontrar os mesmos parâmetros, mas infelizmente, a maioria que consegui obter é um terço dos resultados do primeiro modelo

Questão: O que foi? o reaperfeiçoamento aleatório ou o modelo apanhou uma forte correlação nos dados, como se relacionar com ele em geral, na sua experiência?Estes parâmetros podem ser recuperados de alguma forma?

Todos os resultados que mencionei foram obtidos com novos dados não conhecidos anteriormente pelo modelo.

dados totais 55.000
treinamento em 35.000
cheque a 20 000
Dados futuros RTS, TF - 5 minutos
 
mytarmailS:

====================================

Mais informações sobre a pesquisa com RF .


Pergunta: o que foi isso tudo? foi um sobretreinamento aleatório ou o modelo pegou uma forte correlação nos dados, como deve ser tratado em sua experiência?É possível recuperar estes parâmetros de que forma?

Não só esqueça estes dados, mas quando algo como isto surgir, corra o mais longe possível.

PS.

Precisamos de limpar o conjunto inicial de preditores do ruído.

Dr.Trader tentou os componentes principais, mas ele tem muito poucas observações. Experimenta. Links acima, até mesmo o código é postado

 
SanSanych Fomenko:

Não só esqueça estes dados, mas quando algo como isto surgir, corra o mais longe possível.


Porquê? Argumenta.
 
mytarmailS:
Olá a todos! Se alguém estiver interessado, vou falar-vos da minha pesquisa...

Quanto à ideia do aglomerado nada saiu, colando peças de um aglomerado não se observou homogeneidade, porque não sei...Acho que preciso estudar análise espectral com frequências, amplitudes e fases, acho que Fourier o fará, então se houver alguém que conheça o assunto, terei prazer em comunicar, não é assim! Procurando um professor!! Então, o assunto está mais lento até agora

====================================

A seguir, na pesquisa de RF.

Eu joguei com as configurações do modelo RF, ou seja, o número de splits e kol. Mas decidi re-treinar o mesmo modelo com os mesmos parâmetros, não tinha inteligência suficiente para salvar o primeiro modelo bom (então eu re-treinei o modelo e obtive um resultado muito médio, depois toda a noite re-treinei o modelo (cerca de 100 vezes) na esperança de encontrar os mesmos parâmetros, mas infelizmente, a maioria que consegui obter é um terço dos resultados do primeiro modelo

Questão: O que foi? o reaperfeiçoamento aleatório ou o modelo apanhou uma forte correlação nos dados, como se relacionar com ele em geral, na sua experiência?Estes parâmetros podem ser recuperados de alguma forma?

Todos os resultados que mencionei foram obtidos com novos dados não conhecidos anteriormente pelo modelo.

dados totais 55.000
treinamento em 35.000
cheque a 20 000
Dados futuros RTS, TF - 5 minutos.

foi algum tipo de erro.

Para evitar isso, mantenha o registro da experiência em uma tabela: todos os parâmetros de treinamento, se houver seleção de entradas, então as melhores entradas, o resultado do treinamento, o resultado da validação. E tu vais ficar feliz.

 
mytarmailS:
Porquê? Argumenta.
Abaixo e discutido
 

Rapazes! Por favor, ajudem-nos com exemplos de código

Digamos que temos três vectores "A", "B"... , "С"

Precisamos de construir todo o tipo de diferenças entre elas automaticamente porque há tantas variáveis...

como:

x1 = A - B

x2 = A - C

x3 = C - B

e escreva x1,x2,x3 como colunas no quadro de dados

Mostre-me o código se puder

 
mytarmailS:

Rapazes! Por favor, ajudem-nos com exemplos de código

Digamos que temos três vectores "A", "B"... , "С"

Precisamos de construir todo o tipo de diferenças entre elas automaticamente porque há tantas variáveis...

como:

x1 = A - B

x2 = A - C

x3 = C - B

e escreva x1,x2,x3 como colunas no quadro de dados

Por favor, mostre o código se puder.

Uma variante de trabalho. Pode não ser o ideal:

sampleA <- as.data.frame(matrix(round(runif(n = 51000, min = 0, max = 1)), ncol = 51))


n <- ncol(sampleA) #your columns

differences <- list()
counter <- 1
for (i in 1:n){
        for (j in 1:n){
                differences[[counter]] <-       sampleA[, i] - sampleA[, j]
                counter <- counter + 1
        }
}

diff_data <- as.matrix(do.call(rbind.data.frame, differences))

diff_data_frame <- as.data.frame(t(diff_data))
 
Alexey Burnakov:

Opção de trabalho. Talvez não seja o ideal:

Muito obrigado, enquanto escrevia todas as combinações possíveis com três castiçais e quatro preços OHLC fiquei suado três vezes, tanto código
 
mytarmailS:
Muito obrigado, enquanto escrevia todas as combinações possíveis com três castiçais e 4 dos seus preços OHLC, suei três vezes, tanto código

Como posso fazer o código não fazer colunas extras? Por exemplo, 3 colunas em uma função produzem 9 combinações, embora três sejam suficientes, como no meu exemplo acima

não faz sentido fazer A/B e depois B/A