Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 646

 
Dr. Trader:

Há 2 tipos à escolha -
1=mínimo decréscimo na precisão (é provavelmente o que é mda, corresponder às primeiras letras)
2=mínimo decréscimo na impureza do nó

e também há pacotes especiais VSURF, VarSelRF, Boruta.

 
Ivan Negreshniy:

Há também pacotes especiais VSURF, VarSelRF, Boruta.

Qual deles é melhor? )

 
Maxim Dmitrievsky:

Qual deles é melhor? )

Então esta é apenas uma pequena parte do R que trabalha em florestas aleatórias, Boruta parece ser também para Python.

Os melhores, IMHO, são os que têm mais variações mas menos incómodos para o utilizador. O melhor é em automático, analisar o modelo e procurar em todos os adequados).

 
Ivan Negreshniy:

Então esta é apenas uma pequena parte de R que trabalha em andaimes aleatórios, Boruta parece estar disponível também para Python.

Eu acho que há mais variação, mas menos incômodo para o usuário e o melhor é analisar o modelo e olhar através de todos os adequados)

Estava a pensar em reescrever algo do andaime ficaimortans para o MT5 ter em mãos

Ainda não cheguei a esse ponto.

Não quero saber dessas coisas todas da P, não se pode aprender numa vida... :) e você não pode usá-los todos
 
Maxim Dmitrievsky:

Estava a pensar em reescrever algumas das características do andaime para o MT5 ter em mãos

Ainda não consegui chegar lá.

não te importas nada com todas estas coisas da P, não podes aprender numa vida... :) além disso, você não pode usá-los todos

Se você mesmo tentar fazer isso, você deve começar com o clássico Breyman's fishimportance - um por um reordenar futuros em conjunto de treinamento e calcular sua relevância através da mudança de MSE em OOB ou índice de Gini em tree splits.

É suposto funcionar para séries cronológicas, para que se possa eliminar o número necessário de elementos menos significativos e reduzir para a mesma dimensionalidade os padrões diferentes em comprimento.
Random forest - Wikipedia
Random forest - Wikipedia
  • en.wikipedia.org
Random forests or random decision forests[1][2] are an ensemble learning method for classification, regression and other tasks, that operate by constructing a multitude of decision trees at training time and outputting the class that is the mode of the classes (classification) or mean prediction (regression) of the individual trees. Random...
 
Ivan Negreshniy:

Se você quiser escrever você mesmo, você deve começar com a clássica ficcimportância Breymann - você reorganiza os futuros no conjunto de treinamento um por um e calcula sua importância mudando o MSE no OOB ou o índice de Gini nas divisões de árvore.

Na idéia deve funcionar para séries cronológicas, para que você possa eliminar o número necessário de elementos menos significativos e reduzir para a mesma dimensionalidade padrões diferentes em extensão.

Sim, eu quero Gini para começar.

e em geral os andaimes são mais fáceis de usar, a mesma optimização

 
Na minha opinião, o preço está a subir mais lentamente do que a descer. Isto é, imagens diferentes para recordar seriam diferentes. Mas provavelmente não vai demorar muito a tentar comparar.
 
elibrarius:
Acho que o preço sobe mais devagar do que desce. Ou seja, haverá imagens diferentes para recordar. Mas provavelmente não vai demorar muito a tentar comparar.

é o mesmo em forex :) existem 2 moedas

Pergunto-me se não haverá alguns exemplos mutuamente exclusivos... na verdade, não deveria haver muitos

 
Maxim Dmitrievsky:

é o mesmo em forex :) existem 2 moedas

Estou me perguntando se existem exemplos mutuamente exclusivos... na verdade, não deveria haver muitos

Então está bem assim. Que N seja classe 1, e M seja classe 2, e que as classes se sobreponham, o que, imho, deveria ser o caso.

Então as probabilidades são Pn=n/N e Pm=m/M. Se probabilidade>0,5, então DM pode lidar com isso por si só. Na nossa experiência, a sobreposição está algures ao nível de 20-40%, ou seja, 20 a 40% das transacções serão incorrectas.

 
Yuriy Asaulenko:

Então está bem assim. Que N seja classe 1, e M seja classe 2, e que as classes se sobreponham, o que, imho, deveria ser o caso.

Então as probabilidades são Pn=n/N e Pm=m/M. Se probabilidade>0,5, então DM pode lidar com isso por si só. A sobreposição na experiência é de cerca de 20-40%, ou seja, entre 20 e 40% das negociações estarão erradas.

Bem essencialmente sim, não se pode estragar a manteiga, e há menos sobretreinamento. E em coisas tão aparentemente pequenas, pode ser a chave para a eficiência.

só que eu não tenho aulas, tenho regressão.

e também é possível transformar séries iniciais (affine, por exemplo) e adicionar seus incrementos (entendo, é para isto que serve monte carlo, certo?)

De qualquer forma, eu já gosto do que estou fazendo, faltam 3 semanas para a minha meta com NS :))) ou um graal ou para o inferno com isso. Faça as suas apostas :))))