L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 646

 
Dr. Trader:

Vous avez le choix entre 2 types -
1=baisse moyenne de la précision (c'est probablement ce qu'est mda, correspond aux premières lettres)
2=diminution moyenne de l'impureté du nœud

et il existe également des paquets spéciaux VSURF, VarSelRF, Boruta.

 
Ivan Negreshniy:

Il existe également des paquets spéciaux VSURF, VarSelRF, Boruta.

lequel est le meilleur ? )

 
Maxim Dmitrievsky:

lequel est le meilleur ? )

Ce n'est donc qu'une petite partie de R qui travaille sur les forêts aléatoires, Boruta semble être pour Python aussi.

Les meilleurs, IMHO, sont ceux qui ont plus de variations mais moins de tracas pour l'utilisateur. Le meilleur est en automatique, analyser le modèle et regarder tous ceux qui conviennent).

 
Ivan Negreshniy:

Il ne s'agit donc que d'une petite partie de R qui fonctionne sur un échafaudage aléatoire, Boruta semble être disponible pour Python également.

Je pense qu'il y a plus de variations mais moins d'ennuis pour l'utilisateur et la meilleure chose à faire est d'analyser le modèle et d'examiner tous les éléments appropriés).

Je pensais réécrire quelque chose de l'échafaudage ficaimortans pour MT5 afin de l'avoir sous la main.

Je ne l'ai toujours pas fait.

Je me fous de tous ces trucs de P, ça ne s'apprend pas en une vie... :) et vous ne pouvez pas tous les utiliser
 
Maxim Dmitrievsky:

Je pensais réécrire quelque chose de l'échafaudage pour MT5 afin de l'avoir sous la main.

Je n'arrive toujours pas à l'atteindre.

se foutre de tous ces trucs de P, ça ne s'apprend pas en une vie... :) de plus, vous ne pouvez pas les utiliser tous

Si vous essayez de le faire vous-même, vous devriez commencer par le classique fishimportance de Breyman - réarranger un par un les futurs dans l'ensemble d'entraînement et calculer leur pertinence par la variation de MSE dans OOB ou l'indice de Gini dans les divisions d'arbre.

Il est censé fonctionner pour les séries temporelles, de sorte que vous pouvez supprimer le nombre nécessaire d'éléments moins significatifs et réduire à la même dimensionnalité les modèles de longueur différente.
Random forest - Wikipedia
Random forest - Wikipedia
  • en.wikipedia.org
Random forests or random decision forests[1][2] are an ensemble learning method for classification, regression and other tasks, that operate by constructing a multitude of decision trees at training time and outputting the class that is the mode of the classes (classification) or mean prediction (regression) of the individual trees. Random...
 
Ivan Negreshniy:

Si vous voulez l'écrire vous-même, vous devriez commencer par la classique ficcimportance de Breymann - vous réarrangez les futurs de l'ensemble d'entraînement un par un et calculez leur importance en modifiant l'EQM dans l'OOB ou l'indice de Gini dans les divisions d'arbres.

Dans l'idée, cela devrait fonctionner pour les séries temporelles, de sorte que vous pouvez supprimer le nombre nécessaire d'éléments moins significatifs et réduire à la même dimensionnalité des modèles différents en étendue.

Oui, je veux Gini pour commencer.

et en général l'échafaudage est plus facile à utiliser, même optimisation

 
À mon avis, le prix augmente plus lentement qu'il ne baisse. C'est-à-dire que les images à retenir seraient différentes. Mais cela ne prendra probablement pas beaucoup de temps pour essayer de comparer.
 
elibrarius:
Je pense que le prix monte plus lentement qu'il ne descend. C'est-à-dire qu'il y aura différentes images à retenir. Mais cela ne prendra probablement pas beaucoup de temps pour essayer de comparer.

c'est la même chose en forex :) il y a 2 monnaies

je me demande s'il n'y a pas des exemples qui s'excluent mutuellement... en fait il ne devrait pas y en avoir beaucoup

 
Maxim Dmitrievsky:

c'est la même chose en forex :) il y a 2 monnaies

Je me demande s'il existe des exemples mutuellement exclusifs... en fait, il ne devrait pas y en avoir beaucoup...

Donc c'est bien. Que N soit la classe 1, et M la classe 2, et que les classes se chevauchent, ce qui, à mon avis, devrait être le cas.

Les probabilités sont alors Pn=n/N et Pm=m/M. Si la probabilité est > 0,5, alors le DM peut s'en occuper tout seul. D'après notre expérience, le chevauchement est de l'ordre de 20 à 40 %, c'est-à-dire que 20 à 40 % des transactions seront incorrectes.

 
Yuriy Asaulenko:

Donc c'est bien. Que N soit la classe 1, et M la classe 2, et que les classes se chevauchent, ce qui, à mon avis, devrait être le cas.

Les probabilités sont alors Pn=n/N et Pm=m/M. Si la probabilité est > 0,5, alors le DM peut s'en occuper tout seul. Le chevauchement de l'expérience est d'environ 20 à 40 %, c'est-à-dire que 20 à 40 % des transactions seront fausses.

En gros, oui, on ne peut pas gâcher le beurre, et il y a moins de surentraînement. Et dans ces petites choses apparentes, se trouve peut-être la clé de l'efficacité.

sauf que je n'ai pas de cours, j'ai une régression.

et aussi il est possible de transformer la série initiale (affine, par exemple) et d'ajouter ses incréments (je comprends, c'est à cela que sert monte carlo, non ?)

Quoi qu'il en soit, j'aime déjà ce que je fais, il me reste 3 semaines avant ma ligne d'arrivée avec NS :))) soit un graal, soit l'enfer avec ça. Faites vos jeux :))))