L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2553

 
Dmytryi Nazarchuk #:
Régression logistique
La régression de type forêt/bush est plus précise.
 
elibrarius #:

Non, c'est une base de données d'histoire mémorisée...

C'était une question rhétorique :))

 
mytarmailS #:

C'était une question rhétorique :))))

Que vous êtes sur le sujet, je sais))
C'est pour les nouveaux venus au MO. S'ils viennent ici.

 
Vladimir Perervenko #:

Il existe trois options pour traiter les échantillons de bruit : supprimer, re-partitionner (corriger le balisage) et séparer les échantillons de bruit dans une classe distincte. D'après mon expérience, environ 25% de l'échantillon est du "bruit". L'amélioration de la qualité est d'environ 5%, elle dépend des modèles et de la préparation des données. Je l'applique de temps en temps.

L'utilisation de prédicteurs pose un autre problème : leur dérive. Et ce problème doit être identifié et pris en compte à la fois dans les essais et dans l'exploitation. La traduction ci-jointe de l'article (cherchez-en d'autres sur le net) et il y a un paquet de dériveurs. Ce n'est pas le seul. Mais le fait est que, lors de la sélection des prédicteurs, vous devez tenir compte non seulement de leur importance mais aussi de leur dérive. Pour les produits à forte dérive, éliminez-les ou transformez-les, pour les produits à faible dérive, tenez-en compte (apportez des corrections) lors des essais et du travail.

Bonne chance

Que voulez-vous dire par "appliquer occasionnellement" ?

Soit il existe une sorte de pipelining qui a fait ses preuves, soit ce ne sont que des spéculations inutiles.

Faire du bruit une classe séparée n'améliore théoriquement pas le modèle (il reste dans le modèle et ne va nulle part).

sur la dérive - c'est l'essentiel, le compromis biais-variance.
 
Maxim Dmitrievsky #:
Avez-vous essayé de prédire la distribution des futures citations ?
 
mytarmailS #:
Avez-vous essayé de prédire la distribution des futures cotations ?

J'ai déjà fait quelque chose comme ça, mais je ne comprends pas de quoi il s'agit.

Rappelez-vous, j'ai regroupé les futurs morceaux de longueur fixe et j'ai prédit le nombre de groupes. Chaque groupe a une distribution différente, chacun a une stratégie différente pour chacun. Ça a marché sur Traine, ça échoue sur les nouvelles données si on le fait de front.
 
Maxim Dmitrievsky #:

a fait quelque chose comme ça, mais n'a pas compris de quoi il s'agissait.

Rappelez-vous, j'ai regroupé les futurs morceaux de longueur fixe et j'ai prédit le numéro du groupe. Chaque cluster a sa propre distribution, chacun a sa propre stratégie. Ça a marché sur Trayne, mais ça échoue sur les nouvelles données, si on le fait directement.

Je me souviens...

J'ai une idée légèrement différente...

Si vous pouvez prévoir qualitativement la distribution des futures cotations, disons pour 50 bougies à venir, alors à partir de cette distribution vous pouvez tirer plusieurs milliers de séries et entraîner le modèle, et de cette façon le modèle fonctionnera adéquatement pour les 50 nouvelles bougies en théorie...

 
Je consulte ce fil de temps en temps, les mêmes visages, les mêmes discussions sur les modèles, peut-être que quelqu'un a quelque chose à montrer ?
 
Farkhat Guzairov #:
Je visite périodiquement le sujet, les visages sont les mêmes, la discussion des modèles est la même, peut-être que quelqu'un a quelque chose à montrer ?
Ce n'est pas un problème à résoudre