L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1437

 

a pris beaucoup de temps à comprendre, mais ça y ressemble. La forêt d'Alglib est sujette au sur-apprentissage à mesure que la taille de l'échantillon augmente, car il s'agit d'une frénésie sans fin. Ainsi, avec un échantillon de taille modérée, on peut obtenir une bonne généralisation, mais avec un échantillon de plus grande taille, le nombre de fractionnements atteint des sommets et, sans élagage, il s'agit simplement de mémorisation. Il faut donc élaguer pour augmenter l'échantillon.

Je n'ai pas encore vu comment cela fonctionne dans la nouvelle version sur leur site web. Il est possible que cette faille soit corrigée.

 
Maxim Dmitrievsky:

a pris beaucoup de temps à comprendre, mais ça y ressemble. La forêt d'Alglib est sujette au sur-apprentissage à mesure que la taille de l'échantillon augmente, car il s'agit d'une frénésie non-stop. Ainsi, avec un échantillon de taille modérée, on peut obtenir une bonne généralisation, mais avec un échantillon de plus grande taille, le nombre de fractionnements atteint des sommets et, sans élagage, il s'agit simplement de mémorisation. Il faut donc élaguer pour augmenter l'échantillon.

Je n'ai pas encore vu comment cela fonctionne dans la nouvelle version sur leur site web. Cette faille a peut-être été corrigée.

L'élagage doit contrôler l'exhaustivité, c'est-à-dire qu'il ne doit pas couper moins de 0,5-1% de couverture d'un échantillon.

 
govich:

Pourquoi torturer le logiciel du siècle dernier, sur le cyber forum ils ont suggéré une variante cinq fois plus rapide. L'auteur de NeyroPro a avoué qu'il a abandonné ses positions pendant quelques décennies, maintenant ils écrivent un code plus optimal.

Le multijoueur en C, pas mal, pas mal, c'est notre Maxim's à nourrir, il cherchait où piller MLP, et voilà du pur C 50 lignes, bien que ce ne soit pas encore son niveau.

 
Maxim Dmitrievsky:

Pas de retours à partir de maintenant, je vous ai envoyé par e-mail le meilleur moyen, lisez-le à votre aise ;)

Très bien, pas besoin de retours ou d'indicateurs, IO est capable de trouver la corrélation dans le prix net. Je serai strict mais juste. Comme dans la vie réelle, ou au travail dans un bureau et dans la relation patron-subordonné.

 
Maxim Dmitrievsky:

a pris beaucoup de temps à comprendre, mais ça y ressemble. La forêt d'Alglib est sujette au sur-apprentissage à mesure que la taille de l'échantillon augmente, car il s'agit d'une frénésie sans fin. Ainsi, avec un échantillon de taille modérée, on peut obtenir une bonne généralisation, mais avec un échantillon de plus grande taille, le nombre de fractionnements atteint des sommets et, sans élagage, il s'agit simplement de mémorisation. Il faut donc élaguer pour augmenter l'échantillon.

Je n'ai pas encore vu comment cela fonctionne dans la nouvelle version sur leur site web. Il est probable que cet inconvénient soit corrigé.

Non. Il y a juste des fonctions réécrites, je suppose, pour la rapidité. La profondeur est encore jusqu'à la dernière division.
Limitez vous-même la profondeur - définissez un compteur (profondeur ou nombre d'exemples dans la feuille) et lorsque celui-ci est dépassé, terminez la division. Dans mes expériences, cela n'a pas conduit à une amélioration de l'OOS, toujours le même 50+-5%.
 
Maxim Dmitrievsky:

Au moins dans ce processus, j'ai vu à la fois la stationnarité et la présence d'information mutuelle avec la ligne source. Il y a quelques aberrations, qui peuvent aussi être corrigées d'une manière ou d'une autre, mais c'est à vous d'en décider.

La formule est simple, je l'ai réécrite sur mql.

J'ai également réfléchi pendant un certain temps à l'utilisation de l'information mutuelle, je pense que cela a du sens, peut-être même un graal.

 
Kesha Rutov:

Très bien, pas besoin de retours ou d'indicateurs, IO est capable de trouver des dépendances dans le prix net. Je serai strict mais juste, comme dans la vie réelle, ou au travail dans un bureau, dans une relation patron-subordonné.

Non, Kesha, dans la vie réelle et ici sur le forum, tu n'as pas assez d'autorité pour partager quoi que ce soit avec toi. Travaillez là-dessus.

 
elibrarius:
Non. Il y a simplement des fonctions réécrites je suppose pour la rapidité. Il reste la profondeur pour le partage gagnant/dernier.
Limitez vous-même la profondeur - mettez un compteur (profondeur ou nombre d'exemples dans la feuille) et lorsqu'il est dépassé, terminez le partage. Dans mes expériences, cela n'a pas conduit à une amélioration de l'OOS, toujours le même 50+-5%.

Je n'ai aucune idée de son fonctionnement, mais il est dit qu'il produit des ordres de grandeur de forêt en moins, c'est-à-dire qu'il doit en fait se recycler moins car le nombre d'options est plus faible, même si la profondeur est la même.

 
elibrarius:
Non. Ce sont juste des fonctions réécrites pour plus de rapidité, je suppose. La profondeur y est toujours fonction de la répartition gagnante/dernière.
Limitez vous-même la profondeur - mettez un compteur (profondeur ou nombre d'exemples dans la feuille) et lorsqu'il est dépassé, terminez la division. Dans mes expériences, cela n'a pas conduit à une amélioration de l'OOS, toujours le même 50+-5%.

Donc vous devez utiliser les retours comme tout le monde a été désenformé par forex demotivators alyosha et wacky wizard, et les retours sont indépendants, il n'y a plus d'information en eux, pas de niveaux ou de lignes de tendance, du pur SB.

 
Kesha Rutov:

Moi aussi, je réfléchis depuis un certain temps à l'utilisation de l'information mutuelle, je pense que c'est logique, peut-être même un graal.

C'est une façon très correcte de penser, du moins ... la librairie que j'ai réécrite avec succès à partir de SI est juste à peu près cela...