L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 937

 

Oui, vous pouvez avoir plusieurs classes. Mais j'ai rarement travaillé avec des modèles comportant plus de 2 classes, c'est toujours difficile et problématique, surtout si une classe est plus nombreuse que les autres. Il est possible d'essayer, mais je n'espère pas un bon résultat, pour être honnête.

Maintenant c'est un peu compliqué - un arbre est un filtre qui sait où vous ne pouvez pas être long, un autre arbre sait où vous pouvez être long, et il y a 2 arbres similaires qui manquent pour les shorts. Peut-être que le fait de combiner toutes ces informations en un seul arbre l'emportera sur les inconvénients de l'utilisation de trois classes, et le puzzle s'assemblera :)

 
Dr. Trader:

Oui, vous pouvez avoir plusieurs classes. Mais j'ai rarement travaillé avec des modèles comportant plus de 2 classes, c'est toujours difficile et problématique, surtout si une classe est plus nombreuse que les autres. Il est possible d'essayer, mais je n'espère pas un bon résultat, pour être honnête.

Maintenant c'est un peu compliqué - un arbre est un filtre qui sait où vous ne pouvez pas être long, un autre arbre sait où vous pouvez être long, et il y a 2 arbres similaires qui manquent pour les shorts. Peut-être que le fait de combiner toutes ces informations en un seul arbre permettra de surmonter les inconvénients liés à l'utilisation de trois classes, et le puzzle s'arrangera :)

Il sera intéressant de voir le résultat !

Je ne sais pas, peut-être que je devrais faire de nouvelles cibles avec des prises de profits stupides, alors il pourrait y avoir plus d'entrées. Ce n'est pas clair du tout avec les objectifs, maintenant beaucoup d'entre eux (avec beaucoup d'entrées) attrapent carrément le renversement, alors que je ne voudrais pas y entrer - je pense qu'il n'y a pas de certitude de renversement, mais il y a une certitude de fin de mouvement de tendance, et on peut s'attendre à un flat - c'est-à-dire que nous avons des objectifs bruités ici. Lorsqu'il y a un fichier avec un petit nombre d'entrées, il devrait y avoir des objectifs propres, mais nous rencontrerons également différents types d'entrées - hors du plat, entrée après correction pour la continuation du mouvement et entrée pour le renversement (par exemple, lors de la formation d'une barre de pin sur le TF horaire). En outre, il existe une nuance telle qu'une "fenêtre d'entrée ouverte" lorsque l'entrée est autorisée pendant un nombre décent de barres d'affilée - des bruits d'accidents peuvent également apparaître à cet endroit. Je pense que je devrais peut-être diviser les cibles pour montrer la même image.

 
Roffild:

Avez-vous expérimenté avec kfold alglib ? Est-ce que cela améliore les résultats ? J'ai vu dans un de vos anciens messages que ça ne semble pas mélanger l'échantillon. Est-ce que c'est vraiment nécessaire ?

Des conclusions sur ce qui surentraîne le moins - forest ou mlp ? sur les mêmes données. Je soupçonne que pour les tâches de régression, la forêt fonctionne de manière tordue et renvoie des erreurs tordues (très petites), pour les normes de classification.

2. J'ai vu des personnes intéressées par l'OpCl, avez-vous pensé à réécrire la NS en fonction de celle-ci ? Par exemple, j'ai abandonné complètement GA, qui était un cauchemar absurde, et tout est maintenant formé dans un seul fil sur un seul cœur. Vous pourriez l'accélérer sur Cl (bien que ce soit aussi rapide que ça). Ou, si vous vous entraînez sur Spark, c'est de toute façon en parallèle et cela n'a aucun sens.

3. plus ou moins compris ce que vous mettez sur le git et comment vous l'appliquez. Un travail intéressant, respectueux ! :)

 

Hi)


J'ai scanné le code, je l'ai mis sur la machine à laver et je l'ai allumée pour lui apprendre.

J'ai ensuite cousu le code sur la machine à coudre trois fois pour entraîner le réseau neuronal en profondeur.

Le résultat est que le code a changé au point d'être méconnaissable, et maintenant je me demande comment l'utiliser dans le commerce...

 

Le superbot est-il déjà prêt ?

Ça fait deux ans que j'attends.

 
Maxim Dmitrievsky:

Y a-t-il des conclusions quant à savoir lequel est le moins surentraîné - la forêt ou le MLP ?

L'un des paquets contient un exemplaire de démonstration du NS prédictif (MLP). Une NS relativement simple, d'ailleurs. Donc c'est irréel de le recycler. Peu importe comment vous le ré-entraînez, tout fonctionne.

Le recyclage dépend donc, avant tout, de la tâche confiée au SN. Eh bien, et sur l'adéquation de la complexité du MLP à la tâche.

 
Maxim Dmitrievsky:

Je parle spécifiquement d'alglib et des tests sur les mêmes données provenant de différents modèles.

Un NS est un NS. Cela ne fait aucune différence, alglib ou autre. Si le SN se réadapte, cela signifie qu'il est inadapté à la tâche fixée, et qu'il est nécessaire de modifier soit la tâche, soit la structure du SN. Et ne vous donnez pas la peine). Comme un adjudant avait l'habitude de dire - f... (Je ne peux pas vous parler des forêts, avec elles je ne peux rien dire).

Je ne peux rien dire sur la forêt, je ne travaille pas avec elle.

 

Et si nous entraînons l'arbre sur une non-cible plutôt que sur un prédicteur ? Serons-nous capables d'identifier les prédicteurs non significatifs, sur la base d'une bonne formation ? Autrement dit, si le modèle de test reconnaît bien les prédicteurs, les autres prédicteurs contiennent déjà suffisamment d'informations et le prédicteur est redondant et peut être écarté. Et si ce n'était pas le prédicteur qui était en cause, mais la redondance des combinaisons uniques elles-mêmes ?

Par exemple, j'ai décidé de choisir le nombre d'heures comme cible.

Le résultat sur l'échantillon de formation


Le résultat sur l'échantillon de test


Vous pouvez voir que 10 heures est bien prédit, pouvons-nous faire l'hypothèse que les conditions sont différentes à ce moment-là par rapport au reste de l'échantillon ? Je pense que oui. Je vais essayer de regrouper le reste des heures, peut-être qu'ainsi nous pourrons mieux distinguer les particularités du comportement des prix dans ces plages horaires.

 
Aleksey Vyazmikin:

Et si nous entraînons l'arbre sur une non-cible plutôt que sur un prédicteur ? Serons-nous capables d'identifier les prédicteurs non significatifs, sur la base d'une bonne formation ? Autrement dit, si le modèle de test reconnaît bien les prédicteurs, les autres prédicteurs contiennent déjà suffisamment d'informations et le prédicteur est redondant et peut être écarté. Et si ce n'était pas le prédicteur qui était en cause, mais la redondance des combinaisons uniques elles-mêmes ?

Par exemple, j'ai décidé de choisir le nombre d'heures comme cible.

Le résultat sur l'échantillon de formation


Le résultat sur l'échantillon de test


Vous pouvez voir que 10 heures est bien prédit, pouvons-nous faire l'hypothèse que les conditions sont différentes à ce moment-là par rapport au reste de l'échantillon ? Je pense que oui. Je vais essayer de regrouper le reste des heures, peut-être que cela m'aidera à mieux distinguer les particularités du comportement des prix dans ces plages horaires.

Peut-être est-ce parce que 10 heures est la première, après une grande pause de 24 heures ? C'est pour ça qu'il a bien prédit ? Y a-t-il quelque chose de spécifique à 24 heures autre qu'une faible volatilité ?
 
Yuriy Asaulenko:

Une journée n'est probablement pas suffisante). C'est en fait une spécialité). Elle a été étudiée pendant des années, voire une vie entière de vie active.

NS, pas de réminiscence, mais largement utilisé en DSP. La question de l'application des NS en DSP est la formulation correcte du problème pour les NS. Par exemple, une application de la NS est le filtrage, y compris le filtrage adaptatif.

D'ailleurs, NS fonctionnera bien si vous lui donnez une tâche bien précise, pas apporter ceci, je ne sais quoi.

Je continue à m'y mettre.

J'étudie cette fiction depuis 5 ans et je ne pouvais même pas imaginer qu'il était possible de l'appliquer à un forum.

En bref, NS est un filtre non récursif adaptatif ordinaire.

Il existe de nombreuses variétés.

Avec un professeur, sans professeur, etc.

Prédicteurs - coefficients de filtrage numérique. C'est hilarant, parce que c'est élémentaire, et vous piétinez en quelque sorte la science... C'est vieux comme le monde. (Tout cela date des années 50).

Dites-moi - avez-vous déjà fait un essai en aveugle, ou utilisez-vous l'entrée/sortie avec la formation ?

//Blind est quand vous ne savez pas ce qu'est la sortie et qu'il n'y a rien à quoi la comparer... Ils disent que dans ce cas, l'objectif principal est de réduire le bruit.

// Et si vous êtes un voyant, la prévision est calculée avec un vecteur d'erreur, qui est filtré. Mais il y a un retard dans le traitement, au moins d'un tick.