L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 890

 
Aleksey Vyazmikin:

Voici le premier sujet de test prêt - formation 2015-2016, et à partir de 2017 trading pur sur les règles de l'arbre sélectionné - n'a pas perdu - déjà bon ?

Contre le trading sans NS - formation (ugh - tuning et optimisation) 2016-2017


Je ne comprends toujours pas la meilleure façon de procéder - j'ai fini par sélectionner des règles et les transformer en code - un travail manuel très minutieux... Il faut une sorte d'automatisation du processus.


L'erreur de vos 10% en formation est immédiatement devenue 50% dans le futur.

Il s'agit soit d'une sur-éducation, soit d'un coup d'œil sur l'avenir par les prédicteurs.
 
Maxim Dmitrievsky:

vous l'avez déjà fait fonctionner sans arbre ) essayez d'ajouter l'optimiseur de mon article sur la forêt, peut-être les résultats s'amélioreront-ils.

Essayez d'utiliser l'information mutuelle pour déterminer l'importance.

J'ai parcouru deux articles, mais je ne comprends pas ce que vous entendez par "optimiseur d'échafaudage".

Je veux en savoir plus sur l'importance, quel type d'information mutuelle - entre le filet et l'EA sans le filet ou entre les signaux d'achat et de vente ? J'ai besoin du code, mais je n'en suis pas sûr.

 
elibrarius:

L'erreur de vos 10% sur la formation est immédiatement devenue 50% sur l'avenir.

Il s'agit soit d'un sur-apprentissage, soit d'une prédiction de l'avenir.

Pas vraiment, je n'ai sélectionné que 25 règles pour l'achat et 16 règles pour la vente, ce qui représente probablement moins de 0,1 % de toutes les règles. J'écrivais juste plus haut que le problème est qu'à mon avis, trop de règles sont édictées, ce qui n'est pas efficace.

Le voyeurisme n'existe pas (en logique non, bien que si erreur dans le code, mais deux codes sont utilisés - un pour prendre l'information dans le script, un autre pour travailler par les règles comme un indicateur, c'est-à-dire que la probabilité d'erreur est moindre).

Réapprentissage - oui peut-être, en général, si globalement, mes fics sont du domaine du "follow the trend", faites pour trouver des tendances, et 2017 sur Si était presque de plats uniques, sans tendances globales - marché un peu différent.

D'autre part, je collecte des puces de différentes TF, j'obtiens une sorte de classification du plus au moins, et cela ressemble à une pyramide inversée, ou à un zoom, c'est-à-dire que je divise conditionnellement un mois en deux parties avec des sous-ensembles, je regarde la même semaine, le même jour, la même heure dans chaque sous-ensemble.... et a ainsi recueilli des statistiques qui, avec d'autres fiches, se sont avérées reproductibles sur l'échantillon.

Règles d'achat


Bleu - il s'agit du prix se trouvant dans le canal de Donchian au moment de la décision - de 0 à 10 - pas de 10% - un achat est suggéré lorsque le prix augmente, ce qui est raisonnable en général.

Vert - juste une grande échelle de la zone ATR prévue jour, semaine, mois - c'est-à-dire une grande tendance, il y a une rupture du niveau -8 au niveau +8, par exemple on peut voir qu'à la survente sur le TF mensuel - niveau -6 - seulement 1 règle pour l'achat, tandis que la croissance du niveau -3, -1, -2, -4 est suggérée.C'est-à-dire qu'on a probablement mis l'accent sur le fait que les contrats à terme USD/RUB étaient plus souvent à la hausse qu'à la baisse sur une base mensuelle, et qu'il y avait des flips à l'intérieur de la barre (inversion du prix d'ouverture après un fort mouvement d'un côté).

Gris ( ?) - RSI sur l'heure - l'achat en dehors des niveaux 70 est recommandé (seulement 1 fois l'achat en dehors du niveau 70 est recommandé).

Orange (selon le bureau) - BB_Up - c'est le prix au-dessus de la borne supérieure de la Bollinger à l'ouverture d'une nouvelle barre - 6 sur 25 préfèrent le surachat en ce moment, comme signal d'entrée, mais les 19 autres le préfèrent sans survente, et à en juger par BB_Down - calme - plateau ou plat.

Jaune - TimeH - il y a une préférence pour entrer à 10 heures (4 sur 13) - c'est-à-dire immédiatement à l'ouverture et à la fermeture - à 23 heures (2 sur 13), et ce n'est pas surprenant, car à 10 heures un mouvement fort et net est fourni, le reste 12,15,13,17 - session quotidienne normale avec une bonne volatilité, mais les 20 heures sont plutôt une exception à la règle. Peut-être, si nous ajoutons les jours de la semaine, il y aura quelques régularités, liées aux nouvelles hebdomadaires - les réserves de pétrole et leurs prévisions sont réelles pour le rouble - je vais essayer.

 

Je voulais garder le silence jusqu'à ce que j'obtienne de bonnes statistiques, mais je ne peux pas vous regarder persister à vous tromper.....

Toute conversion entraîne une réduction des informations sur la série recherchée. Même Mashka avec le paramètre 2 commence à être en retard et perd une petite quantité d'informations sur les kotir dans le processus. NS est un outil si délicat lorsqu'on travaille avec des nombres réels, où chaque chiffre, même à 10 décimales, peut être décisif dans la solution finale. Si vous supprimez complètement la partie réelle du nombre et que vos entrées sont classées par catégories de -1 à 30 (à titre d'exemple), vous obtenez 31 catégories. Dans le monde réel, le nombre de choix entre -1 et 30 est exactement égal à autant d'ordres de grandeur que vous prenez d'ordres de grandeur après la virgule. Par conséquent, si vous prenez int, vous avez 31 possibilités de fractionnement, et si vous prenez doble, il y a beaucoup plus de possibilités de fractionnement.

Si vous utilisez une entrée catégorielle itnt de -1 à 30, la qualité des données elles-mêmes devrait être très élevée afin que le réseau puisse apprendre à partir d'elles et obtenir un bon résultat, mais comme TOUTES vos données sont construites à partir du prix, leur qualité est très discutable, et vous coupez également les chiffres réels dans itnt, tuant ainsi la capacité de NS à attraper quoi que ce soit.

Les catégories peuvent être utilisées en entrée si la qualité des données utilisées est déjà suffisamment élevée. Ce qui, en principe, invalide l'utilisation de NS. Avec de bons prédicteurs catégoriels, vous pouvez construire un TS sans NS.....

Et bien c'est ainsi.... je pense juste à voix haute... ça me fait mal au coeur de voir vos bêtises... Il a même brisé le silence du déjeuner.....

 

Si nous comparons un lac à un autre, la métrique a-t-elle vraiment une grande importance ? Non, bien sûr, si nous ne comparons pas un lac avec un lac, la réponse pourrait être différente - un étang ou une flaque d'eau, mais devons-nous avoir peur de nous mouiller les pieds dans une flaque d'eau en allant vers un lac ? Personnellement, je ne vois pas l'intérêt de catégories précises, peut-être est-ce important pour le SN qui est capable d'analyser les informations de haut en bas, mais je n'en ai pas, et pour un arbre, c'est plus que suffisant, comme je le vois maintenant.

 
Aleksey Vyazmikin:

Si nous comparons un lac à un autre, la métrique a-t-elle vraiment une grande importance ? Non, bien sûr, si nous ne comparons pas un lac avec un lac, la réponse pourrait être différente - un étang ou une flaque d'eau, mais devons-nous avoir peur de nous mouiller les pieds dans une flaque d'eau sur le chemin du lac ? Personnellement, je ne vois pas l'intérêt de catégories précises, peut-être est-ce important pour ce SN qui est capable d'analyser les informations de haut en bas, mais je n'en ai pas, et pour un arbre, c'est plus que suffisant, comme je le vois maintenant.

Pour utiliser des entrées catégoriques. La qualité de ces intrants doit être très bonne. Si la qualité des données d'entrée est médiocre, il est préférable de ne pas les convertir en catégories, mais d'alimenter les valeurs réelles des indicateurs eux-mêmes. Ainsi, NS aura plus d'options pour diviser cette zone de manière adéquate IMHO !

 

OK, je tiens à remercier tout spécialement FOCUSNIC !!!!!.

Je ne pensais pas qu'on en arriverait là, mais vos conseils se sont avérés essentiels pour préparer les prédicteurs. Alors bravo à toi, salope. fils de pute !!!! (sans vouloir vous offenser)

Je m'assurerai de poster une vidéo plus tard qui vous mentionnera définitivement... Attendez donc la vidéo de Michael :-) où je vous parlerai de ma compréhension du domaine des Mo en général. Je pense que cette vidéo sera intéressante non seulement pour les débutants mais aussi pour les expérimentés ..... alors... attendez la suite !!!!

 
Mihail Marchukajtes:

Pour utiliser des entrées catégoriques. La qualité de ces intrants doit être très bonne. Si la qualité des données est faible, il est préférable de ne pas les traduire en catégories, mais d'alimenter les valeurs réelles des indicateurs eux-mêmes. De cette façon, le NS aura plus d'options pour diviser cette zone de façon adéquate IMHO !!!

En quoi proposez-vous de mesurer la qualité ?

 
Mihail Marchukajtes:

Pour utiliser des entrées catégoriques. La qualité de ces intrants doit être très bonne. Si la qualité des données est faible, il est préférable de ne pas les traduire en catégories, mais d'alimenter les valeurs réelles des indicateurs eux-mêmes. De cette façon, le NS aura plus d'options pour diviser cette zone de manière adéquate IMHO !!!

31 catégories... non c'est plutôt une discrétisation avec 31 étapes. Un des articles de Vladimir l'utilise et le résultat n'est pas pire.
 
Aleksey Vyazmikin:

Quelle est la mesure de la qualité proposée ?

Tout d'abord, enregistrez le moment où la décision est prise. Que ce soit un événement. Ensuite, à ce moment précis où l'événement s'est produit, sauvegardez les valeurs des indicateurs.

Pour être honnête, je ne comprends pas bien votre table. Qu'est-ce qu'il y a dedans ?