Que mettre à l'entrée du réseau neuronal ? Vos idées... - page 62

 
Aleksey Nikolayev #

Dans le contexte du trading, je vous rappelle également l'approche de fxsaber, qui recherche un plateau plutôt qu'un sommet. Il s'avère également que le problème n'est pas clairement formalisé comme un problème d'optimisation.

Il s'agit de la section de l'optimisation concernant la minimisation d'une fonction bruyante. Optimisation d'une fonction bruyante ou quelque chose comme ça, j'écris de mémoire.
En fait, tout a déjà été inventé, si un trader fait du savoir-faire, c'est plutôt de l'analphabétisme.

Et Saber a simplement fait un arrêt précoce de façon banale et primitive, et il n'y a guère eu de plateau, mais plutôt de la sérénité pour l'âme.
 

Revenons à la mise en oeuvre technique...

L'optimisation est présente lors de la sélection d'une division dans l'arbre.
Dans le cas d'une formation 100% arbre, cette optimisation ne détermine que le chemin vers l'apprentissage des données absolues. Elle n'affecte pas la qualité de l'apprentissage, qui est de 100 %. L'apprentissage véritable n'est compris que comme un apprentissage à 100 %.

Par conséquent, l'apprentissage (mémorisation exacte de ce qui est enseigné) != optimisation. Mais si nous nous sous-entraînons, c'est-à-dire si nous arrêtons le fractionnement avant la mémorisation complète, nous pouvons nous arrêter à différentes variantes de ce chemin - le modèle et la qualité de l'apprentissage (degré de sous-entraînement) seront alors différents avec différents algorithmes de sélection de fractionnement, différentes profondeurs d'apprentissage, différents nombres d'exemples dans la feuille de travail.
Le sous-entraînement est une mauvaise idée dans le cas de l'enseignement de données non ambiguës/exactes (table de multiplication, loi d'Ohm, etc.). Plus vous donnez d'exemples à mémoriser/apprendre, plus la réponse sera précise sur de nouvelles données.


Mais dans le cas des données du marché, pour ne pas mémoriser le bruit, il faut s'arrêter plus tôt, évaluer et sélectionner l'un de ces modèles sous-appris. Par conséquent, il s'avère que l'optimisation et l'évaluation sont nécessaires pour les modèles sous-appris/non améliorés. Une base de données parfaitement exacte n'a pas besoin d'être évaluée, car elle dispose de tout ce qu'elle voulait pour s'entraîner.

 

L'apprentissage est un processus, pas un résultat.

Il ne peut y avoir 100 % ou 50 % d'apprentissage. Ces catégories n'existent pas.

La qualité de l'apprentissage n'est vérifiée que par la validation et le test de la manière dont l'étudiant a appris les leçons. Elle n'est pas testée par les stagiaires qui se contentent de répéter après le professeur ou de lire leurs notes.

La capacité d'apprentissage et de mémorisation est différente pour tous les modèles, il ne faut pas tout réduire aux arbres et aux forêts.

Et c'est là que la magie opère, lorsque l'élève le plus bête (le modèle) est souvent un meilleur prédicteur que l'élève le plus intelligent. C'est comme dans la vie. Et il y a une raison à cela.

Tout cela est écrit dans la théorie de l'apprentissage automatique, dont personne ici n'a jamais entendu parler, bien qu'elle soit la base des principes fondamentaux.

Il y a de la magie dans le monde de la MO, mais pas toutes vos absurdités.
 
mytarmailS #:
Il s'agit d'une section d'optimisation sur la minimisation d'une fonction bruyante. Optimisation d'une fonction bruyante ou quelque chose comme ça, j'écris de mémoire.
En fait, tout a déjà été inventé, si un trader fait du savoir-faire, c'est plutôt de l'analphabétisme.

Et Saber a simplement fait un arrêt précoce de manière banale et primitive, et il n'y a guère eu de plateau, mais plutôt de la sérénité pour l'âme.
Un exemple d'optimisation bruyante

Si j'ai bien compris, la philosophie générale de l'approche est la suivante :
1. Il existe un modèle qui apprend le bruit de la fonction optimisée (il est différent selon les sections) et le prédit.
2. Une certaine moyenne de la valeur + le bruit prédit est calculée.

3. Nous obtenons ce que l'on appelle un plateau, et non une valeur absolue.
 
Forester #:

Revenons à la mise en oeuvre technique...

L'optimisation est présente lors de la sélection d'une division dans l'arbre.
Dans le cas d'une formation 100% arbre, cette optimisation ne détermine que le chemin vers l'apprentissage des données absolues. Elle n'affecte pas la qualité de l'apprentissage, qui est de 100 %. L'apprentissage véritable n'est compris que comme un apprentissage à 100 %.

Par conséquent, l'apprentissage (mémorisation exacte de ce qui est enseigné) != optimisation. Mais si nous nous sous-entraînons, c'est-à-dire si nous arrêtons le fractionnement avant la mémorisation complète, nous pouvons nous arrêter à différentes variantes de ce chemin - le modèle et la qualité de l'apprentissage (degré de sous-entraînement) seront alors différents avec différents algorithmes de sélection de fractionnement, différentes profondeurs d'apprentissage, différents nombres d'exemples dans la feuille de travail.
Le sous-entraînement est une mauvaise idée lorsqu'il s'agit d'enseigner des données exactes ou à valeur unique (table de multiplication, loi d'Ohm, etc.). Plus vous donnez d'exemples à mémoriser/apprendre, plus la réponse sera précise sur de nouvelles données.


Mais dans le cas des données du marché, pour ne pas mémoriser le bruit, il faut s'arrêter plus tôt, évaluer et sélectionner l'un de ces modèles sous-appris. Par conséquent, il s'avère que l'optimisation et l'évaluation sont nécessaires pour les modèles sous-appris/non améliorés. Une base de données parfaitement exacte n'a pas besoin d'être évaluée, car elle dispose de tout ce qu'elle voulait pour s'entraîner.

Développez la réflexion suivante :

Devoir 1 :
L'arithmétique existe et l'une de ses opérations est la multiplication. Et il y a des nombres de 0 à 9. Apprenez la règle de la multiplication, faites une table de multiplication en multipliant deux nombres l'un par l'autre et apprenez la table de multiplication.

Tâche 2 :
Il existe une table de multiplication. La voici
...
...
...
Apprenez-la.


Dans la deuxième option, l'apprenant ne connaît pas la règle de multiplication, mais connaît les bonnes réponses.


Ces deux activités sont-elles des activités d'apprentissage ?

Si ce n'est pas le cas, comment classeriez-vous (décririez-vous) ces activités ?
 
Maxim Dmitrievsky #:

Ce n'est pas le cas. La précision des réponses sur de nouvelles données (et par nouvelles données, nous entendons des données autres que les données d'entraînement) dépendra des propriétés de chaque modèle particulier, et non du nombre d'exemples d'entraînement.

Prenons le cas de données régularisées. Table de multiplication, par exemple. Plus vous donnez d'exemples, plus les réponses seront précises sur les nouvelles données.
Les nouvelles données ne doivent pas être complètement différentes, mais se situer entre les exemples d'entraînement. En d'autres termes, l'interpolation se fera plus ou moins bien. 1 arbre donnera l'exemple de formation le plus proche. Si vous entendez par "autres données" des données situées en dehors des limites des données d'apprentissage, il s'agit déjà d'une extrapolation. L'arbre donnera un exemple extrême, parce qu'il est le plus proche.


Si nous considérons les données du marché, alors avec une grande valeur de bruit, tout pic du vrai modèle sera mélangé avec des pics de bruit et nous devons d'une manière ou d'une autre choisir le vrai pic et non le pic de bruit. Vos affirmations sont correctes ici.

 
Forester #:

Si l'on considère le cas des données structurées. Les tables de multiplication, par exemple. Plus vous donnez d'exemples, plus les réponses seront précises sur les nouvelles données.
Les nouvelles données ne doivent pas être complètement différentes, mais se situer entre les exemples d'entraînement. En d'autres termes, l'interpolation se fera plus ou moins bien. 1 arbre donnera l'exemple de formation le plus proche. Si vous entendez par "autres données" des données situées en dehors des limites des données d'apprentissage, il s'agit déjà d'une extrapolation. L'arbre donnera l'exemple le plus éloigné, parce qu'il est le plus proche.


Si nous considérons les données du marché, alors avec une grande valeur de bruit, tout pic du vrai modèle sera mélangé avec des pics de bruit et nous devons d'une manière ou d'une autre choisir le vrai pic et non le pic de bruit. Vos affirmations sont correctes ici.

Nous ne savons rien de l'absence ou de la présence de motifs. Nous nous contentons d'effectuer la formation et d'en parler.

Nous parlons de l'approche commune et de ce qu'elle signifie(magie). La magie de l'apprentissage est contre-intuitive pour le commun des mortels parce que les gens ne s'y retrouvent pas :)

Pourquoi il est important de ne pas se surentraîner, pourquoi il est important de ne pas se sous-entraîner. Pourquoi il est important de réduire le nombre de traits et de paramètres, etc. etc. etc.
 
Ivan Butko #:
Développez la réflexion suivante :

Tâche 1 :
Il y a l'arithmétique et l'une de ses opérations est la multiplication. Et il y a des chiffres de 0 à 9. Apprenez la règle de la multiplication, faites une table de multiplication en multipliant deux nombres l'un par l'autre, et apprenez la table de multiplication.

Tâche 2 :
Il existe une table de multiplication. La voici
...
...
...
Apprenez-le.


Dans la deuxième option, l'apprenant ne connaît pas la règle de multiplication, mais connaît les bonnes réponses.


Les deux apprennent-ils ?

Si ce n'est pas le cas, comment classeriez-vous (décririez-vous) ces activités ?

Il s'agit dans les deux cas d'une formation. Dans le premier cas, une règle/loi est enseignée. Dans le second cas, les réponses du premier sont apprises.
Naturellement, il est plus efficace d'enseigner des règles, des formules et des lois, car avec une petite formule, on peut obtenir des millions de réponses sans les mémoriser.
Ici, sur le forum, il y a eu des discussions sur les lois du marché et les graals. Il y a peut-être une loi, mais le bruit la recouvre(

 
Forester #:

Il s'agit dans les deux cas d'une formation. Dans le premier cas, une règle/loi est enseignée. Dans le deuxième cas, les réponses du premier cas sont apprises.
Naturellement, l'enseignement de règles, de formules et de lois est plus efficace, parce qu'en possédant une petite formule, vous pouvez obtenir des millions de réponses sans les mémoriser.
Ici, sur le forum, il y a eu des discussions sur les lois du marché et les graals. Il y a peut-être une loi, mais le bruit la recouvre(







Encore du bruit. Tout le monde parle de bruit. Mais comment définir le bruit si on ne connaît pas les règles et les lois ? Et si chaque tick était un composant de règles et de lois et que le problème était l'incapacité des architectures à déchiffrer le "code" d'un graphique ?

Cela ressemble à un postulat (l'idée de bruit dans un graphique de prix).

 

La formation nécessite un matériel de formation adéquat. Les ME modernes sont trop bons pour qu'on s'en plaigne.

Le ME avec un enseignant n'implique pas du tout la recherche de modèles épars dans les données. Il exige qu'ils soient présents en quantités significatives dans l'échantillon de formation.