Que mettre à l'entrée du réseau neuronal ? Vos idées... - page 63

 
Forester #:

Si l'on considère le cas des données structurées. Les tables de multiplication, par exemple. Plus vous donnez d'exemples, plus les réponses seront précises sur les nouvelles données.
Les nouvelles données ne doivent pas être complètement différentes, mais se situer entre les exemples d'entraînement. En d'autres termes, l'interpolation se fera plus ou moins bien. 1 arbre donnera l'exemple de formation le plus proche. Si vous entendez par "autres données" des données situées en dehors des limites des données d'apprentissage, il s'agit déjà d'une extrapolation. L'arbre donnera l'exemple le plus éloigné, parce qu'il est le plus proche.


Si nous considérons les données du marché, alors avec une grande valeur de bruit, tout pic du vrai modèle sera mélangé avec des pics de bruit et nous devons d'une manière ou d'une autre choisir le vrai pic et non le pic de bruit. Vos affirmations sont correctes ici.


I van Butko #:







Encore du bruit. Tout le monde parle de bruit. Mais comment définir le bruit si nous ne connaissons pas les règles et les lois ? Et si chaque tic-tac était une composante des règles et des lois et que le problème était l'incapacité des architectures à déchiffrer le "code" d'un graphique ?

Cela ressemble à un postulat (l'idée du bruit dans un graphique de prix).

À propos du bruit et des modèles

On ne connaît pas la présence et la quantité de bruit dans les données du marché, ni l'existence ou non de schémas.

À propos de l'apprentissage, de la mémorisation et de la rétention

Préservation - Si les données sont simplement écrites sur des variables sans que leur qualité soit évaluée, on peut parler de préservation. L'écriture normale de données dans des variables (base de données, tableau, matrice, etc.) en est un exemple.

Mémorisation : si l'évaluation de la qualité est effectuée au cours du processus de sauvegarde, il s'agit déjà de mémorisation. Par exemple, l'estimation du pourcentage de réponses correctes par rapport au nombre de questions à mémoriser. Dans ce cas, plus il y a d'exemples, plus le champ d'application est large. Par exemple, pour une tâche de 2 x 8, la réponse serait 16, mais pour 18 x 67, la réponse pourrait être n'importe quoi, puisque cette question n'a pas été incluse dans les exemples.

Apprentissage : l'évaluation de la qualité permet d'apprendre à partir de données stockées et mémorisées. L'apprentissage est le processus de formation des règles de traitement des données mémorisées. Par exemple, s'entraîner à appliquer la règle de la multiplication par colonne. Dans ce cas, vous ne devez retenir que le minimum d'informations nécessaires (table de multiplication) et, en utilisant la règle de la colonne, vous pouvez multiplier n'importe quelle combinaison de nombres, y compris 18 x 67 et même 1,657875 x 3,876754.

Un exemple d'apprentissage serait les modèles de type GPT qui non seulement mémorisent des données, mais appliquent également des règles pour traiter différentes données en effectuant des calculs tels que la multiplication en colonnes.

Maintenant que nous avons abordé les concepts d'apprentissage, de mémorisation et de rétention, nous pouvons poser la question suivante : dans quel domaine de l'apprentissage automatique (n'impliquant pas les modèles de type GPT) l'apprentissage est-il appliqué pour analyser les données du marché ?

P.S. Il s'agit là de notions de base ; nous aborderons ultérieurement l'importance de l'évaluation et d'autres aspects intéressants.

P.P.S. Le sur-apprentissage , le sous-apprentissage et les états similaires ne peuvent être évalués ni quantitativement ni qualitativement, de sorte qu'il n'y a guère de sens à en parler de manière significative et utile.

 
Andrey Dik #:

Mémorisation : si l'évaluation de la qualité est effectuée au cours du processus de conservation, il s'agit déjà d'une mémorisation.

Les bases de données, les arbres et les grappes qui mémorisent l'information à 100 % n'ont pas besoin d'être évalués. Mais vous pouvez vérifier ce que 3*3 équivaut en essayant toutes les variantes possibles. C'est à vous de voir, c'est à vous de voir, c'est à vous de voir... Je m'occupe de choses plus importantes.

P.P.S. Le surentraînement , le sous-entraînement et les états similaires ne peuvent être évalués ni quantitativement ni qualitativement, de sorte qu'il est pratiquement inutile d'en parler d'une manière significative et utile.

Seuls les modèles sous-entraînés doivent être évalués.

 
Forester #:

1. les bases de données, les arbres et les grappes qui mémorisent des informations à 100 % n'ont pas besoin d'être évalués.

2. seuls les modèles sous-entraînés doivent être évalués.

1. S'il n'y a pas d'évaluation, cela signifie qu'il s'agit d'un processus de rétention et non de mémorisation. Ce qui précède montre la différence.

2. Comment déterminer quand et de combien un modèle est "sous-appris" ?

 
Probablement hors sujet, mais mon expérience me dit que seuls les oscillateurs (probabilités, winrates, etc.) peuvent être prédits qualitativement. Pour ceux qui rêvent de prédire les mouvements de prix, mon opinion personnelle est que ce n'est pas encore possible (ou peut-être même pas du tout) !
 
Sergey Pavlov #:
Probablement hors sujet, mais mon expérience me dit que seuls les oscillateurs (probabilités, winrates, etc.) peuvent être prédits qualitativement. Pour ceux qui rêvent de prédire les mouvements de prix, mon opinion personnelle est que ce n'est pas encore possible (ou peut-être même pas du tout) !

que signifie winrate ?

 
Andrey Dik #:

1. S'il n'y a pas d'évaluation, il s'agit d'un processus de rétention et non de mémorisation. J'ai montré la différence ci-dessus.

2. Comment déterminer quand et de combien un modèle est "sous-appris" ?

1) c'est seulement pour vous que la mémorisation consiste à passer en revue les variantes possibles et à évaluer chacune d'entre elles. Vous n'avez pas besoin d'imposer cela aux autres et de le faire passer pour une vérité.

2) Il n'est pas nécessaire de le définir, avant l'entraînement, il est fixé dans les paramètres - entraîner à 100 % ou sous-entraîner.

 
Forester #:

1) c'est seulement pour vous que la mémorisation consiste à passer en revue les options possibles. Ne l'imposez pas aux autres et ne le faites pas passer pour une vérité.

2) Il n'est pas nécessaire de la définir, avant l'entraînement elle est paramétrée - s'entraîner à 100% ou se sous-entraîner.

1. Quel est le rapport entre la mémorisation et le fait de "passer en revue les options possibles" ? Vous n'avez pas besoin d'inventer quelque chose que je n'ai pas prétendu et que je ne peux donc pas imposer à qui que ce soit.)

2. Dans la manière dont vous appliquez la MO, et beaucoup de gens en général, l'apprentissage n'est présent que de manière conditionnelle. Parce qu'il n'y a pas de formation de règles pour traiter de nouvelles données inconnues. Il y a mémorisation. Je l'ai montré plus haut.


Je suis conscient que certaines choses peuvent être douloureuses à accepter parce qu'elles bouleversent les croyances établies. Mais si on les accepte, on comprend pourquoi certaines méthodes n'apportent pas les résultats escomptés, ce qui permet de changer l'orientation de la recherche.

 
Andrey Dik #:

1. Quel est le rapport entre la mémorisation et le fait de "passer par les options" ? Vous n'avez pas besoin d'inventer quelque chose que je n'ai pas prétendu et que je ne peux donc pas imposer à qui que ce soit.)

2. Dans la manière dont vous appliquez la MO, et beaucoup de gens en général, l'apprentissage n'est présent que de manière conditionnelle. Parce qu'il n'y a pas de formation de règles pour traiter de nouvelles données inconnues. Il y a mémorisation. Je l'ai montré plus haut.


Je suis conscient que certaines choses peuvent être difficiles à accepter, parce qu'elles détruisent des croyances établies. Mais si on les accepte, on comprend pourquoi certaines méthodes ne donnent pas les résultats escomptés, ce qui permet de changer l'orientation de la recherche.


Quelle est la différence entre une base de données ordinaire et un système intelligent ?

 
Ivan Butko #:


Quelle est la différence entre une base de données ordinaire et les systèmes intelligents ?


Par exemple, le même gpt ne se contente pas de se souvenir de la table de multiplication, il est entraîné à utiliser la règle des colonnes. Cela signifie qu'il peut multiplier n'importe quel nombre, et pas seulement à l'intérieur de la table de multiplication.

C'est la différence entre une base de données ordinaire et les systèmes intelligents. Ces derniers peuvent appliquer des règles connues pour traiter de nouvelles informations, comme le fait un être humain. Un niveau d'intelligence encore plus élevé est la capacité de développer de nouvelles règles en se basant sur d'anciennes.

La "formation" conventionnelle d'un réseau neuronal ne crée pas de règles et ne fonctionne donc pas bien sur des données inconnues. Il s'agit simplement d'une approximation des données et nous nous attendons à ce que cette approximation fonctionne aussi bien sur de nouvelles données que sur des données d'entraînement.