Utilisation des réseaux neuronaux dans le trading. - page 4

 
StatBars >> :

Je pense qu'il ressort de votre post que la normalisation dépend plus des données que de la tâche à accomplir.

Concernant la deuxième partie : considérez-vous les MA et les séries incrémentales ?

Et d'une manière générale, voulez-vous dire que le réseau entraîné doit être insensible aux données d'entrée (à chaque entrée individuelle), ou qu'il suffit de changer les données d'entrée pour que le réseau fasse toujours des prédictions ?

Oui, la dépendance à la distribution des données affecte la vitesse et la qualité de l'apprentissage. Autrement dit, la normalisation affecte essentiellement la vitesse et la qualité, respectivement. En ce qui concerne la deuxième partie, non bien sûr, vous ne pouvez pas pousser des données complètement différentes dans un réseau neuronal entraîné sur les mêmes données, mais tout de même, décrivant la distribution assez précisément. La distribution, le type de données doivent toujours rester les mêmes. Mais si vous formez un réseau avec un type de données décrivant exactement le processus, et que vous obtenez des résultats très différents en utilisant d'autres données dans le nouveau réseau formé décrivant le processus tout aussi exactement, cela signifie que vous avez probablement posé la mauvaise question au réseau neuronal. Les données doivent d'abord décrire complètement le processus, et ensuite vous devez réduire une erreur de généralisation qui soit adéquate en termes de demande de généralisation qualitative du réseau. Tout cela se passe littéralement à un niveau intuitif. Il ne sert à rien de jouer avec le type de données si le processus est entièrement décrit, mais il est utile de poser la bonne question au réseau.

 

Un mot ou deux sur le prétraitement.

Échantillon source : la sortie est en corrélation avec l'entrée (la corrélation la plus significative). corr=0.64.

Sur le graphique : Coordonnée X - données d'entrée. Y - Sortie requise

Supprimer la relation linéaire. Vous n'avez pas besoin d'un réseau pour trouver la dépendance linéaire, et d'ailleurs cela détériorera les résultats du réseau neuronal.

Voici à quoi ressemblent les données décorrélées.

Vous pouvez également voir sur le premier graphique que la densité des points de données est concentrée au centre, et éparse le long des bords.

Ainsi, les points concentrés au centre donneront le principal stimulus à l'entraînement du réseau, ou plutôt l'importance de leur erreur dépassera l'importance de l'erreur des données sur les bords. Le réseau trouvera d'abord l'espérance d'échantillonnage, qui se trouve juste au centre, puis se répartira autour d'elle en respectant la condition d'erreur minimale.

Par conséquent, la fonction de distribution de fréquence est égalisée, elle nivelle l'importance de l'erreur et le réseau a un intérêt certain à obtenir l'erreur la plus faible au centre de la distribution ainsi qu'aux bords de la distribution des données.

Avec la fonction sigmoïdale, les données d'entrée et de sortie sont réparties de manière presque égale.

Voici à quoi ressemblent les données transformées. C'est sur ces données que le réseau apprend.

Ainsi, le nuage de données est réparti de manière homogène. Mais il convient de préciser que certaines nuances ne permettent pas de qualifier ce prétraitement d'optimal pour le réseau.

Il convient également de noter que toutes les conversions sont réversibles et n'introduisent pas d'imprécision.

Toutes les méthodes (en principe) ont été discutées dans ce fil.

 
StatBars писал(а) >>

Fonction de distribution des données après conversion avec une fonction sigmoïde, les données d'entrée et les données de sortie sont distribuées de manière presque égale.

StatBars, cette procédure est-elle automatisée, ou devez-vous la faire manuellement - pour ajuster les coefficients de la fonction sigmoïde ?

 
Neutron писал(а) >>

StatBars, cette procédure est-elle automatisée, ou devez-vous la faire manuellement - ajuster les coefficients de la fonction sigmoïde ?

Les coefficients doivent être ajustés, jusqu'à présent... Mais je prévois d'automatiser... L'idée est que si la fonction d'approximation est correctement sélectionnée, il s'agira d'un rectangle.

J'ai automatisé l'alignement uniquement avec la fonction de distribution de zones, mais il y a tellement de moments "glissants" que j'ai dû y renoncer...

 

Oui - j'ai la même chose.

Je dois demander à Prival comment obtenir la distribution souhaitée (rectangulaire) à partir d'une distribution arbitraire sous forme analytique.

Et, pourquoi utilisez-vous la sigmoïde comme FA et non la tangente hyperbolique ? Les avantages sont évidents...

 
Neutron писал(а) >>

Et, pourquoi utilisez-vous la sigmoïde comme FA plutôt qu'une tangente hyperbolique ? Les avantages sont évidents...

Et les avantages pourraient être plus détaillés.

 
Oui, un neurone activé par une fonction symétrique apprend deux fois plus vite. De plus, pendant le processus d'apprentissage, certains des poids prennent des valeurs proches de zéro, ce qui les désactive, c'est-à-dire que le nombre effectif de synapses "fonctionnelles" dans un neurone à FA sigmoïdal est toujours plus petit que dans un neurone hyperbolique. Ce n'est pas une bonne chose, car il faut toujours faire aller et venir les synapses "mortes".
 
Neutron писал(а) >>
Oui, un neurone activé par une fonction symétrique apprend deux fois plus vite. De plus, au cours du processus d'apprentissage, certains des poids prennent des valeurs proches de zéro, c'est-à-dire que le nombre effectif de synapses "fonctionnelles" du neurone à FA sigmoïdal est toujours inférieur à celui du neurone hyperbolique. Ce n'est pas une bonne chose, car il faut toujours faire aller et venir les synapses "mortes".

Une simple conversion vous permet d'obtenir une valeur de -1 à 1 en sigmoïde également. Il n'y a rien de compliqué.

 

Ouais, qui peut discuter avec ça ?

C'est juste que c'est une question de "pantalon sur, pantalon enlevé".

 
Neutron писал(а) >>

C'est vrai - j'ai la même chose.

Je dois demander à Prival comment obtenir la distribution souhaitée (rectangulaire) à partir d'une distribution arbitraire sous forme analytique.

Et, pourquoi utilisez-vous la sigmoïde comme FA et non la tangente hyperbolique ? Les avantages sont en surface, après tout...

J'utilise juste la tangente hyperbolique.