L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 377

 
Vladimir Perervenko:

Après avoir été divisé en train/test/valide, mélangez le train. Ne mélangez pas le reste des séries.
Ceci est valable pour la classification par les réseaux neuronaux. De plus, pour la formation des réseaux neuronaux profonds, mélangez chaque minibatch avant de l'introduire.

Bonne chance


puis-je avoir une référence où lire sur le mélange ? parce que purement intuitivement, cela n'a aucun sens ) ainsi que la corrélation entre les prédicteurs et la cible (avec cela, nous avons résolu le problème, à peine).
 
Vladimir Perervenko:

Après avoir été divisé en train/test/valide, mélangez le train. Ne mélangez pas le reste des séries.
Ceci est valable pour la classification par les réseaux neuronaux. De plus, pour la formation de réseaux neuronaux profonds, chaque minibatch est mélangé avant d'alimenter le réseau neuronal.

Bonne chance

J'ai trouvé un exemple de mélange de train et de valide avec l'autre dans la fonction de calcul d'ensemble d'ALGLIB. De toute évidence, il s'agit d'une des méthodes.

Je n'ai brassé que du train.

Erreur moyenne en formation (80,0%) =0,396 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur la parcelle de validation (20,0%) =0,391 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Tracé complet (formation + validation) :
Erreur d'apprentissage moyenne=0.395 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Erreur moyenne dans le test (20%) area=0.398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

L'erreur est la même sur tous les segments, comme lorsqu'on mélange le train et le valide. Apparemment, l'effet est le même.

 
elibrarius:

J'ai trouvé un exemple de mélange de train et de valide avec l'autre dans la fonction de calcul d'ensemble d'ALGLIB. Apparemment, c'est l'une des méthodes.

Seul le train est remanié.

Erreur moyenne dans l'apprentissage (80,0%) plot =0,396 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur la parcelle de validation (20,0%) =0,391 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Tracé complet (formation + validation) :
Erreur d'apprentissage moyenne=0.395 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le test (20%) section =0.398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

L'erreur est la même sur tous les segments, comme lorsqu'on mélange le train et le valide. Apparemment, l'effet est le même.


Quelle est l'erreur sur le fichier distinct de ceux-ci ?

 
SanSanych Fomenko:


Quelle est l'erreur sur le fichier distinct de ceux-ci ?

Sur le test, vous voulez dire ?

Erreur moyenne sur le test (20%) section =0.398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

Je n'ai pas encore fait le tracé pour le test2. Je vais seulement passer au crible le test1. (Peut-être à l'avenir).

 
elibrarius:

Sur le site d'essai, vous voulez dire ?

Erreur moyenne sur le test (20%) section =0.398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

Je n'ai pas encore créé le graphe test2. Je vais seulement passer au crible le test1. (Peut-être à l'avenir).


En dehors de tous ces échantillons
 
SanSanych Fomenko:

En dehors de tous ces échantillons
En dehors, il n'y en a pas, toutes les données ont été utilisées.
 
elibrarius:
Dès le départ, toutes les données ont été utilisées.

Est-il possible de diviser le fichier source en 80/20 ? Puis 80% de tous vos exercices, et enfin 20% sans aucun mélange.
 
SanSanych Fomenko:

Pouvez-vous diviser le fichier source par 80/20 ? Puis 80% de tous vos exercices et enfin 20% sans aucun mélange.

Avec mélange :

Erreur moyenne sur la formation (51,0%) section =0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur la parcelle de validation (13,0%) =0,685 (68,5%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Tracé complet (formation + validation) :
Erreur d'apprentissage moyenne=0.683 (68.3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le test (16,0%) section =0,661 (66,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le site d'essai 2 (20,0%) =0,671 (67,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6

Sans remuer

Erreur moyenne sur la formation (51,0 %) tracé =0,516 (51,6 %) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur la parcelle de validation (13,0%) =0,376 (37,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Tracé complet (formation + validation) :
Erreur d'apprentissage moyenne=0.491 (49.1%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le site d'essai (16,0%) =0,344 (34,4%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le site de test 2 (20,0%) =0,326 (32,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6

Seulement 2 cycles de recyclage, pour la vitesse... déjà l'heure du coucher)

 
elibrarius:

Avec le brassage :

Erreur moyenne sur l'apprentissage (51,0 %) plot =0,683 (68,3 %) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur la parcelle de validation (13,0%) =0,685 (68,5%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Tracé complet (formation + validation) :
Erreur d'apprentissage moyenne=0.683 (68.3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le test (16,0%) section =0,661 (66,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le site d'essai 2 (20,0%) =0,671 (67,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6

Sans remuer

Erreur moyenne sur la formation (51,0 %) tracé =0,516 (51,6 %) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur la parcelle de validation (13,0%) =0,376 (37,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Tracé complet (formation + validation) :
Erreur d'apprentissage moyenne=0.491 (49.1%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le site d'essai (16,0%) =0,344 (34,4%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erreur moyenne sur le site de test 2 (20,0%) =0,326 (32,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6

Seulement 2 cycles de recyclage, pour la vitesse... déjà l'heure du coucher)


Votre modèle n'apprend rien - tout vient du stade de la balle. Quelque part, il capte quelque chose, puis il s'avère que ce n'est pas pertinent.

Commencez par l'exploration des données. Cible, puis recherche de prédicteurs pertinents pour la cible, puis détermination de la capacité prédictive des prédicteurs sélectionnés pour la cible spécifique, et seulement alors le modèle


Tout le reste n'est qu'un jeu intellectuel de chiffres.

 

https://www.youtube.com/channel/UCLk-Oih8VlqF-StidijTUnw

il a quelque chose à faire pour le week-end :) ar pour nubas

Et voici un gars qui fait du commerce algorithmique.


Основы анализа данных
Основы анализа данных
  • www.youtube.com
Канал содержит курсы по анализу данных. Все курсы бесплатны и легки в освоении Прохожу обучение в бесплатной школе Дениса Коновалова http://superpartnerka.bi...