L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 950

 
Aleksey Vyazmikin:

Pourquoi diviser un fichier quand tout est déjà divisé en deux fichiers ? Je ne sais pas comment le faire en R, personne n'a pu me l'expliquer, je dois être stupide.

Peut-être est-il plus facile d'utiliser https://www.cs.waikato.ac.nz/ml/weka/downloading.html si vous n'avez pas le temps d'étudier la programmation ?

Weka 3 - Data Mining with Open Source Machine Learning Software in Java
  • www.cs.waikato.ac.nz
There are two versions of Weka: Weka 3.8 is the latest stable version, and Weka 3.9 is the development version. For the bleeding edge, it is also possible to download nightly snapshots. Stable versions receive only bug fixes, while the development version...
 
SanSanych Fomenko:

Mais voici un modèle différent :

Le résultat est que TOUT le reste, bien que le modèle soit qualitativement différent, devrait mal fonctionner sur vos données.


Nous devons mettre la randomForest à niveau.

Compris, merci, alors je vais m'occuper des arbres et des forêts - je les aime beaucoup et idéologiquement.

SanSanych Fomenko:

Pourquoi diviser le dossier, si tout est déjà divisé en deux dossiers ? Je ne sais tout simplement pas comment le faire en R, personne n'a pu me l'expliquer, apparemment stupide.

Diviser est un jeu d'enfant, le problème c'est le préjugé contre R.


J'espère vraiment que le réseau sera capable de surpasser les performances d'un conseiller expert optimisé sur l'historique :)

Pourquoi le réseau ?

Je n'ai pas de préjugés, j'ai juste une mauvaise connaissance de la langue, pas d'AIDE russe (j'ai un livre, mais le livre doit être lu, contrairement à l'AIDE, et je ne suis pas sûr de ce qui est nécessaire là), donc c'est un problème pour apprendre. Et on ne comprend pas pourquoi les gens n'aiment pas autant les interfaces graphiques - elles permettent de gagner du temps...

Et à propos du réseau, je me suis mal exprimé, c'est juste à propos du MO en général.

 
Maxim Dmitrievsky:

Où as-tu ramassé autant de farthers ? Les as-tu sélectionnés manuellement pour qu'ils correspondent à la stratégie ? c'est fou :)

la logique de l'échafaudage devrait être la même.

J'ai choisi ces prédicteurs en raison de mon expérience amère du trading manuel, lorsque j'ai perdu de l'argent et que je ne comprends pas pourquoi j'ai fait une erreur en entrant sur le marché. J'ai un problème - je n'aime pas perdre de l'argent et j'ai donc du mal à fermer une position, ce qui me cause beaucoup de problèmes si je négocie à la main. Après de tels événements, on travaille dur, on teste, on analyse, on cherche une solution pour éviter une perte - on génère des idées, on les vérifie dans le passé, on en rejette certaines, et pas d'autres. Beaucoup d'idées restent inappliquées en raison de la difficulté que j'ai à les programmer, mais elles restent sur le papier, les papiers remplissent la table...

Merci pour la réponse rassurante concernant l'échafaudage !

 
Roffild:

Peut-être qu'il est plus facile d'utiliser https://www.cs.waikato.ac.nz/ml/weka/downloading.html, s'il est ennuyeux d'étudier la programmation ?

J'ai ce siècle - je ne sais juste pas comment l'utiliser !

Et, ensuite, comment le faire fonctionner avec MT5 ?

 

Tout ceci ***, en général Rattle a formé la forêt en 2015, les paramètres par défaut, a donné ce résultat

Summary of the Random Forest Model
==================================

Number of observations used to build the model: 98573
Missing value imputation is active.

Call:
 randomForest(formula = as.factor(arr_Buy) ~ .,
              data = crs$dataset[crs$sample, c(crs$input, crs$target)],
              ntree = 500, mtry = 8, importance = TRUE, replace = FALSE, na.action = randomForest::na.roughfix)

               Type of random forest: classification
                     Number of trees: 500
No. of variables tried at each split: 8

        OOB estimate of  error rate: 6.89%
Confusion matrix:
      -1     0     1 class.error
-1 24452  2147    27  0.08164952
0   1138 42398  1180  0.05183827
1     36  2265 24930  0.08449928

J'ai appris le fichier csv pour tester le modèle sur d'autres données à charger (pour ce fichier devrait être ouvert d'abord, comme un fichier pour travailler avec les données, et ensuite exporté et déjà ce fichier exporté à ouvrir dans l'onglet Évaluer) - chargé pour 2016.

J'ai obtenu ce résultat terne


Error matrix for the Random Forest model on Pred_027_2015_H2_T_sample.csv (counts):

      Predicted
Actual   -1     0    1 Error
    -1 4640 30809 4303  88.3
    0  5210 54059 6090  17.3
    1  3237 28118 5466  85.2

Error matrix for the Random Forest model on Pred_027_2015_H2_T_sample.csv (proportions):

      Predicted
Actual  -1    0   1 Error
    -1 3.3 21.7 3.0  88.3
    0  3.7 38.1 4.3  17.3
    1  2.3 19.8 3.9  85.2

Overall error: 54.7%, Averaged class error: 63.6%

Qu'est-ce que cette reconversion, ces mauvais réglages, ce marché radicalement différent ?

Alors pourquoi j'obtiens de meilleurs résultats sur l'arbre dans Deductor Studio avec les mêmes données ?


 

Bienvenue dans le monde du curvafitting

Au fait, j'ai fait un tour dans EMD - la décomposition doit être faite à chaque nouvelle barre, ce qui rend le mode f-u bruyant car tous les mods rebondissent au fur et à mesure que de nouvelles données sont ajoutées. C'est absurde, cela ne convient que pour des cas isolés.

un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens un non-sens.
 
Maxim Dmitrievsky:

Bienvenue dans le monde du curvafitting

Au fait, j'ai fait un tour dans EMD - la décomposition doit être faite à chaque nouvelle barre, ce qui rend le mode f-u bruyant car tous les mods rebondissent avec l'ajout de nouvelles données. C'est absurde, cela ne convient qu'à des cas ponctuels.

J'ai découvert une nouvelle façon de gérer les positions

Au début, je pensais, ça y est, je me suis fait gronder ici, il s'avère que le mot composé a un sens différent....

Pensez-vous que le problème est que ma sortie ne se fait pas par modèle, mais par stop loss et que cela fausse sérieusement le résultat ?

En ce qui concerne EMD, j'ai une idée pour utiliser cette approche pour créer des canaux de contre-tendance...

Quelle est la nouvelle façon de gérer les postes ?
 
Aleksey Vyazmikin:

Au début, j'ai pensé que ça y est, je me suis fait gronder ici, mais il s'avère que le mot composé a une autre signification...

Pensez-vous que c'est parce que ma sortie n'est pas basée sur un modèle, mais sur un stop-loss, ce qui fausse considérablement le résultat ?

En ce qui concerne EMD, j'ai eu l'idée d'utiliser cette approche pour créer des canaux de contre-tendance...

Quelle est la méthode de gestion de la position ?

L'EMD dans la dynamique ne peut pas du tout être appliquée pour les raisons ci-dessus.

C'est une longue explication de la méthode, tout est lié à RL.

Oui et dans votre cas - le résultat est attendu sur de nouvelles données. C'est presque toujours le cas. Partiellement résolu par des ensembles de modèles indépendants
 
Aleksey Vyazmikin:

J'ai obtenu un résultat si terne


Qu'est-ce que cette reconversion, ces mauvais réglages, ce marché radicalement différent ?

Alors pourquoi est-ce que j'obtiens de meilleurs résultats sur l'arbre dans Deductor Studio avec les mêmes données ?



Principale preuve du recyclage : je n'ai PAS trouvé de prédicteurs bruités - tout est bruité, c'est pourquoi de si bons résultats en formation.

 
Maxim Dmitrievsky:

L'EMD ne peut pas du tout être utilisé en dynamique pour les raisons décrites ci-dessus.

le chemin est long à expliquer, tout est entrelacé avec RL

Et dans votre cas - le résultat est attendu sur de nouvelles données. C'est presque toujours le cas. Partiellement résolu par des ensembles de modèles indépendants

Je vais ajouter quelques prédicteurs supplémentaires et passer aux ensembles..... et alors les tambourins et la danse commenceront.