L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 22

 
Je n'en suis pas heureux moi-même, c'est temporaire. Si j'apprends à sélectionner les paramètres des indicateurs, je passerai de la période D1 à des périodes plus petites et je pourrai obtenir beaucoup plus d'observations dans le même intervalle de temps.
 
Bonjour à tous ! Si cela intéresse quelqu'un, je vais vous parler de mes recherches...

Quant à l'idée de clustering, rien n'est sorti, en collant des pièces d'un cluster, aucune homogénéité n'a été observée, pourquoi je ne sais pas....Je pense que j'ai besoin d'étudier l'analyse spectrale avec les fréquences, les amplitudes et les phases, je pense que Fourier fera l'affaire, donc s'il y a quelqu'un qui connaît le sujet, je serai heureux de communiquer, non ! je cherche un professeur ! !! Donc, le sujet est ralenti pour l'instant

====================================

Suivant sur la recherche RF.

J'ai joué avec les paramètres du modèle RF, c'est-à-dire le nombre de splits et de kol. Mais j'ai décidé de réentraîner le même modèle avec les mêmes paramètres, je n'ai pas eu l'intelligence de sauvegarder le premier bon modèle (j'ai donc réentraîné le modèle et obtenu un résultat très moyen, puis toute la soirée j'ai réentraîné le modèle (environ 100 fois) dans l'espoir de trouver les mêmes paramètres mais hélas, le plus que j'ai pu obtenir est un tiers des résultats du premier modèle

Question : Qu'est-ce que c'était ? le recyclage aléatoire ou le modèle a attrapé une certaine dépendance forte dans les données, comment se rapporter à elle en général, sur la base de votre expérience ?Ces paramètres peuvent-ils être récupérés de quelque manière que ce soit ?

Tous les résultats que j'ai mentionnés ont été obtenus avec de nouvelles données non connues du modèle.

données totales 55 000
formation à 35 000
contrôle à 20 000
Données sur les contrats à terme du RTS, TF - 5 minutes
 
mytarmailS:

====================================

Suite de la recherche avec RF .


Question : de quoi s'agit-il ? S'agit-il d'un surentraînement aléatoire ou le modèle a-t-il détecté une forte corrélation dans les données, comment le traiter selon votre expérience ?Est-il possible de récupérer ces paramètres de quelle manière ?

Non seulement oubliez ces données, mais quand quelque chose comme ça arrive, fuyez aussi loin que possible.

PS.

Nous devons nettoyer l'ensemble initial de prédicteurs du bruit.

LeDr. Trader a essayé les principaux composants, mais il a très peu d'observations. Essayez-le. Liens ci-dessus, même le code est affiché

 
SanSanych Fomenko:

Non seulement oubliez ces données, mais quand quelque chose comme ça arrive, fuyez aussi loin que possible.


pourquoi ? argumenter
 
mytarmailS:
Bonjour à tous ! Si cela intéresse quelqu'un, je vais vous parler de mes recherches...

Quant à l'idée de clustering, rien n'est sorti, en collant des pièces d'un cluster, aucune homogénéité n'a été observée, pourquoi je ne sais pas....Je pense que j'ai besoin d'étudier l'analyse spectrale avec les fréquences, les amplitudes et les phases, je pense que Fourier fera l'affaire, donc s'il y a quelqu'un qui connaît le sujet, je serai heureux de communiquer, non ! je cherche un professeur ! !! Donc, le sujet est ralenti pour l'instant

====================================

Suivant sur la recherche RF.

J'ai joué avec les paramètres du modèle RF, c'est-à-dire le nombre de splits et de kol. Mais j'ai décidé de ré-entraîner le même modèle avec les mêmes paramètres, je n'ai pas eu l'intelligence de sauvegarder le premier bon modèle (j'ai donc ré-entraîné le modèle et obtenu un résultat très moyen, puis toute la soirée j'ai ré-entraîné le modèle (environ 100 fois) dans l'espoir de trouver les mêmes paramètres mais hélas, le plus que j'ai pu obtenir est un tiers des résultats du premier modèle

Question : Qu'est-ce que c'était ? le recyclage aléatoire ou le modèle a attrapé une forte corrélation dans les données, comment se rapporter à elle en général, dans votre expérience ?Ces paramètres peuvent-ils être récupérés de quelque manière que ce soit ?

Tous les résultats que j'ai mentionnés ont été obtenus avec de nouvelles données non connues du modèle.

données totales 55 000
formation à 35 000
contrôle à 20 000
Données sur les contrats à terme du RTS, TF - 5 minutes.

c'était une sorte d'erreur.

Pour éviter cela, gardez le journal des expériences dans le tableau : tous les paramètres d'entraînement, s'il y a une sélection d'entrées, alors les meilleures entrées, le résultat de l'entraînement, le résultat de la validation. Et vous serez heureux.

 
mytarmailS:
pourquoi ? argumenter
Ci-dessous et argumenté
 

Les gars ! S'il vous plaît aidez-nous avec des exemples de code

Disons que nous avons trois vecteurs "A", "B" , "С"

Nous devons construire automatiquement toutes sortes de différences entre eux car il y a tellement de variables...

comme :

x1 = A - B

x2 = A - C

x3 = C - B

et écrire x1,x2,x3 comme colonnes dans le cadre de données

Montrez-moi le code si vous le pouvez

 
mytarmailS:

Les gars ! S'il vous plaît aidez-nous avec des exemples de code

Disons que nous avons trois vecteurs "A", "B" , "С"

Nous devons construire automatiquement toutes sortes de différences entre eux car il y a tellement de variables...

comme :

x1 = A - B

x2 = A - C

x3 = C - B

et écrire x1,x2,x3 comme colonnes dans le cadre de données

Veuillez montrer le code si vous le pouvez.

Une variante de travail. Peut ne pas être optimal :

sampleA <- as.data.frame(matrix(round(runif(n = 51000, min = 0, max = 1)), ncol = 51))


n <- ncol(sampleA) #your columns

differences <- list()
counter <- 1
for (i in 1:n){
        for (j in 1:n){
                differences[[counter]] <-       sampleA[, i] - sampleA[, j]
                counter <- counter + 1
        }
}

diff_data <- as.matrix(do.call(rbind.data.frame, differences))

diff_data_frame <- as.data.frame(t(diff_data))
 
Alexey Burnakov:

Option de travail. Peut-être pas optimal :

Merci beaucoup, pendant que j'écrivais toutes les combinaisons possibles avec trois chandeliers et quatre prix OHLC, j'ai eu des sueurs froides à trois reprises, tellement il y a de code.
 
mytarmailS:
Merci beaucoup, pendant que j'écrivais toutes les combinaisons possibles avec trois chandeliers et 4 de leurs prix OHLC, j'ai eu des sueurs froides à trois reprises, tellement il y a de code.

Par exemple, 3 colonnes dans une fonction produisent 9 combinaisons, alors que trois suffisent, comme dans mon exemple ci-dessus.

il n'y a aucun sens à faire A/B et ensuite B/A