L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 838

 
Mihail Marchukajtes:

En général, j'utilise ce paquet particulier pour sélectionner les prédicteurs. Il est clair qu'il y a des inconvénients, notamment le manque d'interaction de plusieurs prédicteurs par rapport à la cible. Mais dans l'ensemble, c'est suffisant pour mon optimisation jusqu'à présent... Donc s'il existe d'autres paquets pour le prétraitement des données, je les prendrais volontiers en considération...

D'après mon expérience, je peux recommander le paquet RandomUniformForest comme étant celui qui traite de manière la plus complète et professionnelle les différents aspects de l'importance des prédicteurs. Des exemples peuvent être vus ici

Bonne chance

PS : Au fait, c'est l'une des rares applications qui vous permet de réentraîner le modèle sur de nouvelles données. Ce qui permet de gagner beaucoup de temps.

 
Dr. Trader:

Une nouvelle tournée chaque semaine. En une semaine, vous devez entraîner le modèle et leur envoyer les prédictions. Mais l'estimation prévisionnelle de votre modèle ne sera connue qu'après trois autres semaines, vos prévisions seront comparées aux données réelles de ces trois semaines.

Je pense qu'ils gardent au moins 90%.

Que voulez-vous dire par "je pense qu'ils gardent au moins 90%" ? Pensez-vous qu'ils échangent ces prévisions qui leur sont envoyées ? En général, comment trouver les signes pour calculer la prévision à l'avance ? Par interpolation ou autre ? Il est écrit dans leur document que c'est juste une "preuve de travail", comme dans l'exploitation minière, et le gagnant est choisi au hasard, probablement la moitié des résultats sont presque les mêmes, puis lancé au hasard un filtre qui classe en plus, c'est un casino honteux, et le jeu de données est probablement purement synthétique, bruyant avec une faible prépondérance du signal, il n'y a pas de marché du tout. Toutes ces conneries sur les fonds spéculatifs, etc. ne servent qu'à accroître la popularité de leurs pièces.

 
Maxim Dmitrievsky:

Alors, mikhail, avez-vous récupéré de votre frénésie, êtes-vous sur le point de commencer à évaluer vos ts de manière raisonnable et sans fanatisme ? :)

Je n'avais pas la rage. Seulement le calcul à froid, qui n'a pas changé du tout depuis la dernière fois. Sans parler de la théorie de l'approche, qui fonctionne toujours. Pendant un moment...

 
govich:

En particulier, le montant qu'ils gardent pour eux - ce n'est pas officiellement écrit. Toutes sortes de magazines financiers ont écrit sur un bénéfice de 1,5 million en 2016, et si vous comparez la part qu'ils versaient aux participants, ce n'est pas grand-chose.

> Pensez-vous qu'ils échangent ces prévisions qui leur sont envoyées ?
Oui, c'est la stratégie. Par exemple, je vais créer un tas de caractéristiques, créer une feuille de calcul d'entraînement, les envoyer sur le forum, 10 personnes donneront leurs prévisions et je négocierai en fonction de celles-ci - c'est aussi simple que cela.
Ils n'ont pas eu leur propre crypto pendant longtemps, ils payaient en bitcoins. Ils ont juste pris quelques milliers de dollars en bitcoins chaque semaine pendant un an. Puis ils ont sorti leur propre crypto pour ne pas avoir à s'occuper des bitcoins.

> Comment connaître à l'avance les signes sur lesquels calculer la prévision ? Est-ce une interpolation ?
Interpolation, prédiction par les plus proches voisins, regroupement, les options sont nombreuses, mais elles ne vous donneront pas de réponse précise, vous ne pouvez que deviner.

 
Vladimir Perervenko:

D'après mon expérience, je peux recommander le paquet RandomUniformForest comme étant le moyen le plus complet et le plus professionnel de traiter les différents aspects de l'importance des prédicteurs. Des exemples peuvent être trouvés ici

Bonne chance

PS : Au fait, c'est l'une des rares applications qui vous permet de réentraîner le modèle sur de nouvelles données. Ce qui permet de gagner beaucoup de temps.

Je l'ai essayé. Je n'ai pu obtenir aucun résultat.

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

En 5 minutes, il génère.
Erreur dans OOB.votes - Y : matrices multidimensionnelles non similaires

Structure des matrices à alimenter :

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Ce n'est pas clair - similitude de ce qu'il faut avec ce qu'il faut.
J'ai essayé sans xtest = x2, ytest = y2 - même résultat.
On passe au paquet suivant.

 
elibrarius:

Je l'ai essayé. Je n'ai obtenu aucun résultat...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

Après 5 minutes.
Erreur dans l'OOB.

La structure des matrices en cours d'alimentation :

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Ce n'est pas clair - la similitude de ce qu'il faut avec ce qu'il faut.
J'ai essayé sans xtest = x2, ytest = y2 - même résultat.
On passe au paquet suivant.

Je ne sais pas pourquoi ça n'a pas marché, ça marche pour moi.

J'ai obtenu de bons résultats dans le caret. Il existe trois fonctions de sélection des prédicteurs, qui ont des efficacités différentes et consomment des ressources informatiques diverses.


Il existe un autre paquet très intéressant - CORElearn. Ce paquet contient deux fonctions pour sélectionner les prédicteurs. Je les ai utilisées ensemble et elles donnent de très bons résultats sur mes prédicteurs. Particulièrement curieux est attrEval avec un ensemble absolument fantastique de méthodes d'évaluation de sélection, parmi lesquelles une place spéciale est le groupe Relief, qui évalue non seulement une observation (chaîne) mais aussi les chaînes les plus proches.


Bonne chance.


PS.

N'oubliez pas que la sélection des prédicteurs doit comporter au moins les étapes suivantes :

  • Sélection par : prédicteurs pertinents pour la cible. Wizard a donné ici un lien vers la théorie de cette étape. On peut distinguer deux méthodes : la statistique et l'entropie. Pour les deux, il y avait un code ici
  • sélection par paquets énumérés qui ne sont PAS pertinents pour le futur modèle
  • Sélection qui se fait sur les résultats du modèle. Très efficace dans les modèles linéaires. Par exemple, avec glm, nous ne sélectionnons que les prédicteurs significatifs et ne les intégrons qu'au réseau. Le résultat peut être surprenant.


Avant de sélectionner les prédicteurs, il peut être nécessaire d'effectuer un prétraitement, par exemple un centrage. Il est bien décrit dans l'articlede Vladimir Perervenko.

 
elibrarius:

Je l'ai essayé. Je n'ai obtenu aucun résultat...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

Après 5 minutes.
Erreur dans l'OOB.

La structure des matrices en cours d'alimentation :

> str(x1)
num [1:20000, 1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Ce n'est pas clair - la similitude de ce qu'il faut avec ce qu'il faut.
J'ai essayé sans xtest = x2, ytest = y2 - même résultat.
On passe au paquet suivant.

Pouvez-vous afficher les jeux originaux ?

Vous devez préciser qu'il ne s'agit pas d'une régression, car votre cible n'est pas un facteur. Ajouter des paramètres

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, regression = FALSE)

ou

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

Bonne chance

 
SanSanych Fomenko:

Il existe un autre paquet très intéressant : CORElearn. Il y a deux fonctions dans ce paquet pour sélectionner les prédicteurs, je les ai utilisées en paires, elles donnent de très bons résultats sur mes prédicteurs. Particulièrement curieux est attrEval avec un ensemble absolument fantastique de méthodes d'évaluation de sélection, parmi lesquelles une place spéciale est le groupe Relief, qui évalue non seulement une observation (chaîne) mais aussi les chaînes les plus proches.


D'accord. En principe, il s'agit probablement du paquet le plus sérieux pour la RF. Vous devriez prêter attention au développeur Marko Robnik-Sikonja.

Bonne chance

 
Vladimir Perervenko:

Pouvez-vous afficher les jeux originaux ?

Vous devez préciser qu'il ne s'agit pas d'une régression, car votre cible n'est pas un facteur. Ajouter des paramètres

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, regression = FALSE)

ou

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

Bonne chance

Ça a aidé. Merci !
 
Dr. Trader:

Le montant précis qu'ils conservent pour eux-mêmes n'est pas consigné officiellement. Toutes sortes de magazines financiers ont écrit sur 1,5 million de bénéfices en 2016, et si vous comparez la part qu'ils versaient aux participants, ce n'est pas grand-chose.

> Pensez-vous qu'ils échangent ces prévisions qui leur sont envoyées ?
Oui, c'est toute la stratégie. Par exemple, je vais créer un tas de caractéristiques, créer une feuille de calcul d'entraînement, les envoyer au forum, 10 personnes donneront leurs prévisions et je négocierai en fonction de celles-ci - tout est simple.
Ils n'ont pas eu leur propre crypto pendant longtemps, ils payaient en bitcoins. Ils ont juste pris quelques milliers de dollars en bitcoins chaque semaine pendant un an. Puis ils ont sorti leur propre crypto pour ne pas avoir à s'occuper des bitcoins.

> Comment connaître à l'avance les signes pour lesquels on peut calculer la prévision ? Est-ce une interpolation ?
Si vous ne connaissez pas la réponse exacte, vous ne pouvez que deviner.

1.5m$ c'est des centimes, comme pour Entire Kantor, j'ai entendu dire qu'à ce moment là quand ils ont placé leur crypto sur l'échange, certains participants (qui étaient au top) ont pris si ce n'est des millions$, alors des centaines de milliers$, vous pouviez obtenir la première place une fois et 4000NMR pour 200$ par pièce = 800.000k$, mais cette balle s'est rapidement épuisée et NMR s'est écrasé et a commencé à donner moins de pièces, mais peut-être quelqu'un a eu de la chance.

IMHO je pense qu'au début ils ont peut-être essayé d'échanger des prévisions, et même les endroits où il y en avait étaient plus ou moins prévisibles, probablement 90% de l'argent ils se payaient eux-mêmes, la plupart des cent premiers étaient probablement leurs gars, l'argent ne fuyait pas vers qui sait quoi. Mais maintenant, c'est un pur casino avec "preuve de travail" et beaucoup d'aléatoire, c'est du moins ce que dit la rumeur.


PS : avant leur pièce, ils payaient 6k$ par semaine (mais à qui ?), soit 288k$ par an, ce qui revient à cet "honnête" ~20% de 1,5m de bénéfices pour les quants))). Mais clairement, tous ces chiffres, peuvent être fabriqués.