L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 1292

 
Graal:

Les volumes aident à prédire le changement d'état de tendance à plat mais pas "sans difficulté", en général la prédiction de l'état "tendance/plat" n'est pas beaucoup plus précise que la direction du prochain incrément, par unité de temps, quelque part autour de 57% en précision, ce qui a été dit à propos de certains chiffres incroyables, clairement le résultat d'une erreur.

Quels sont ces chiffres ?

 

L'apprentissage automatique est une activité étrange et imprévisible, après tout. En continuant le travail de débogage avec CatBoost, j'ai obtenu un modèle qui fonctionne comme ceci (formation+test+examen)

Il n'y a peut-être pas beaucoup d'opérations (346) de 2014 à 2019, mais cela représente un drawdown de 1299 sur toute la période, soit moins de 10 %. Bien sûr, il y a eu une forte hausse en 2014, qui pourrait ne pas se reproduire, mais après cela, c'est plutôt lisse.

Voici un graphique portant uniquement sur l'échantillon de l'examen (conditionnel, car l'échantillon est plus petit que ce test)

Mais je ne fais pas que montrer les graphiques, ce n'est pas rare ici, et je tiens à dire que j'ai été très surpris lorsque j'ai regardé le contenu du modèle - seuls 4 prédicteurs sur 38 y sont utilisés !

TimeH - temps en heures

DonProcVisota_M15 - Largeur relative du canal donchien à M15

LastBarPeresekD_Down_M15 - Nombre de barres depuis le dernier franchissement du canal de Donchian.

BB_PeresekN_Total_M1 - Nombre de fois où le prix a franchi les niveaux iDelta au cours des x dernières barres.

Bien sûr, j'ai un grand nombre de prédicteurs dans mon échantillon, je les fractionne et je les passe au crible, et tout cela correspond à ma théorie selon laquelle diviser un échantillon par l'avidité n'est pas toujours efficace - c'est juste une méthode qui ne garantit rien.

C'est le genre de modèle que je veux collectionner et mettre en commun.

 
Aleksey Vyazmikin:

L'apprentissage automatique est une activité étrange et imprévisible, après tout. En continuant le travail de débogage avec CatBoost, j'ai obtenu un modèle qui fonctionne comme ceci (formation+test+examen)

Il n'y a peut-être pas beaucoup de transactions (346) de 2014 à 2019, mais cela représente 1299 tirages sur l'ensemble du temps, soit moins de 10 %. Bien sûr, il y a eu une forte hausse en 2014, qui pourrait ne pas se reproduire, mais après cela, c'est plutôt lisse.

Voici un graphique portant uniquement sur l'échantillon de l'examen (conditionnel, car l'échantillon est plus petit que ce test)

Mais je ne fais pas que montrer des graphiques, ce n'est pas rare ici, et je tiens à dire que j'ai été très surpris lorsque j'ai regardé le contenu du modèle - seuls 4 prédicteurs sur 38 y sont utilisés !

TimeH - temps en heures

DonProcVisota_M15 - Largeur relative du canal donchien à M15

LastBarPeresekD_Down_M15 - Nombre de barres depuis la dernière fois que le canal de Donchian a été traversé

BB_PeresekN_Total_M1 - Nombre de fois où le prix a franchi les niveaux iDelta au cours des x dernières barres.

Bien sûr, j'ai un grand nombre de prédicteurs dans mon échantillon, je les fractionne et je les passe au crible, et tout cela correspond à ma théorie selon laquelle diviser un échantillon par l'avidité n'est pas toujours efficace - c'est juste une méthode qui ne garantit rien.

C'est le genre de modèle que je veux collectionner et mettre en commun.

Comme on pouvait s'y attendre, la plupart des prédicteurs sont en fait du bruit ou sont corrélés entre eux.

Le trottoir, c'est quoi ? Yandex ne parle que de la distribution de torrents.
 
elibrarius:
Comme on pouvait s'y attendre, la plupart des prédicteurs sont en fait du bruit ou sont corrélés entre eux.

De côté, c'est quoi ? Yandex ne parle que de la distribution de torrents.

L'idée n'est pas qu'il s'agit de bruit, mais que certains prédicteurs en recouvrent d'autres - les relations formées sont importantes et doivent être générées.

Sideways, c'est bien sûr un terme que j'ai inventé pour moi-même - j'applique le drapeau--random-seed avec une valeur numérique spécifique. Certes, je ne connais pas les plages de cette valeur, mais je constate qu'elle a un effet significatif sur l'apprentissage, et cette randomisation contrôlée me convient parfaitement.

 
Bonjour, les gars. Je veux connaître l'indicateur qui fait un graphique de fonds par les résultats des tests de stratégie dans le testeur. Je n'arrive pas à le trouver... Je m'en souviens. Si quelqu'un l'a à portée de main, envoyez-le moi. Merci !
 
Aleksey Vyazmikin:

Sitting, bien sûr, est un terme que j'ai inventé pour moi-même - j'applique le drapeau--random-seed avec une valeur numérique spécifique. Bien que je ne sache pas quelles sont les fourchettes de cette valeur, je constate qu'elle a un effet significatif sur l'apprentissage, et cette randomisation contrôlée me convient parfaitement.

Correction du caractère aléatoire. Habituellement, cela est utilisé pour la reproductibilité des résultats dans les réexamens.
De préférence, cela ne devrait pas trop affecter le résultat. Sinon, vous obtenez un ajustement à un caractère aléatoire particulier. C'est-à-dire qu'il apparaît une autre caractéristique (affectant de manière significative), qui doit être optimisée.
 
Renat Akhtyamov:

Quel genre de chiffres ?

Je pense avoir vu quelqu'un plus haut qui a dit que les tendances/flottaisons sont prédites par presque 90%, le petit-fils ou l'apprenti de quelqu'un je pense qu'il a dit.

 
Graal:

Je pense que j'ai vu quelqu'un plus haut qui a dit que les tendances/plats sont prédits par presque 90%, le petit-fils ou l'apprenti de quelqu'un a dit ça

Ouais, 100% qu'il va y avoir une tendance après un appartement. Qu'y a-t-il à prévoir ?
 
Graal:

je pense avoir vu quelqu'un au-dessus qui a dit que les tendances/flottaisons sont prédites par presque 90%, le petit-fils ou l'apprenti de quelqu'un je pense qu'il a dit

aah

S'il n'y a pas de tics, le marché est probablement plat, à 100%.

et s'il y a beaucoup de tics, ce n'est pas un plat.
 
elibrarius:
Correction du caractère aléatoire. Ceci est généralement utilisé pour la reproductibilité des résultats lors des redémarrages.
Il est préférable que cela n'affecte pas trop le résultat. Sinon, vous obtenez un ajustement à un caractère aléatoire particulier. C'est-à-dire qu'il apparaît une autre caractéristique (affectant de manière significative), qui doit être optimisée.

Oui, j'en ai besoin pour reproduire le résultat ultérieurement et pour générer des résultats en général.

Je comprends que ce paramètre est responsable du caractère aléatoire des résultats du fractionnement lors de la sélection de la meilleure option, mais je ne trouve nulle part les détails.

Et à propos de l'ajustement... Nous devons supposer que tout est un ajustement potentiel, et nous ne pouvons que vérifier la stabilité des connexions dans le temps et contrôler l'efficacité de ces connexions. Par exemple, ce modèle se compose de 4 arbres, chacun d'entre eux ayant également 4 profondeurs, c'est-à-dire qu'en raison du petit nombre de combinaisons, l'ajustement est ici très efficace, et peut donc constituer une sorte de modèle, et pas seulement une description de l'échantillon.