L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2805

 
https://habr.com/ru/post/695276/ peut être utile/intéressant pour certaines personnes
Хитрые методики сэмплинга данных
Хитрые методики сэмплинга данных
  • 2022.10.27
  • habr.com
Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть...
 

Il est parfois utile de superposer le graphique d'équilibre (bleu) au graphique des prix (orange)

Dans ce cas, il est clairement visible, par exemple, que le modèle n'a gagné que sur un marché baissier pendant 10 ans

Le modèle plus raffiné apprend de la même manière à gagner principalement sur les baisses, mais tire moins vers le bas sur les hausses et les consolidations. Comme le marché a été en baisse pendant les 10 années, l'échantillon d'apprentissage est biaisé.


 
elibrarius #:

Êtes-vous sûr qu'il sélectionne les prieurs de manière aléatoire ? Je ne faisais pas de catbusting, je regardais le code des exemples de bousting de base. Tous les prédicteurs y sont utilisés. En d'autres termes, c'est le meilleur qui est retenu. Le prédicteur corrélé sera à côté, mais légèrement moins bon. Mais à d'autres niveaux de fractionnement ou dans les arbres de correction, un autre des prédicteurs corrélés peut être meilleur.

Il existe un paramètre distinct qui permet de ne prendre qu'une partie des prédicteurs pour l'estimation - il est pris de manière aléatoire - cela augmente le nombre d'arbres de modèle, mais en théorie, cela accélère la formation.

J'en serais sûr si j'avais analysé leur code, donc je ne parle que de ce qu'ils ont déclaré - il y a une petite chance que j'aie mal compris les développeurs.

Il s'agit donc d'ajouter de la randomisation à l'évaluation fractionnée, ce qui permet d'améliorer l'apprentissage.

Le fait qu'il y ait un prétraitement pour éliminer les prédicteurs corrélés - je n'en ai pas entendu parler.

Je conviens qu'un autre prédicteur peut être meilleur ou plus utile, mais mon objectif est de former autant de modèles différents que possible. Je veux qu'ils apprennent quelque chose.

 
Maxim Dmitrievsky #:
Jetez donc quelques formules informatives pour que je les teste.

Je ne comprends pas. Dois-je vous le soumettre ou le soumettre à l'ensemble de données ? S'il s'agit de l'ensemble de données, quel est le lien avec le regroupement de données similaires ou la corrélation, puisque la cible n'est pas impliquée dans ce processus ?

 
Aleksey Vyazmikin #:

Je ne comprends pas. Dois-je vous le renvoyer ou le renvoyer à l'ensemble de données ? Si c'est dans l'ensemble de données, quel est le rapport avec le regroupement par similarité ou la corrélation, puisque la cible n'est pas impliquée dans ce processus ?

formules de calcul de bonnes fiches à reproduire en python et mql. Je ramasserai les étiquettes moi-même.

Juste pour voir, car je n'utilise que des incréments.

Je peux télécharger des bots pour eux après la formation.
 
Maxim Dmitrievsky #:

Il est parfois utile de superposer un graphique d'équilibre (bleu) à un graphique de prix (orange).

Dans ce cas, il est clairement visible, par exemple, que le modèle n'a gagné que sur un marché en baisse pendant 10 ans.

Le modèle plus raffiné apprend de la même manière à gagner principalement sur les baisses, mais tire moins sur les hausses et les consolidations. Comme le marché a été en baisse pendant les 10 années, l'échantillon d'apprentissage est biaisé.


Le prix est-il construit sur le principe des deltas entre les transactions de clôture et d'ouverture ou s'agit-il d'une sorte de rationnement du temps ?

 
Aleksey Vyazmikin #:

Le prix est-il construit sur le principe des deltas entre la clôture et l'ouverture d'une transaction ou s'agit-il d'une sorte de rationnement du temps ?

Oui, il est fixé au moment des transactions.

 
Maxim Dmitrievsky #:

des formules pour calculer les bonnes puces à reproduire en python et mql. Je récupérerai moi-même les étiquettes.

Juste pour regarder, parce que je n'utilise que des incréments.

Je peux télécharger des bots sur ces étiquettes après l'entraînement.

Vous savez que la "qualité" d'une caractéristique est déterminée par sa cible.

J'ai décrit le principe de création plus haut. Le code de MQL5 est tout en MQL5, et il n'est pas question d'une quelconque conversion par une fonction - il n'est pas possible de donner une formule.

Par exemple, l'heure de début du segment courant ZZ(48) est souvent sélectionnée.

 
Aleksey Vyazmikin #:

Vous savez que la "qualité" d'une caractéristique est déterminée par la cible.

J'ai décrit plus haut le principe de création. Le code de MQL5 est tout en MQL5, et il n'est pas question d'une quelconque conversion par une fonction - il est impossible de donner une formule.

Par exemple, l'heure de début du segment courant ZZ(48) est souvent sélectionnée.

ah, bon, surtout sur les indicateurs standards et leurs dérivés ?

 
Maxim Dmitrievsky #:

Oui, au moment où les transactions sont fixées

Essayez d'établir une majoration pour l'achat et la vente, en sélectionnant un modèle plus équilibré par le nombre d'entrées, puis divisez l'échantillon en deux et établissez deux modèles distincts.