L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 87
Vous manquez des opportunités de trading :
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Inscription
Se connecter
Vous acceptez la politique du site Web et les conditions d'utilisation
Si vous n'avez pas de compte, veuillez vous inscrire
Tous les paquets (modèles) peuvent être divisés en deux catégories :
Les performances des paquets qui sont "fondamentalement bons" sont à peu près les mêmes, les différences ne sont pas significatives.
Le problème ne vient pas du modèle, mais de l'ensemble des prédicteurs et de leur préconditionnement. Si nous prenons un ensemble de prédicteurs, la possibilité de construire un modèle NON surentraîné, ainsi que l'ampleur de l'erreur dépendent peu de la modification du modèle. Il faut donc choisir le modèle le plus simple et le plus rapide parmi ceux qui "correspondent en principe".
PS.
D'après ma propre expérience. À moi plus de 75% de l'apport de travail dans la construction de TS est la sélection des prédicteurs, si tant est qu'on arrive à prendre un tel ensemble pour une variable cible particulière.
San Sanych, bonjour.
Et si, par votre méthode, pour 3 intervalles de données qui ne se croisent pas, nous obtenons des valeurs de prédiction différentes, alors elles sont non stationnaires (bruit, etc.), devons-nous suivre ?
Tous les paquets (modèles) peuvent être divisés en deux catégories :
Les performances des paquets qui sont "fondamentalement bons" sont à peu près les mêmes, les différences ne sont pas significatives.
Le problème ne vient pas du modèle, mais de l'ensemble des prédicteurs et de leur préconditionnement. Si nous prenons un ensemble de prédicteurs, la possibilité de construire un modèle NON surentraîné, ainsi que l'ampleur de l'erreur dépendent peu de la modification du modèle. Il faut donc choisir le modèle le plus simple et le plus rapide parmi ceux qui "correspondent en principe".
PS.
D'après ma propre expérience. Plus de 75% du travail nécessaire à la construction d'une CT consiste à sélectionner les prédicteurs, si tant est qu'il soit possible de choisir un tel ensemble pour une variable cible particulière.
Quels modèles, de quoi tu parles ... c'est comme une personne qui demande "quelle heure est-il ?" et la réponse est "que voulez-vous que je danse ?":)
Ne refaites jamais, s'il vous plaît, jamais cela, il est plus facile d'écrire 10 lignes de texte que de lire deux lignes de questions.
Peut-être que quelqu'un sera intéressé, j'ai trouvé un paquet qui peut simuler le trading et construire des systèmes de trading appelé quantstrat.
http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf
San Sanych, salut.
Mais si, grâce à votre méthodologie, nous obtenons des valeurs de prédicteurs différentes sur 3 segments de données qui ne se croisent pas lors de la formation, alors elles ne sont pas stationnaires (bruit, etc.), que devons-nous faire ?
La pertinence du prédicteur n'est obtenue qu'une seule fois - lorsque le modèle est formé. Alors ce modèle est APPLICABLE, pas enseigné.
Vous devez l'enseigner plusieurs fois, si je me souviens bien ?
Pas question !
Encore une fois.
1. Nous prenons une grande quantité de prédicteurs de séries temporelles, par exemple 10 000 observations (lignes).
2. Nous le divisons en deux parties, de manière strictement mécanique : 7000 première partie et 3000 deuxième partie.
3. Nous divisons la première partie en trois parties au hasard : pour la formation, le test et la validation.
4. Nous apprenons (fit - fit) le modèle sur l'échantillon d'entraînement.
5. Appliquer le modèle formé aux échantillons de test et de validation.
6. Si sur les trois échantillons - formation, test et validation - l'erreur est approximativement égale, alors la clause 7.
7. Appliquer le modèle sur la deuxième partie, qui est une série chronologique ininterrompue dans sa séquence temporelle.
8. Si l'erreur sur cette partie aussi est à peu près égale aux trois précédentes, alors :
Pas question !
Encore une fois.
1. prendre un grand nombre de prédicteurs de séries temporelles, par exemple 10 000 observations (lignes)
2. Nous le divisons en deux parties, de manière strictement mécanique : 7000 première partie et 3000 deuxième partie.
3. Nous divisons la première partie en trois parties au hasard : pour la formation, le test et la validation.
4. Nous apprenons (fit - fit) le modèle sur l'échantillon d'entraînement.
5. Appliquer le modèle formé aux échantillons de test et de validation.
6. Si sur les trois échantillons - formation, test et validation - l'erreur est approximativement égale, alors la clause 7.
7. Appliquer le modèle sur la deuxième partie, qui est une série chronologique ininterrompue dans sa séquence temporelle.
8. Si l'erreur sur cette partie aussi est à peu près égale aux trois précédentes, alors :
Un peu, c'est juste un manque de cervelle et de temps.
Il faut commencer par la variable cible, puis sélectionner des prédicteurs pour cette variable, et enfin revérifier avec les mathématiques, etc. De toute façon, le processus est lent et je ne peux pas le formaliser.
Pas mal, mais pas assez de cervelle et de temps.
Il faut commencer par la variable cible, puis la faire correspondre à des prédicteurs, et enfin les vérifier avec les mathématiques, pour ainsi dire. En tout cas, le processus est douloureux et non formalisable pour moi.