L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3254
Vous manquez des opportunités de trading :
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Inscription
Se connecter
Vous acceptez la politique du site Web et les conditions d'utilisation
Si vous n'avez pas de compte, veuillez vous inscrire
Serait-il efficace de lire SQL ?
Jamais de la vie
....
Essayez Apache Arrow ou DuckDB.
mais la RAM reste le moyen le plus rapide.
.....
Le problème lui-même est résolu par G...laid, votre problème est la matrice cor., qui n'est pas nécessaire.
Il existe une fonction de calcul de la double corrélation dans alglib. Je pense qu'il suffit de changer toutes les variables en char/uchar et tout fonctionnera. Il y a des dizaines d'autres fonctions utilisées qui devraient également être refaites. Et à partir de CMatrixDouble, nous devrions passer à des tableaux dynamiques ou quelque chose d'autre.
//| INPUT PARAMETERS: |
//| X - array[N,M], sample matrix: |
//| * J-th column corresponds to J-th variable |
//| * I-th row corresponds to I-th observation |
//| N - N>=0, number of observations: |
//| * if given, only leading N rows of X are used |
//| * if not given, automatically determined from input |
//| size |
//| M - M>0, number of variables: |
//| * if given, only leading M columns of X are used |
//| * if not given, automatically determined from input |
//| size |
//| OUTPUT PARAMETERS: |
//| C - array[M,M], correlation matrix (zero if N=0 or N=1) |
//+------------------------------------------------------------------+
static bool CBaseStat::PearsonCorrM(const CMatrixDouble &cx,const int n,
const int m,CMatrixDouble &c)
Et si vous avez un programme fait maison, vous devrez aussi faire de la quantification, si vous n'avez pas un paquetage prêt à l'emploi qui le fait.
Je pense que je suis stupide... c'est très rapide de calculer avec Nampai ) c'est long et ça prend de la mémoire de calculer avec Panda. Je revérifierai tout plus tard.
pas de motif, les motifs sont recherchés par la matrice corr.
Il y a peut-être quelque chose que je ne comprends pas.
Il y a peut-être quelque chose que je ne comprends pas.
Motif = un ensemble d'échantillons présentant une forte corrélation entre eux.
Il peut y avoir de nombreux modèles de ce type dans l'ensemble des données, chacun avec un nombre différent de coïncidences dans l'histoire.
Sans matrice, vous ne trouverez rien, ou vous ne choisirez qu'une partie fragmentée, et je compte toutes les variantes possibles.
Il faut donc prendre chaque ligne et calculer la corrélation avec toutes les autres lignes, ce qui donne une matrice.Motif = ensemble complet d'échantillons présentant une forte corrélation entre eux
Il peut y avoir de nombreux ensembles de ce type dans l'ensemble des données.
Sans matrice, vous ne trouverez rien, ou vous ne choisirez qu'une partie fragmentée, et je compte toutes les variantes possibles.
Il faut donc prendre chaque ligne et calculer la corrélation avec toutes les autres, ce qui donne une matrice.En général, c'est similaire au clustering.
Ici, la similarité des exemples est maximisée.
.
La classification/régression dans les arbres maximise la similarité future de ces exemples. Elle aggrave la similarité passée.
J'ai également fait une chose similaire il y a longtemps, mais je la refais maintenant avec de nouvelles idées.
Motif = l'ensemble des échantillons présentant une forte corrélation entre eux
Il peut y avoir de nombreux modèles de ce type dans l'ensemble de la base de données, chacun ayant un nombre différent de correspondances dans l'historique.
Sans matrice, vous ne trouverez rien, ou vous ne choisirez qu'une partie fragmentée, et je compte toutes les variantes possibles.
Il faut donc prendre chaque ligne et calculer la corrélation avec toutes les autres lignes pour obtenir une matrice.Nous avons des données tridimensionnelles.
Une ligne est une observation, une colonne est un trait.
La première ligne correspond aux données les plus récentes.
Nous pouvons calculer la corrélation de la dernière ligne avec chacune des autres lignes.
Nous obtenons ainsi un "modèle de similarité" entre la dernière ligne/la ligne actuelle et l'historique.
On peut aussi faire du clustering et obtenir quelque chose comme ça.
Mais je ne comprends pas pourquoi nous avons besoin de compter toute la matrice de corrélation si nous n'avons besoin que de l'état des choses en ce qui concerne la ligne actuelle/dernière ligne.
Quelle est la profondeur de la pensée ici ?
Est-ce que nous allons trouver tous les modèles en même temps ? Avons-nous besoin de tous les modèles ? Ou avons-nous besoin de celui qui correspond à la situation actuelle et à la dernière observation ?
Avons-nous des données tridimensionnelles
Une ligne est une observation, une colonne est une caractéristique.
La première ligne correspond aux données les plus récentes.
Vous pouvez calculer la corrélation entre la dernière ligne et chacune des autres lignes.
Nous obtenons ce "modèle de similarité" entre la dernière ligne et l'historique.
Vous pouvez également procéder à un regroupement et obtenir quelque chose comme cela.
Mais je ne comprends pas pourquoi nous devons calculer toute la matrice de corrélation si nous n'avons besoin que de l'état des choses par rapport à la ligne actuelle/dernière ligne.
Quelle est la profondeur de la réflexion ?
Est-ce que nous allons trouver tous les modèles en même temps, et nous avons besoin de tous les modèles ou nous avons besoin de celui qui correspond à la situation actuelle et à la dernière observation ?
Il n'y a pas de situation actuelle, il s'agit simplement d'une recherche historique.
Ensuite, vous triez les modèles en fonction de vos métriques, puis vous cousez les meilleurs dans le robot.
il n'y a pas d'actualité, c'est juste une recherche historique
Pourquoi voudriez-vous voir tous les motifs de l'historique si, à un moment donné, vous ne pouvez vous trouver que dans un seul motif, et non dans tous....
Ou est-ce que je ne comprends pas quelque chose ?
Pourquoi voudriez-vous voir tous les motifs de l'historique si, à un moment donné, vous ne pouvez vous trouver que dans un seul motif, et non dans tous ?
Ou est-ce que je ne comprends pas quelque chose ?
il faut encore les passer toutes en revue et choisir les meilleures pour les vérifier avec les nouvelles données.
#32456