L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1801

 
Aleksey Vyazmikin:

Il doit y avoir un algorithme, car il s'avère que pour 15000 éléments de 3 combinaisons, nous devons garder le tableau en mémoire pendant 4 téraoctets ! Et encore plus, ai-je calculé, si nous dépensons 8 bits par élément.

Il nous reste alors une option où nous ne stockons pas ce tableau en mémoire, mais où nous le recalculons depuis le début jusqu'à la ligne (colonne) souhaitée à chaque appel. Au lieu d'une énorme consommation de mémoire, il y aura une énorme consommation de temps. C'est assez standard pour les problèmes combinatoires.

 
mytarmailS:

regardé...

Le fichier de la balance courante ne contient pas de prix, les prix que vous m'avez envoyés précédemment ne correspondent pas à la taille de la balance courante.


L'annexe contient à la fois la balance et l'OHLCV dans un seul fichier - c'est peut-être plus pratique de cette façon.

J'avais vérifié qu'il n'y avait pas d'erreur dans l'indicateur et c'était donc le cas - je dois encore traiter les indicateurs séparément - eh.

Dossiers :
Balans_OHLCV.zip  6871 kb
 
Aleksey Nikolayev:

Cela nous laisse l'option de ne pas stocker le tableau en mémoire, mais de le recalculer depuis le début jusqu'à la ligne (colonne) que nous voulons. Au lieu d'une énorme consommation de mémoire, il y aura une énorme consommation de temps. Il s'agit d'une situation assez classique pour les problèmes combinatoires.

S'il existe une séquence, il doit y avoir une formule ou une solution plus rapide que de passer en revue tous les points. La surenchère est tout aussi inefficace à appliquer.

En fait, il s'agit d'une fonction avec des points connus...

Je pense que vous pouvez définir des zones et construire une table sur leurs frontières. Supposons qu'il y ait un motif pour chaque 10000 éléments, alors comptez à partir de ce point. Il est étrange qu'une telle tâche ne soit pas résolue.
 
Aleksey Vyazmikin:

Je pense qu'il est possible de définir des zones, puis de construire une table en fonction de leurs limites. Supposons qu'il y ait un motif pour chaque 10000 éléments, alors comptez à partir de ce point.

Eh bien, oui, vous pouvez stocker non pas le tableau entier, mais une version très réduite de celui-ci et commencer à compter à partir de la ligne la plus proche.

Mais qu'allez-vous faire avec autant de combinaisons ?

 
Aleksey Nikolayev:

Eh bien, oui, vous pouvez stocker une version fortement amincie d'un tableau, plutôt que le tableau entier, et lire jusqu'au bon endroit, en commençant par la ligne la plus proche.

Mais qu'allez-vous faire avec autant de combinaisons ?

L'historique de chaque combinaison sera vérifié et un verdict sera rendu : poubelle ou réserve.

Idéalement, je pense, serait sélectionné environ 1k feuilles - souches, qui devraient être vérifiés pour la similitude entre eux, laisser unique, je pense dans le voisinage de 10k sera à gauche. Et à partir de ces restes de groupes de collecte pour le commerce (cette méthode, je l'ai déjà mis en œuvre).

Par conséquent, si je ramasse des feuilles plus efficaces que ce que je peux obtenir d'un arbre (de nombreux arbres), alors cette méthode a droit à la vie, mais si ce n'est pas le cas, alors la méthode de la cupidité est plus efficace.

 

Pouvez-vous recommander un forum sur Python et l'apprentissage automatique où l'on peut poser des questions d'ordre général ?

 
Vladimir Karputov:

Pouvez-vous suggérer un forum sur Python et l'apprentissage automatique où l'on peut poser des questions d'ordre général ?

www.cyberforum.ru

Les questions montrent qu'il s'agit d'un forum d'étudiants et le forum est actif - de nouveaux fils de discussion tous les jours.

faites semblant d'être un étudiant, vous aurez l'air d'un des vôtres :)

 
Aleksey Vyazmikin:

L'historique de chaque combinaison sera vérifié et un verdict sera rendu : poubelle ou réserve.

Idéalement, je pense, environ 1k feuilles - souches, qui devraient être vérifiés pour la similitude entre eux, laisser unique, je pense qu'environ 10k restera. Et à partir de ces restes de groupes de collecte pour le commerce (cette méthode, je l'ai déjà mis en œuvre).

Par conséquent, si je ramasse des feuilles plus efficaces que ce que je peux obtenir de l'arbre (de nombreux arbres), alors cette méthode a droit à la vie, et si ce n'est pas le cas, alors la méthode de la cupidité est plus efficace.

La surenchère totale est une route qui ne mène nulle part. Consultez le paquet rBayesianOptimization. Pour votre problème, cela peut vous aider.

Quant aux combinaisons, voir le paquet pracma::combs(), randcombs(), perms(), randperm()/.

Bonne chance

 
Vladimir Perervenko:

Une surenchère totale est une route qui ne mène nulle part. Voir le paquet rBayesianOptimization. Cela peut vous aider à résoudre votre problème.

Pour les combinaisons, voir le paquet pracma::combs(), randcombs(), perms(), randperm()/.

Bonne chance

Pourquoi la route ne mène-t-elle nulle part ? Pour moi, il s'agit de trouver un point de référence permettant d'évaluer les méthodes de construction de modèles plus rapides.

Merci pour la suggestion d'utiliser des paquets pour R, mais je ne suis pas doué pour cela, du tout.

Pensez-vous également qu'il est impossible d'obtenir la valeur d'une combinaison d'ensembles à partir d'un ensemble sans boucle ?

 
Aleksey Vyazmikin:

Pourquoi la route qui ne mène nulle part ? Pour moi, il s'agit de trouver un point de référence permettant d'évaluer les méthodes de construction de modèles plus rapides.

Merci pour la suggestion d'utiliser des paquets pour R, mais je ne suis pas doué pour cela, pas du tout.

Pensez-vous également qu'il est impossible d' obtenir la valeur d'une combinaison d'un ensemble à partir d'un ensemble sans cycle ?

S'il s'agit d'un système numérique, alors vous pouvez obtenir la combinaison de bits 01101101.

vous pouvez facilement obtenir la combinaison de bits 01101101 à partir de 109 sans essayer toutes les variantes.