L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2374

 

Marquage de l' accord Prada

4 simple ways to label financial data for Machine Learning ⋆ Quantdare
4 simple ways to label financial data for Machine Learning ⋆ Quantdare
  • quantdare.com
We have seen in previous posts what is machine learning and even how to create our own framework. Combining machine learning and finance always leads to interesting results. Nevertheless, in supervised learning, it is crucial to find a set of appropriate labels to train your model . In today’s post, we are going to see 3 ways to transform our...
 
Maxim Dmitrievsky:

Marquage de l' accord Prada.

Ce truc est plus intéressant. Je ne comprends pas, est-ce que ça ne fonctionne que depuis la ligne de commande ? Quelqu'un l'a-t-il examiné ?

SigCWGAN, a new generation GAN architecture for Time Series Generation. ⋆ Quantdare
SigCWGAN, a new generation GAN architecture for Time Series Generation. ⋆ Quantdare
  • quantdare.com
As a continuation to our last post on Time Series Signatures and our running list of posts regarding GANs and synthetic data we now want to present the Signature Conditional Wasserstein GAN, shortened as SigCWGAN, a new GAN architecture presented in [1] that is specifically designed to generate time series of arbitrary length and dimensions. 2...
 
Vladimir Perervenko:

Ce matériau est plus intéressant.

C'est un autre sujet, qui ne se limite pas aux GAN.

 
Maxim Dmitrievsky:

Marqueur d' accord Prada

Un langage obscur et des fonctions peu familières... et l'auteur est trompeur.

Par fixed_time_horizon() il y a cette ligne :

idx_lower = données[données[nom] < - seuil].index

il a écrit plus haut que

seuil : int
Le seuil constant prédéfini pour calculer les étiquettes.

Et les images ci-dessous ne sont pas int (c'est-à-dire 0,1,2,3...), mais 0,05, 0,01...

C'est devenu plus clair avec double - c'est la même chose que j'ai fait avec TP=SL=une certaine valeur de changement de prix.

Mais il n'est pas clair pourquoi j'ai appelé la méthode et la fonction fixed_time_horizon() ; où se trouve le temps fixe ? Il s'agit d'un changement de prix fixe, pas de temps.

---------

Quant à la méthode quantized_labelling() - je n'ai rien obtenu du code. Je suppose qu'il ne s'agit pas d'une valeur fixe, par exemple 0,05, mais de l'utilisation d'un quantile qui change avec la volatilité des prix.

 
elibrarius:

Un langage obscur et des fonctions peu familières... et l'auteur est trompeur.

Par fixed_time_horizon() il y a cette ligne :

idx_lower = données[données[nom] < - seuil].index

il a écrit plus haut que

seuil : int
Le seuil constant prédéfini pour calculer les étiquettes.

Et les images ci-dessous ne sont pas int (c'est-à-dire 0,1,2,3...), mais 0,05, 0,01...

Avec double - c'est devenu plus clair - c'est la même chose que j'ai fait avec TP=SL=une certaine valeur de changement de prix.

Mais il n'est pas clair pourquoi j'ai appelé la méthode et la fonction fixed_time_horizon() ; où se trouve le temps fixe ? Il s'agit d'un changement de prix fixe, pas de temps.

---------

Quant à la méthode quantized_labelling() - je n'ai rien obtenu du code. Je suppose qu'il ne s'agit pas d'une valeur fixe, par exemple 0,05, mais de la valeur du quantile qui évolue en fonction de la volatilité des prix.

Je n'ai pas regardé dans le code. L'essentiel est le balisage non pas par tableau mais par paliers. Cela conduit à un certain nombre de fonctionnalités intéressantes, par exemple, pour appliquer le balisage à un graphique comprimé ou à certains composants BP spécifiques

il doit y avoir une erreur d'impression sur l'int, ce n'est pas Prado qui a écrit cela, ce sont les types

l'horizon fixe fait référence à un décalage incrémentiel sélectionné, probablement

 
Maxim Dmitrievsky:

Je n'ai pas lu le code. La principale n'est pas le partitionnement par tableau, mais par incréments. Cela conduit à un certain nombre de fonctionnalités intéressantes, telles que l'application du partitionnement à un graphique squelched ou à des composants spécifiques de la BP.

il doit y avoir une erreur d'impression sur l'int, ce n'est pas Prado qui a écrit cela, ce sont les types

L'horizon fixe fait référence à un décalage progressif sélectionné, je suppose.

Quelqu'un là-dehors est soit Prado, soit son type.

 

Par la méthode quantized_labelling()

Je ne vois pas l'intérêt de l'enseigner. Après tout, vous pouvez apprendre la classification bien à faible volatilité et moins bien à forte volatilité. Et ensuite, une erreur de 40 % à faible volatilité + une erreur de 51 % à forte volatilité ramènera la rentabilité du système à environ 0. Parce que plusieurs petits gains peuvent être surpassés par plusieurs grosses pertes.
 
elibrarius:

Quelqu'un là-bas est stupide ou Prado ou ses semblables.

Tout est zshibizzy, nous devrions essayer, mais je le ferai différemment.

son livre est un peu différent, je pense. Je suis trop paresseux pour chercher.
 
Maxim Dmitrievsky:

C'est cool, je vais essayer, mais je vais le faire différemment.

Son livre le décrit différemment, je pense. Je suis trop paresseux pour le chercher.
TP=SL=valeur fixe J'ai essayé. Le résultat est de 50% sur de nouvelles données de validation croisée.
Sur les quantiles, je ne vois pas l'intérêt, voir le message ci-dessus.
 
elibrarius:
TP=SL J'ai essayé. Le résultat est de 50% sur de nouvelles données de validation croisée.
Sur les quantiles, je ne vois pas l'intérêt, voir le message ci-dessus.

Voici les incréments, sans sl et tp

J'ai fait ça par le biais du clustering, marqué. Globalement, la courbe sur les données balisées n'est pas très bonne, mais elle est plus robuste sur les nouvelles données.