L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3304

 

Voici une liste des modèles supportés, tirée du site lui-même

https://onnx.ai/sklearn-onnx/supported.html

Merci pour les exemples prêts à l'emploi dans l'article.

Supported scikit-learn Models#
  • onnx.ai
, # This version of the operator has been available since version 13. Absolute takes one input data (Tensor ) and produces one output data (Tensor ) where absolute value, y = abs(x), is applied to the tensor elementwise. T tensor(uint8), tensor(uint16), tensor(uint32), tensor(uint64), tensor(int8), tensor(int16), tensor(int32), tensor(int64...
 
Petros Shatakhtsyan #:


À l'époque, les courtiers ne collectaient pas encore les valeurs de tic-tac. Je l'ai fait moi-même. J'ai collecté de vrais ticks et je les ai stockés dans des fichiers en portions pendant environ 6 mois. Je les ai appliqués au testeur et j'ai obtenu une image complètement différente.


Vous avez de lachance d'avoir décidé de faire des affaires raisonnables une fois... maintenant les courtiers ne collectent plus les cotations de tiques, mais les prennent/fournissent de quelque part ; cela peut être lié aux mises à jour du serveur MT.

Parfois, on peut voir à l'œil nu - voici des ticks frais, et voici une connerie générale. Et même avec des minutes

en fait, les archives des vrais tics tels qu'ils étaient réellement, provenaient d'un DC particulier - une denrée très chère. (même en soulignant)

 
Petros Shatakhtsyan #:

Je suis surpris que vous soyez surpris.

Je ne peux pas l'expliquer, c'est plus précis. C'est une chose d'écrire un tick scalper pour ceux qui sont générés, et d'en faire un graal. Une autre est de ne pas être un scalper du tout, avec une fermeture par SL, qui a été définie à l'avance. Sur les ticks générés, le SL est exécuté avec un slippage négatif. Mais c'est toujours un grail.
 
Maxim Kuznetsov #:

vous avez de lachance d'avoir décidé de faire une affaire sensée une fois...maintenant les courtiers ne collectent plus les cotations, mais les prennent/les fournissent d'ailleurs ; cela peut être lié aux mises à jour du serveur MT.

Parfois, on peut voir à l'œil nu - voici des ticks frais, et voici une connerie générale. Et même avec des minutes

en fait, les archives des vrais ticks tels qu'ils étaient réellement, provenaient d'un DC particulier - une denrée très chère. (même en soulignant)

Vous vous trompez. Chaque courtier collecte lui-même des ticks réels et sur le testeur du jour suivant, vous pouvez obtenir les ticks réels du jour précédent.

Et ce sont exactement ces ticks qui, après filtrage, sont transmis par le courtier à MT5. Vous pouvez le vérifier dans le mode "Chaque tick basé sur des ticks réels", ou le copier.

 

Un bon document sur la manière de réaliser correctement la représentation BP pour les réseaux neuronaux. Les FFT peuvent être supprimées, bien sûr. Et une comparaison plus poussée des différents modèles.

La différence fondamentale est que le prétraitement est intégré dans l'architecture du réseau. Mais il peut être effectué séparément.

La LSTM fume en arrière-plan, parce qu'elle ne prend pas en compte les variations inter-périodes.

Bousting se trouve également en bas du classement, d'après leurs tests.
 
Maxim Dmitrievsky #:

Un bon document sur la manière de réaliser correctement la représentation BP pour les réseaux neuronaux. Les FFT peuvent être supprimées, bien sûr. Et une comparaison plus poussée des différents modèles.

La différence fondamentale est que le prétraitement est intégré dans l'architecture du réseau. Mais il peut être effectué séparément.

La LSTM fume en arrière-plan, car elle ne prend pas en compte les variations inter-périodes.

Bousting se situe également dans le bas du classement, d'après leurs tests.
Le niveau du texte est assez élevé, mais ils appliquent leur science à des séries multi-périodiques, et celles-ci ne sont clairement pas des prix. Même si, bien sûr, les amateurs de radio locale ne manqueront pas d'argumenter)
 
Il n'y a pas si longtemps, sur le forum, quelqu'un a donné le nom de l'effet (je ne l'ai pas encore trouvé), à cause duquel les séries proches de SB semblent avoir une période. Cet effet est associé à de nombreux moments honteux dans la science, lorsque par le biais de Fourier "trouvé" la périodicité dans les processus, et les radioamateurs à cause de cela sur le forum ne survivra jamais).
 
Quelqu'un peut-il m'expliquer le problème des tests multiples ?
Pourquoi plus il y a d'itérations pendant l'optimisation, plus la probabilité de surentraînement augmente ?


Non, je comprends que plus on cherche (itérations), plus on a de chances de trouver quelque chose d'aléatoire qui ressemble à quelque chose qui n'est PAS aléatoire.....

Mais si nous avons trouvé une idée et que nous avons ensuite adapté les paramètres à cette idée en 10 itérations au lieu de 10000, peut-on considérer qu'il s'agit d'un modèle non entraîné ?

Après tout, l'expression"nous avons eu une idée" implique également un certain type de processus de réflexion (itérations).


Comment le modèle final sait-il s'il s'agit d'itérations du cerveau ou de l'ordinateur et s'il existe une différence entre les deux ?


La question s'est posée après avoir lu l'article de Prado

Pseudo-Mathematics and Financial Charlatanism: The Effects of Backtest Overfitting on Out-of-Sample Performance
  • papers.ssrn.com
We prove that high simulated performance is easily achievable after backtesting a relatively small number of alternative strategy configurations, a practice we
 
Aleksey Nikolayev #:
Il n'y a pas si longtemps, sur le forum, quelqu'un a donné le nom de l'effet (je ne l'ai pas encore trouvé), à cause duquel les séries proches de SB semblent avoir une période. Cet effet est associé à de nombreux moments honteux dans la science, lorsque par le biais de Fourier "trouvé" la périodicité dans les processus, et les radioamateurs à cause de cela sur le forum ne survivra jamais).

Comment prouver le contraire ?

A mon avis, il y a des événements liés au temps - les mêmes nouvelles. Je pense que si nous les divisons en trois sous-échantillons - attendu, pire, meilleur - et que nous prenons en compte le contexte, nous remarquerons un comportement similaire des acteurs du marché.

Une autre option est la saisonnalité des marchandises.

 
mytarmailS adaptons les paramètres à cette idée en 10 itérations au lieu de 10000, peut-on considérer qu'il s'agit d'un modèle non entraîné ?

Après tout, l'expression"nous avons eu une idée" implique également un certain type de processus de réflexion (itérations).


Comment le modèle final sait-il s'il s'agit d'itérations du cerveau ou de l'ordinateur et s'il y a une différence entre les deux ?


La question s'est posée après avoir lu l'article de Prado

Le surapprentissage résulte de la mémorisation de phénomènes rares. Ces phénomènes sont isolés de manière purement statistique, car il n'existe pas de modèle décrivant la cause et l'effet.

Cela dit, une perte ne signifie pas toujours que le modèle est surentraîné.