L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3325

 
mytarmailS #:

S'agit-il d'un troll ?

Qu'est-ce que c'est ?

Voici la vidéo.


 
Aleksey Vyazmikin #:

Qu'est-ce que le trollage ?

Voici la vidéo

C'estcomme ça.

 
mytarmailS #:

comme ceci

De mon côté, il s'agissait d'un endroit sur Internet, c'est-à-dire d'un lien.

 
Aleksey Vyazmikin #:

De mon côté, il s'agissait d'un endroit sur l'internet, c'est-à-dire d'un lien.

Je ne me souviens pas de l'article exact,

mais il n'y en a pas un million, cherchez.

 
mytarmailS #:

Je ne me souviens plus de l'article,

mais il n'y en a pas un million, cherchez.

J'ai donc fait une recherche et je n'ai encore rien trouvé.

 
Aleksey Vyazmikin #:

C'est ce que j'ai compris. Je demande simplement si la cause de ce problème a été déterminée. Non pas ce qui est cassé, mais pourquoi les signaux sont manquants.

La raison est simple, comme cela était prévu - les signaux sont manquants parce que, sur de nouvelles données, les signaux se situent en dehors d'une fourchette étroite acceptable.

On peut comparer cela à la classification : il y a des modèles clairs et connus et d'autres obscurs et inconnus. Avec le temps, il y a de plus en plus d'inconnus et il ne reste plus rien dans la classe "connue".

 
Aleksey Vyazmikin #:

On prétend qu'avec cet algorithme il était possible de gagner des premières places sur cagle, je ne pense pas qu'il y ait eu des tâches simples...

Devrions-nous essayer de comprendre ? Je ne comprends pas les formules - à mon grand regret.

Je ne suis pas non plus dans les formules, mais dans les idées.
Et si vous décomposez l'idée, elle est si mauvaise pour les données de marché.

Elle suggère de supprimer des paires d'exemples de classes différentes qui sont très proches l'une de l'autre. Si nous prenons le troisième exemple, idéalement, tous les exemples compris entre 0,2 et 0,8 seront supprimés et seules les zones inférieures à 0,2 et supérieures à 0,8 présentant une pureté absolue des classes seront conservées. N'importe quel modèle pourrait ensuite les classer facilement.
J'ai déjà montré précédemment qu'un exemple aussi simple et l'arbre se diviseront facilement, si vous utilisez des feuilles avec une grande pureté de classes (et ne divisez pas les feuilles jusqu'à un exemple dans une feuille).
Mais il s'agit d'un exemple artificiel.

Sur les données du marché, il n'y aura pas de blocs aussi purs avec la prédominance d'une classe. En d'autres termes, vous devrez presque tout nettoyer. Par exemple, il y a 1000 points, 900 ont été nettoyés, le reste a atteint le niveau de propreté des feuilles, par exemple 70% - cela semble pas mal, et vous pouvez gagner de l'argent. Mais lorsque vous commencez vraiment à négocier, il y aura des exemples dont nous nous sommes débarrassés lors du nettoyage (9 déchets pour 1 restant) et les indicateurs de 70% tomberont à 53% par exemple et vous perdrez sur les spreads, les slippages, etc.

Je préfère un arbre et une feuille avec un honnête 53% de pureté de l'une des classes. Et ne l'utiliserai pas.
 
Aleksey Vyazmikin #:

J'ai donc fait une recherche et je n'ai encore rien trouvé.

cela arrive

 
Aleksey Vyazmikin #:

Je ne vois pas le lien. De quoi s'agit-il ?

En lisant le texte de votre lien, il y avait même un théorème sur leur connexion. Ne soyez pas paresseux pour lire au moins vos liens.
 
Forester #:
Je n'utilise pas non plus de formules, mais des idées.
Et si vous décomposez l'idée, elle n'est pas si bonne pour les données du marché.

Elle suggère de supprimer les paires d'exemples de différentes classes qui sont très proches l'une de l'autre. Si nous prenons le troisième exemple, idéalement, tous les exemples compris entre 0,2 et 0,8 seront supprimés et seules les zones inférieures à 0,2 et supérieures à 0,8 présentant une pureté absolue des classes seront conservées. N'importe quel modèle pourrait ensuite les classer facilement.
J'ai déjà montré précédemment qu'un exemple aussi simple et l'arbre se diviseront facilement, si vous utilisez des feuilles avec une grande pureté de classes (et ne divisez pas les feuilles jusqu'à un exemple dans une feuille).
Mais il s'agit d'un exemple artificiel.

Sur les données du marché, il n'y aura pas de blocs aussi purs avec la prédominance d'une classe. En d'autres termes, vous devrez presque tout nettoyer. Par exemple, il y a 1000 points, 900 ont été nettoyés, le reste a atteint le niveau de propreté des feuilles, par exemple 70% - cela semble pas mal, et vous pouvez gagner de l'argent. Mais lorsque vous commencez vraiment à négocier, il y aura des exemples dont nous nous sommes débarrassés lors du nettoyage (9 déchets pour 1 restant) et les indicateurs de 70% tomberont à 53% par exemple et vous perdrez sur les spreads, les slippages, etc.

Je préfère un arbre et une feuille avec un honnête 53% de pureté de l'une des classes. Et je ne l'utiliserai pas.

À ce stade, nous sommes d'accord sur le résultat. Oui, je m'attends à un échantillon fortement éclairci, mais si j'ai bien compris, le processus est itératif, ce qui signifie que l'on peut connaître la mesure et s'arrêter beaucoup plus tôt et utiliser les mêmes données pour construire les mêmes modèles de bois, qui auront moins de fentes et des valeurs plus fiables dans les feuilles.

Ai-je bien compris que les centres initiaux sont situés au hasard ?