L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 501

 
SanSanych Fomenko:

Vous n'avez rien compris à mon message. Rien du tout.


Et c'est dommage pour la branche à cause de votre présence.


Oui, vous définissez alors vos camarades de terrain qui prétendent être capables d'extrapoler :))

 
Jele fais:

En fait, la question soulevée est intéressante.

Dans le cas de la régression y = f(x), la forêt ne peut pas vraiment "extrapoler" au-delà de l'endroit où il n'y a pas de points d'apprentissage, alors que MLP le peut, bien qu'il ne le fasse pas non plus, dans le style de la régression polynomiale tout au plus, ce qui est plus "joli" sur les constantes du graphique des arbres.


Mais Sansanych et Leha ont également raison à certains égards, car la régression y = f(x) n'est pas ce dont nous avons besoin en tant que commerçants, car si x est le temps depuis la Nativité, alors nous ne sommes pas intéressés par de telles relations, et dans l'espace des autres caractéristiques, les points du temps futur ne seront pas nécessairement en dehors de l'échantillon d'apprentissage de nos caractéristiques indicatrices.

Pourquoi une forêt d'arbres donne une constante est clair pour moi, larégression linéaire est également évidente, mais pourquoi MLP donne une régression pseudo-polynomiale je ne "vois" pas comme transparent. nous devons comprendre...


Prenons un exemple simple : si vous prédisez des prix et formez l'échafaudage sur un intervalle de prix incomplet, lorsque vous devez prédire un prix en dehors de l'intervalle de formation, il ne le prédit pas. Il est clair que ces situations sont spécifiques et que nous devons utiliser la bonne formation.

dans votre photo est exactement ce que je voulais dire

 
(Jene peux pas le voir :

Le renverser COMMENT ? ??


Peinture :)

 
Je n'ai pas bien réfléchi :

Il n'y a aucun problème, car il n'y a pas de signes linéaires dans le temps, pas d'intervalle d'entraînement, seulement des valeurs aberrantes très rares, quelque chose qui ne devrait pas être là, des putains de cygnes noirs :)


Ah, je pensais que c'était l'intervalle cible... je n'ai pas bien réfléchi.

 
Je voudrais demander aux membres respectés de la branche à ce sujet

Forum sur le trading, les systèmes de trading automatisés et les tests de stratégies de trading

Tableau avec les cotations de 1000 des actions les plus négociées. Données pour l'année dernière.

fxsaber, 2017.10.04 14:19

"Rééquilibrez régulièrement le portafl et tout ira bien", c'est ce que disent tant de gens, jusqu'à ce qu'ils glissent un SB (marche aléatoire) dans leur système de comptage au lieu de la série de prix originale.

La grande majorité après SB voit exactement la même image qu'avec les données réelles. Mais tirer la même conclusion en disant la phrase sur le rééquilibrage n'est plus possible, car c'est SB. Et "ça va aller" est exclu.

La question, à mon sens, est essentielle : dans quelle mesure les données sur les prix réels diffèrent-elles du SB ? Si je comprends bien, plus la différence est grande, plus il y a de possibilités de faire des bénéfices. Et vice versa, jusqu'à "pas de différence - pas de profit".

 
Il en va demême pour les autres projections :

pourquoi MLP donne une régression pseudo-polynomiale, je ne le vois pas comme transparent. il faut le découvrir...

Comprenez pourquoi un neurone effectue une régression linéaire, comment cela se produit à bas niveau, puis comprenez facilement comment les variantes non linéaires sont obtenues dans les ensembles multi-neurones et multicouches. Et Random Forest ainsi que Knn et d'autres outils à noyau ne font qu'une interpolation locale, qui peut être une extrapolation dans d'autres projections, ce n'est pas le problème, mais RF ne construit pas de fonctions (balayage) dans une large gamme, mais le perseptron multicouche le fait.

 
fxsaber:

La question clé, à mon sens, est la suivante : dans quelle mesure les données sur les prix réels diffèrent-elles du SB ? Si je comprends bien, plus la différence est grande, plus il y a de possibilités de faire des bénéfices. Et vice versa, jusqu'à "pas de différence - pas de profit".

Ils sont différents, mais de façon très insignifiante, de sorte que nous ne pouvons même pas le remarquer à l'œil nu. En outre, la plupart des différences sont déjà incluses dans les coûts commerciaux.

 
fxsaber:
Je voudrais demander aux participants distingués sur ce sujet

La question clé, à mon sens, est la suivante : dans quelle mesure les données sur les prix réels diffèrent-elles du SB ? Si je comprends bien, plus la différence est grande, plus il y a de possibilités de faire des bénéfices. Et vice versa, jusqu'à "pas de différence - pas de profit".


La différence consiste en la présence d'une émission relativement importante dans les séries de prix et en la présence d'une faible "saisonnalité" - heures/séances de négociation, jours de la semaine, etc.

Et aussi des queues "grasses".

 
Dimitri:

Les différences consistent à avoir une émission relativement importante dans les séries de prix et la présence d'une faible "saisonnalité" - heures/séances de négociation, jours de la semaine, etc.

Il est possible d'assembler plusieurs SB à des intervalles différents pour obtenir le même effet.

Et aussi des queues "grasses".

Prenez un SB "à queue épaisse".

 
fxsaber:

Vous pouvez coller plusieurs SB ensemble à des intervalles différents pour obtenir le même effet.

Prenez un SB "à queue épaisse".


Il est possible d'adapter les SB aux signes de la gamme de prix, mais après toutes ces transformations, ce ne sera plus un SB.

Quel est l'intérêt ?