L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2526

 
Aleksey Nikolayev #:

Par exemple, si 1<=t1<=t2<n, alors ACF(t1,t2)=sqrt(t1/t2).

J'ai une autre question. Nous considérons ici l'ACF des valeurs adjacentes dans un échantillon de taille infinie. Par exemple, t1=1, t2=2. On obtient ACF =sqrt(0.5) ~ 0.707. Maintenant nous prenons d'autres valeurs voisines, par exemple,t1=10000, t2=10001. Nous obtenons ACF = 1 (presque). Il s'avère que les valeurs voisines sont corrélées différemment les unes aux autres. Est-ce normal ?

 
LenaTrap #:

Pour être honnête, je ne comprends rien du tout.

p.s peut-être qu'un mathématicien super intelligent aura pitié de moi et m'expliquera ce qui se passe ici ?

vous n'avez pas besoin d'un "mathématicien super intelligent" dans le commerce .....

DL a 3 couches - internes (cachées) poignées t moment respectivement externes t-1 et t+1... - donc l'autocorrélation est possible... imho... Je le vois de cette façon

bien qu'il me semble, pour une raison quelconque, que si nous ne prenons pas le changement delta d'une caractéristique dans le temps, mais un certain indice - alors, peut-être, l'effet de l'autocorrélation de ces valeurs qui se croisent dans l'espace temporel peut être en quelque sorte nivelé ... c'est discutable... car close(t)/close(t-1) ont aussi une intersection et donc une autocorrélation... bien qu'à TF>15min l'autocorrélation semble disparaître (non observé) - je ne l'ai pas personnellement vérifié... et ce n'est pas encore l'index dont j'ai besoin...

Il est inutile de prier pour l'autocorrélation dans la modélisation des mouvements de prix avec des TF adéquates... Et cela n'a aucun sens d'utiliser un modèle après chaque tick (comme dans la dérivation des régularités, en plus de celles à long terme)... imho (mais plus juste sur le plan probabiliste)...

MAIS les réseaux neuronaux récurrents ne font que transmettre l'information vers l'avant (avec l'avènement des machines de Boltzmann, ils ont commencé à être utilisés dans l'apprentissage probabiliste multicouche)... bien qu'il ait déjà sonné

Les réseaux récurrents et les méthodes bayésiennes, par eux-mêmes, n'ont pas démontré leur capacité à extraire la "mémoire" des séries chronologiques financières ou à tirer des conclusions sur le modèle le plus robuste sur de nouvelles données.

c'est pourquoi les réseaux récursifs avec rétropropagation de l'erreur et sa minimisation dy/dx sont utilisés dans les problèmes réels (puisqu'ils permettent d'effectuer l'intégration juste pour cette raison de leurs capacités de minimisation dy/dx).

p.s.

en général, quant à moi - c'est la même méthode de Monte Carlo - seulement par machine... Je ne vois pas encore de nouveauté dans la recherche de l'avant en utilisant la rétropropagation... purement terminologique...

p.p.s

sauf qu'avec Theano, vous pouvez essayer quelque chose sans trop utiliser les ressources du PC (bien que TensorFlow ait été vanté)...

et ce que Y et ce que X sont à la discrétion du développeur (soit a priori, soit à la suite d'une analyse statistique)... Si vous êtes bon avec python -- dans sklearn, même les fonctionnalités 2-en-1 sont déjà implémentées dans certaines méthodes ? exemples ! -- et l'importance de la fonctionnalité se fait toute seule et ML se fait toute seule -- quelques lignes aussi (comme vous avez trouvé corrcoef en quelques lignes).

 
LenaTrap #:

Sur le marché réel ? Personnellement, j'ai une sorte de philosophie comme ça:

*mais je ne veux pas vraiment en discuter, car sans preuves, il est inutile de discuter d'hypothèses

! dans le commerce réel - ne déformez pas le sens...

oui, la philosophie est en effet différente pour chacun... le but des statistiques est d'expliquer la variance

et formaliser les dépendances des tests indépendants

 
Docteur #:

J'ai une autre question. Considérons l'ACF des valeurs voisines dans un échantillon de taille infinie. Par exemple, t1=1, t2=2. On obtient ACF =sqrt(0.5) ~ 0.707. Maintenant nous prenons d'autres valeurs voisines, par exemple,t1=10000, t2=10001. Nous obtenons ACF = 1 (presque). Il s'avère que les valeurs voisines sont corrélées différemment les unes aux autres. Est-ce normal ?

C'est vrai, ça l'est. C'est la deuxième raison de parler de non-stationnarité de SB (la première est la croissance de la variance avec le temps). C'est seulement dans les processus stationnaires (par leur définition même) que l'ACF ne dépend que de la différence de temps ACF(t1,t2)=ACF(t1-t2). C'est pourquoi, pour les séries stationnaires, l'ACF est généralement écrit comme une fonction d'un argument t1-t2.

 
Doc #:

La question doit bien sûr être adressée à Alexei. Mais je répondrais "peu importe". La question, je suppose, est que SB parcourt un chemin proportionnel à sqrt(t).

Il s'agissait du fameux problème de la "ruine du joueur". Il pourrait être utilisé, par exemple, pour tester la signification statistique de l'effet des prix "aspirant" à certains niveaux.

 
Aleksey Nikolayev #:

Le fameux problème du "player busting" a été signifié. Il pourrait être utilisé, par exemple, pour tester la signification statistique de l'effet de l'"aspiration" des prix à certains niveaux.

C'est beaucoup plus intéressant.

Peut-être devrions-nous abandonner le point de vue selon lequel le marché est une série chronologique, et faire enfin une percée dans l'analyse du marché.

 
Aleksey Nikolayev #:

C'est vrai, ça l'est. C'est la deuxième raison de parler de non-stationnarité de SB (la première est la croissance de la dispersion avec le temps). C'est seulement pour les processus stationnaires (par leur définition même) que l'ACF ne dépend que de la différence de temps ACF(t1,t2)=ACF(t1-t2). C'est pourquoi, pour les séries stationnaires, l'ACF s'écrit généralement comme une fonction d'un argument t1-t2.

OK. Laissez-moi poser la question d'une autre manière. Les deux situations décrites ci-dessous sont-elles différentes l'une de l'autre ?

1) Nous avons un échantillon de taille infinie. Considérons deux moments temporels n et (n-t). Considérons que 1 <= (n-t) <= n. CalculezACF((n-t),n)=sqrt((n-t)/n).

2) On dispose d'un échantillon de longueur n. Calculez l'ACF de l'échantillon avec le décalage t :ACF(t) =sqrt((n-t)/n).

 
JeeyCi #:

bien qu'il me semble, pour une raison quelconque, que si l'on ne prend pas le changement delta de la caractéristique dans le temps, mais que l'on contracte un certain indice - alors peut-être que l'effet de l'autocorrélation de ces valeurs qui se chevauchent dans l'espace temporel peut en quelque sorte être égalisé... c'est discutable... car close(t)/close(t-1) ont aussi une intersection et donc une autocorrélation... bien qu'à TF>15min l'autocorrélation semble disparaître (non observé) - je ne l'ai pas personnellement vérifié... et ce n'est pas encore l'index dont j'ai besoin...


Vous n'en avez probablement pas besoin, mais avec n'importe quelle tendance, les données des séries temporelles commencent à présenter une autocorrélation, parfois très élevée, qui devrait théoriquement interférer avec de nombreux modèles d'analyse/réseaux neuronaux.

Cet effet est vraiment difficile à utiliser pour les pronostics, car rien ne dure jamais, la tendance change avec le rang, le chaos avec l'ordre, les séries temporelles qui errent au hasard peuvent soudainement ne pas errer du tout, et vice versa, et par une telle estimation vous ne pouvez pas comprendre la structure du processus, c'est trop simple, ce serait comme trader au-dessus de la 200SMA.

Mais il vaut peut-être la peine de vérifier comment votre réseau neuronal réagit aux autocorrélations, et d'essayer de les supprimer si elles existent et interfèrent. Les éléments voisins ne devraient pas se chevaucher du tout (si c'est ce que je pense ?), si vous utilisez des données comme ça, ce serait un grand miracle si le modèle fonctionnait.

 
LenaTrap #:

Vous n'en avez probablement pas besoin, mais avec n'importe quelle tendance, les données de la série chronologique

ne le déformez pas : en essayant d'argumenter avec moi, vous parlez toujours de votre... juste sur les séries temporelles... (et personne n'a annulé les méthodes d'échantillonnage)...

le prix à long terme n'est pas une fonction du temps, j'ai fait valoir mon point de vue plus d'une fois (et je ne le répéterai pas)... Je vous ai montré où vous pouvez obtenir l'autocorrélation dans DL... et quoi utiliser pour X et Y et pour modéliser quelles dépendances - je l'ai écrit pour la 10ème fois aussi - c'est à la discrétion du développeur...

Je ne suis pas le développeur de votre modèle - je n'ai pas besoin de prouver le comportement du prix dans le temps... (je n'aurais peut-être pas dû gribouiller sur le DL - tout le monde ici réfléchit à quelque chose et le réfute ou prouve quelque chose à quelqu'un - en prenant un mot de chaque discipline)... les ingénieurs qui font du MO (qui ne sont pas ici) comprendront quand même l'étroitesse du débat sur l'auto-corrélation (pour le plaisir de parler de nerds) que ce soit en tendance ou en tick, si le modèle est construit dans un aspect beaucoup plus large et sur un horizon de l'ensemble d'apprentissage plus large que l'horizon où vos puces (auto-corrélation) peuvent sortir.... C'est à cela que sert l'apprentissage profond (pour tout prendre en compte).

... Pour moi, la question du commerce n'est pas un problème :

Aleksey Nikolayev #:

Le fameux problème de la "ruine du joueur".

... ... c'est pourquoi j'ai évité cette absurdité pendant longtemps ... il a été révélé que personne ici n'a la moindre idée de la modélisation, et ceux qui l'ont, ne perdent pas leur temps sur ce fil ... ok, il y a beaucoup plus de choses utiles sur DL sur le net que tout le jargon flagrant que vous avez débité ici sans raison valable ....

Pour les statistiques, vous feriez mieux de vous adresser à des mathématiciens universitaires, ce n'est pas à moi de vous répondre... - Je ne suis pas intéressé par votre croyance que l'autocorrélation règne sur le DL... - pour la 5ème fois j'ai écrit "c'est un mauvais modèle" (je ne veux pas écrire la 10ème)... laissez vos universitaires vous répondre (si ma réponse vous a donné envie de prouver quelque chose)

 
Docteur #:

Bon, d'accord. Laissez-moi poser la question d'une autre manière. Les deux situations décrites ci-dessous sont-elles différentes l'une de l'autre ?

1) Nous avons un échantillon de taille infinie. Considérons deux moments temporels n et (n-t). Considérons que 1 <= (n-t) <= n. CalculezACF((n-t),n)=sqrt((n-t)/n).

2) On dispose d'un échantillon de longueur n. Nous calculons l'ACF de l'échantillon avec le décalage t :ACF(t) =sqrt((n-t)/n).

La différence est que dans le premier cas, l'ACF est considéré pour toutes les paires de moments possibles, tandis que dans le second cas, l'un des moments est fixé à t2=n et de nombreuses paires de moments( par exemple, la paire t1=1, t2=2) sont éliminées. En général, l'ACF est une fonction de deux arguments. Ce n'est que pour les processus stationnaires que l'ACF peut être considéré comme une fonction d'un argument t=t1-t2 (décalage).

L'ACF d'échantillon est toujours calculé à partir d'un échantillon numérique spécifique (réalisation) d'un processus et s'avère toujours être une fonction d'un argument (valeur de retard). C'est la raison principale pour laquelle l'échantillon d'ACF sur une mise en œuvre SB n'est pas une estimation de son ACF).