Statistiques de dépendance entre guillemets (théorie de l'information, corrélation et autres méthodes de sélection de caractéristiques) - page 72

 
Mathemat:

Exactement, c'est exactement ça. L'ACF est inutile.

L'information mutuelle, cependant, devrait être, car il n'y a pas d'odeur de zéro même à une distance de centaines de barres.



veuillez m'envoyer vos résultats - comment vous les avez calculés, quelles données vous avez utilisées, etc.
 
Avals:

J'ai besoin que vous m'envoyiez les résultats - comment vous les avez calculés, quelles données vous avez utilisées, etc.

Je n'ai pas compté les points à prendre. J'ai d'autres choses - des statistiques. Le critère du chi-deux de la relation entre des séries de données. Je le posterai plus tard. Je vais devoir le préciser pour que ce soit clair.

En fait, c'est très proche de ce que fait l'homonyme. Même les formules sont très similaires.

 
alexeymosc:

Le maximum peut être de 2,098 bits. Il s'agit de l'information moyenne de cette série de données particulière. Si, par exemple, une barre du décalage 1 détermine complètement une barre de zéro, alors leur information mutuelle deviendra 2,098 bits.

Quel est ce nombre ? C'est une mesure de l'information) Vous devez lire des articles sur TI. En bref, les bits reflètent une mesure du caractère aléatoire des valeurs de la source de données selon la formule d'information propre d'une valeur particulière

I(X) = - log(P(x))*P(x).

Un autre exemple. On tire à pile ou face, on compte l'information mutuelle entre deux événements consécutifs. Par les formules que j'ai traduites dans mon article, on obtient que l'information mutuelle I(X;Y) = 0. Et si un lancer de pile indique précisément un lancer de pile (ou de face) ultérieur, alors I(X;Y) sera égal à 1 - c'est l'information moyenne de la source de données "pièce de monnaie équitable".

Alexey ! J'utilise moi aussi l'information mutuelle pour sélectionner des entrées significatives pour un réseau neuronal. J'obtiens généralement des modèles dont la prévisibilité est de 52 à 54 %. Il me semble que des résultats valables seront obtenus lorsque l'information mutuelle est > 0,1 bit. Pour la volatilité, il est possible de trouver de telles entrées significatives.

 
VNG: Je ne sais pas qui prend le cinq. Cependant, je constate qu'il est tombé sur un résultat très intéressant lors de ses recherches et qu'il ne l'a pas vu.

Je me rends compte que mes messages dans ce fil sont à la limite de la faute, presque du hors-sujet.

Sur le cinq, hrenfx.

Les messages sont bons, tout à fait dans le sujet. Certains doutent également de l'applicabilité de TI au sujet.

- Qu'il y ait une quelconque invariance dans le changement d'échelle, désolé, je ne comprends pas. Je comprends l'invariance comme la présence d'un facteur d'échelle (dans le cas général, il peut s'agir de n'importe quel nombre ou fonction), lorsqu'il est multiplié par lequel nous obtenons un nouveau modèle d'une échelle différente. C'est-à-dire la transformation affine, qui est la manifestation de la structuration dans un flux chaotique de données. Le problème consiste alors à trouver un tel coefficient. Lorsqu'un motif est trouvé, il est simplement multiplié par ce coefficient. Et cette transformation fonctionne aussi bien "vers le haut" que "vers le bas". Et c'est tout.

Ok, qu'il en soit ainsi, j'en ai trop fait avec la fractalité. Elle est là, mais elle n'est pas parfaite. Plus précisément, l'invariance fractale n'est pas parfaite.

- si vous étudiez la relation entre ces deux quantités.

- pourquoi il en est ainsi, quelle est la cause de cette déclaration

Quelle déclaration - je ne comprends pas.

- Pourquoi deux heures, et pas trois heures et demie ?

- Quelles sont ces deux valeurs ?

Ici, c'est plus clair.

1. Deux parce que nous prenons une source conditionnelle et un récepteur conditionnel et essayons de savoir s'il existe une dépendance entre eux.

On compose un alphabet (je divise la distribution des rendements en quantiles, c'est plus pratique pour moi ; l'homonyme le fait un peu différemment, mais cela n'affecte pas beaucoup le résultat), on applique TI. Il y a quelques doutes sur le canal de communication. Le temps est peut-être le canal de communication.

Si nous fixons la différence entre les barres (les nombres sont calculés dans MT4) égale à, disons, 238, alors la source est la série

return(Bars-1), return(Bars-2), ... retour(238) (environ 80 000 valeurs à 12 ans de veille)

Le récepteur est une série de

return(Bars-1 - 238), return(Bars-2 - 238), ... retour(0).

En bref, juste une rangée de retours et la même, décalée par rapport à elle-même de 238.

Vous pouvez calculer l'ACF. Il sera presque certainement égal à zéro ou en différera de manière statistiquement insignifiante. Eh bien oui, il n'y a pas de relations linéaires significatives entre ces séries, toutes banales, sans poisson.

Mais nous, les Alexiens, ne comptons pas les ACF, nous comptons les dépendances non linéaires - toutes les dépendances. C'est à cela que sert la distribution conjointe de ces deux quantités. Nous l'avons. (En passant, il est également nécessaire pour calculer l'ACF, ce que les gens négligent généralement).

L'homonyme a immédiatement pris le taureau par les cornes et a compté l'information mutuelle de ces deux séries.

J'ai évalué le test du chi-deux de la relation entre les deux variables aléatoires.

Les résultats sont très similaires.

- La distribution conjointe des deux quantités représente une surface. Quoi, on déménage dans un autre rael ?

Nous sommes là depuis longtemps, c'est juste que tout le monde ne le réalise pas.

Tout cela n'est qu'un projet de canne à pêche, jusqu'à présent, ce n'est pas du tout un poisson.

 
IgorM:

La seule façon de vérifier l'efficacité du marché est de le faire soi-même, sinon il restera dans le plan du "croyez-le ou non". Je ne peux pas le dire mieux que je ne l'ai déjà fait :

J'espère me tromper, mais vos "taches magiques" sont plus dans ma tête, le TS par canaux est très similaire au TS par intuition, voici une prévision non réalisée.

Je "tord" les niveaux avec différents builds, je les vois fonctionner à 50/50 dans le TS proposé avec des résultats très similaires, je soupçonne que même si je prends une décennie de mouvement de prix, ils coïncideront sur l'historique ou dans un futur proche


Igor, je n'ai pas tendance à idéaliser qui que ce soit ou quoi que ce soit. Mais j'ai déjà dit

- Ce ne sont pas des TS, mais des modèles de mouvements du marché. Vous devez construire vous-même un TS basé sur eux.

- L'auteur a TOUJOURS été contre les prévisions. L'essence de son travail s'exprime en une seule phrase : "rebondir, passer à la précédente, percer, passer à la suivante".

- Pour autant que je sache, il ne s'agit pas d'une prédiction, mais d'une cible possible, sur laquelle je ne me suis personnellement pas penché.

- Vous cherchez des failles sans essayer d'aller au fond de ce qui est proposé. Je comprends votre scepticisme, mais vous êtes parti du mauvais pied. Essayez d'abord d'entrer dans les règles et l'essence des constructions. Pour vous faciliter la tâche - le canal de Vadim est la même bougie, mais sans relation avec le TF.

Le TAdv postule le développement du mouvement selon six points de contrôle. Le canal est les points 1 et 2 dans le Tadv. La balançoire est le point 1,2,3 de Tadv. Notez que ni Jan, qui est l'un des auteurs de TAdv, ni Vadim, l'auteur de V-Channels et V-Swings, ne prouvent et ne convainquent personne de quoi que ce soit, n'apparaissent ici que dans des cas strictement définis et ne demandent rien à personne, ne font aucune publicité. Ils ne sont pas bafoués et se comportent correctement. N'est-ce pas un indicateur de conviction et de force intérieure ? Ils aident simplement de manière désintéressée et partagent leurs développements. TAdv a été présenté il y a plus de 10 ans, VKanals et Vsvings, j'ai peur de mentir, quelque chose comme 7, ont été testés par le temps et ont beaucoup d'adeptes. La seule façon de tester son efficacité est de s'y plonger soi-même et de le tester pour voir s'il fonctionne. Sinon, cela restera dans le domaine du "croyez-le ou non".

Bonne chance.

 
VNG: Igor, je n'ai pas tendance à idéaliser qui que ce soit ou quoi que ce soit. Mais j'ai déjà dit
hmm, l'expérience a été un succès, mon post est resté sur le fil de discussion pendant environ 5 minutes, mais j'ai même réussi à obtenir un branchement, et pas les habitués locaux
 
renegate:

Alexey ! Moi aussi, j'utilise l'information mutuelle pour sélectionner des entrées significatives pour un réseau neuronal. En général, j'obtiens des modèles dont la prévisibilité des rendements est de 52 à 54 %. Il me semble que de bons résultats sont obtenus lorsque l'information mutuelle est > 0,1 bit. Pour la volatilité, il est possible de trouver de telles entrées significatives.

Oh, c'est bien de voir arriver quelqu'un qui a aussi appris à appliquer TI au problème de la sélection des variables significatives.

Seulement votre conseil est un peu incomplet ou quelque chose comme ça. Le fait est que les informations moyennes d'une source de données peuvent être différentes. Le seuil d'information mutuelle significatif en dépendra également. Quel est votre flux d'information moyen H(X) ?

 
Mathemat:

Sur un cinq - hrenfx.

Les postes sont bien, tout à fait sur le point. Outre la question de l'applicabilité de TI au sujet, certains ont des doutes à ce sujet.

D'accord, qu'il en soit ainsi, avec la fractalité j'en ai trop fait. Il existe, mais ce n'est pas idéal. Plus précisément, l'invariance fractale n'est pas idéale.

Quelle déclaration - je ne comprends pas.

Ici, c'est plus clair.

1. Deux parce que nous prenons une source conditionnelle et un récepteur conditionnel et essayons de savoir s'il existe une dépendance entre eux.

On compose un alphabet (je divise la distribution des rendements en quantiles, c'est plus pratique pour moi ; mon homonyme le fait un peu différemment, mais cela n'affecte pas beaucoup le résultat), on applique TI. Il y a quelques doutes sur le canal de communication. Le temps est peut-être le canal de communication.

Si nous fixons la différence entre les barres (les chiffres sont calculés dans MT4) à, disons, 238, - alors la source est la série

return(Bars-1), return(Bars-2), ... retour(238) (environ 80 000 valeurs en 12 ans)

Le récepteur est une série

return(Bars-1 - 238), return(Bars-2 - 238), ... retour(0).

En bref, juste une série de retours et le même, décalé par rapport à lui-même par 238.

Il est possible de calculer l'ACF. Il sera presque certainement égal à zéro ou en différera de manière statistiquement insignifiante. Eh bien oui, il n'y a pas de relations linéaires significatives entre ces séries, toutes banales, sans poisson.

Mais nous, les Alexiens, ne comptons pas les ACF, nous comptons les dépendances non linéaires - toutes les dépendances. C'est à cela que sert la distribution conjointe de ces deux quantités. Nous l'avons. (Au fait, il est également nécessaire pour calculer l'ACF, mais tout le monde ne le comprend pas).

Tezka a immédiatement pris le taureau par les cornes et calcule l'information mutuelle de ces deux séries.

J'ai évalué un test de chi-deux de la relation entre deux variables aléatoires.

Les résultats sont très similaires.

Oui, nous sommes là depuis longtemps, mais tout le monde ne le comprend pas.

Tout cela et il n'y a pour l'instant qu'une ébauche de canne, ce n'est pas du tout un poisson.


Merci Alexey, tout est clair maintenant.

Dans le cadre de ce problème, les caractéristiques du canal de communication ne sont absolument pas pertinentes, elles seront prises en compte automatiquement via l'entropie de l'information.

 
IgorM:
Hmmm, l'expérience a été un succès, mon message est resté sur le fil pendant environ 5 minutes, mais il a même été bloqué, et pas par des habitués locaux

Quelle a été l'expérience ?
 
Mathemat:


Mais nous, Alexei, ne comptons pas les ACF, mais les dépendances non linéaires - toutes les dépendances. C'est à cela que sert la distribution conjointe des deux quantités. Nous l'avons. (En passant, il est également nécessaire pour calculer l'ACF.

Bien dit ! Nous, Alexei, sommes en faveur de l'inefficacité du marché. Et nous avons déjà des résultats pratiques qui le montrent, mais qui ne sont pas visibles à travers le prisme de l'approche statistique-économétrique classique.