Statistiques de dépendance entre guillemets (théorie de l'information, corrélation et autres méthodes de sélection de caractéristiques) - page 44

 

OK, ne parlons pas de SB ici.

Pour en revenir à mon sujet, j'ai pu obtenir des tests à terme positifs sur certaines séries financières (DJI D1, je crois que c'était) en calculant l'information mutuelle entre les cotations, mais je ne peux pas garantir que ce n'était pas aléatoire. Et, en forex, je n'ai pas été en mesure d'obtenir de tels résultats.

 
alexeymosc:

OK, ne parlons pas de SB ici.


Dommage, cela promet d'être une soirée intéressante ;)

Mais, vous êtes le propriétaire du fil, c'est à vous de décider.

 
Avals:


Vous échangez la même rupture d'un extremum. Le modèle implique que les stop loss seront déclenchés derrière les extrema ainsi que d'autres transactions momentum. Ces transactions seront utiles en termes de modèle et toutes les autres transactions seront bruyantes. Non seulement ceux qui sont contre un commerce ouvert, mais ceux qui sont ouverts pour d'autres motifs que ceux inclus dans le modèle. Si ceux qui sont utiles sont très petits par rapport à ceux qui sont bruyants, alors l'effet sera un éclaboussement))). Pour d'autres modèles, ces échanges de "bruit" peuvent être utiles.

Le bruit est ce qu'un modèle particulier ne prend pas en compte. Il n'y a pas de bruit absolu, mais plutôt un manque d'informations sur les processus de formation des prix. Ceux qui n'aiment pas le mot "bruit" peuvent l'appeler "non comptabilisé", par exemple.) Mais en substance, il agira comme un bruit de fond par rapport à un signal utile en physique.

Z.U., c'est une question de "bruit" après l'entrée dans une transaction. Il en va de même avant d'entrer dans une transaction.

Je suggérerais de l'appeler "TF principal". Il existe des situations où TOUS "voient" le "TF leader" et en bénéficient dans un effort commun. Lorsque des désaccords surviennent dans la désignation d'une "TF leader", il y a alors un "ballottement" d'une TF "leader" à une autre TF "leader". Je veux dire construire des modèles sur différentes TF en utilisant différents "builders". Donc, dans cette situation, tous les autres "non leaders" pourraient être définis comme des "négociateurs". Mais jamais "bruit" et "non enregistré". L'association est un fagot de bois de chauffage coupé dans les bois, le reste est introuvable. Un seau d'eau écopé, le reste est du bruit. L'expression "les ordures dans l'ADN" ne me convient pas non plus... Il est intéressant de noter qu'en construisant des modèles sur le "TF maître", on peut également observer des modèles sur le "TF échangeable" qui aident les modèles "échangeables" sur le "TF maître". A mon avis, le principal problème est de pouvoir identifier les schémas "leader" et "d'échange". Identifiez les "zones communes" dans ces modèles et travaillez avec ces "zones communes".
 
TheXpert:
En effet. Quelle grande entreprise. Parlons de choses intéressantes. Mais pas pour le bruit.

Oui, il est grand temps. Cela me plairait beaucoup :)

D'ailleurs, je veux aller à Minsk dans les 2 ou 3 prochains mois, juste pour le plaisir. Nous pouvons nous croiser.

 
TheXpert:

Ceux qui ont des résultats positifs au SB se répartissent en trois catégories : les tricheurs, les abrutis et les profiteurs.

Si ça te démange pour SB, tu t'es trompé de sujet, mon pote.


Cela vous démange d'aborder de tels sujets, ou vous êtes jaloux de ne pas savoir comment, ou quoi, je ne sais pas. Là où le sujet ne se trompe pas, ils disparaissent. Vous teoretyugamy veulent juste coller à la parole tout est clair que cela signifie un pseudo-SB, bien que ce qui est pseudo - vous aussi ne peut pas expliquer. Simplement dans la nature idiote SB n'existe pas, qu'alors vous avec les théories nommez les gens dull-witted, bien que tels sont plus vous quand attribuer dans les calculs un processus occasionnel idyllique abstrait aux conditions réelles dans lesquelles cette occasion n'existe pas du tout. Tu couvres ton incompétence avec des insultes.
 

Bonjour.

C'est au point mort depuis un moment, mais c'est très intéressant. Je vais essayer de le relancer.

Ne me donnez pas trop de coups de pied, je vais donner mon avis sur le sujet et les questions soulevées.

A propos du bruit :

Comme je suis un technicien, je parle comme un technicien.

En radiotechnique, le bruit est défini par le critère de l'utilité. Tout ce qui est utile est le signal désiré ; tout ce qui ne l'est pas est du bruit. Par conséquent, la tâche principale au stade de la définition du bruit est de définir le critère d'utilité (excusez la tautologie).

Les exemples sont simples. Vous êtes assis à un cours et vous essayez de comprendre la matière présentée, et votre voisin est assis à côté de vous et écoute de la musique. Il porte des écouteurs mais vous pouvez entendre la musique et cela vous distrait constamment et vous empêche de vous concentrer. Pour vous, c'est du bruit. Pour votre voisin, c'est un signal utile et le bavardage du professeur est un bruit.

Nous passons maintenant en douceur au critère d'évaluation du bruit. Pour le séparer du signal utile, il suffit que le signal utile dépasse une certaine valeur, appelée seuil. La valeur de cet utilitaire est déterminée par le rapport signal/bruit.

Tout ce qui est au-dessus de l'écart est utile pour le commerce. (Au moins à DC sur le forex). Par conséquent, le critère d'utilité est le dépassement de la valeur de la cotation actuelle par rapport à l'écart relatif au tick précédent. Lors de l'entrée en position, le spread sera de toute façon facturé. Il s'agit du seuil de bruit. Il s'agit donc d'entrer dans la position de manière à ce que cette barrière seuil soit dépassée au prochain tick.

Il est logique d'aller plus loin et de considérer l'horizon d'investissement. La tâche se résume alors à ce qui suit - sur l'horizon d'investissement à gagner :

la tâche minimale - le seuil de rentabilité

La tâche maximale - le bénéfice prévu.

Tout est simple.

Maintenant, parlons du sujet du sujet.

La théorie de l'information a été créée comme une application de la théorie de la transmission des signaux et a été enseignée comme "théorie statistique de la communication". C'est pourquoi, en lisant le fil de discussion, je me suis souvent demandé si j'avais tout oublié ou si les participants ne comprenaient pas bien ce qu'ils voulaient déterrer.

La théorie statistique de la communication décrit les méthodes de codage de l'information et la reconnaissance de cette information par le récepteur. Les méthodes de reconnaissance sont optimisées.

Les problèmes partiels communs - reconnaissance des erreurs, correction des erreurs, cryptage et décryptage - sont également résolus. Divers codes sont utilisés pour la correction et la reconnaissance des erreurs - BH (Bloch-Harkevich), Shannon, BCH (Bowes-Chowdhury-Hoekvingham) et bien d'autres encore. Je pense que leur nombre a augmenté de façon exponentielle depuis que j'ai obtenu mon diplôme. Ainsi, tous les codes sont construits sur la propriété d'EXTREME. Et c'est le point principal de la théorie de l'information. C'est précisément pour décrire la redondance que l'on a introduit la notion d'entropie, qui est équivalente à la quantité d'information.

Ce qu'est la redondance est très facile à comprendre. Tout le monde comprendra le mot "...ussien", bien que la première lettre soit manquante. En général, la langue est redondante dans son essence même, c'est pourquoi il est facile de rétablir un mot ou une phrase originale en cas de déformation.

A propos de l'alphabet.

L'alphabet est défini par des "modèles" d'information constitués de primitives. Dans la théorie de l'information, ces modèles sont établis automatiquement. Par exemple, le système numérique binaire possède deux primitives. Si nous définissons un alphabet d'une longueur de 10 primitives, notre alphabet sera composé de 1k mots (2 à la puissance 10).

Passons maintenant au marché. La tâche consiste à créer un alphabet. Nous avons donc besoin de primitives, mais aussi de modèles. Une question logique se pose donc : que devons-nous prendre en considération ?

Le prix ?

OK. Comment créer l'alphabet du prix ? Nous prenons le plus grand écart de prix dans l'histoire du symbole et le divisons par les plus petits comptes possibles, c'est-à-dire les points. Au total, nous avons deux primitives (0 et 1) et l'alphabet, dont le nombre de signes (états) sera de deux à la puissance égale à =Waves\nombre de points.

Nous introduisons la correction - nous n'avons pas l'historique des tics, seulement les minutes. Ensuite, nous recherchons la plus petite minute en termes d'étendue, nous prenons sa valeur d'étendue comme un et nous obtenons à nouveau l'alphabet.

Le temps ?

Le temps doit être considéré en tenant compte du fait que chaque trader a un horizon d'investissement.

Nous devons mener l'analyse en fonction de cet horizon et considérer tout ce qui ne s'y inscrit pas comme du bruit. Supposons que nous voulions travailler sur la montre. Nous devons ensuite ajuster l'alphabet des prix, en fonction de la valeur de la bougie minimale d'une heure dans l'historique. Nous devons prendre la valeur de l'intervalle comme une unité de temps. La question est de savoir comment déterminer le nombre d'intervalles à prendre, car ils vont déterminer la "capacité alphabétique temporelle". La solution suggérée par les multipoints respectés - considérer les intervalles définis par les extrema de prix. Là encore, nous avons deux primitives (0-début de l'intervalle, 1-fin de l'intervalle) et l'alphabet défini par les extrêmes de prix (décalages temporels).

C'est tout.

 
alexeymosc: Au fait, je veux aller à Minsk dans les 2 ou 3 prochains mois, juste pour le plaisir. Nous pouvons nous croiser.
Je voulais absolument voir au moins un développeur à Minsk, mais il s'avère que c'est là qu'ils se cachent :)
 
VNG:


Qui a les idées claires... ;)

Merci ami inconnu (ou guidé ?).

 
VNG: La théorie de l'information a été créée comme une application de la théorie de la signalisation et a été enseignée comme "théorie statistique de la communication". C'est pourquoi, en lisant la branche, je me suis souvent demandé si j'avais tout oublié, ou si les participants à la branche ne comprenaient pas bien ce qu'ils voulaient déterrer.

Parlons du premier post du topicstarter. Y avez-vous trouvé des erreurs incurables ?

A propos de l'alphabet.

L'alphabet est défini par des "modèles" d'information constitués de primitives. Dans la théorie de l'information, les modèles sont établis automatiquement. Par exemple, le système numérique binaire - deux primitives. Un alphabet est composé de 10 primitives, donc notre alphabet est composé de 1k mots (2 à la puissance 10).

Puis nous passons progressivement au marché. La tâche consiste à créer un alphabet. Cela signifie que nous avons besoin de primitives, ou de modèles. Une question logique se pose donc : que devons-nous prendre en considération ?

Le prix ?

Ok. Comment former l'alphabet pour le prix ? Nous prenons la plus grande variation de prix dans l'histoire de l'instrument et la divisons par les plus petits nombres possibles, c'est-à-dire les points. Au total, nous avons deux primitives (0 et 1) et l'alphabet, dont le nombre de signes (états) sera de deux à la puissance égale à =Waves\nombre de points.

Nous introduisons la correction - nous n'avons pas l'historique des tics, seulement les minutes. Ensuite, nous cherchons le plus petit intervalle d'une minute, nous prenons la valeur de son intervalle pour un et nous obtenons à nouveau l'alphabet.

Tout d'abord, ce sont les retours de prix, et non le prix lui-même, qui sont étudiés. C'est l'objet de cette étude. Recherche d'arguments supplémentaires pour montrer que le prix ne peut être étudié de la même manière.

Deuxièmement, c'est déjà fait : nous divisons la distribution des rendements en quantiles (le topicstarter le faisait différemment). Chaque quantile est une lettre de l'alphabet. Il peut y en avoir n'importe où entre 2 et l'infini, mais plus de 40 est probablement irréalisable.

 
VNG:

Il est logique d'aller plus loin et de considérer l'horizon d'investissement. L'objectif se résume alors à ce qui suit - sur l'horizon d'investissement à obtenir :

1.a objectif minimal - seuil de rentabilité

2. la tâche maximale - le bénéfice prévu.

La tâche est simple.

1. obtenir un système de trading dans lequel l'ordre sera au seuil de rentabilité, disons 7 fois sur 10 n'est pas aussi difficile qu'il n'y paraît dans ces graphiques de balance TC a une vue d'une série de triangles rectangulaires (gagné, gagné, perdu tout ce qui a été gagné, gagné, ....... ). L'objectif minimum est le risque minimum. Il est préférable d'envisager une véritable "tâche minimale", un rapport bénéfice/perte clairement défini ---> profit/arrêt des pertes, sinon une autre étude_du_cheval_sphérique_dans_le_vacuum.

2. le profit est bon, mais je n'ai jamais rencontré un FC, dans lequel il n'y a pas de série de pertes, seulement rentable, le soi-disant "Grails" (je sais, j'ai vu les grailers, mais ils n'ont pas de série de pertes, mais immédiatement perdre leurs dépôts ))))). ). Je veux dire que l'objectif maximal est de réduire le nombre de transactions perdantes consécutives.

Tout n'est pas simple du tout, si c'était simple - le Fonds de pension russe gagnerait sur les marchés, au lieu de perdre ((