Statistiques de dépendance entre guillemets (théorie de l'information, corrélation et autres méthodes de sélection de caractéristiques) - page 16

 
Et j'ai conceptualisé un nouveau parcours de recherche (à écrire pour ceux qui sont intéressés, pas pour ceux qui jurent dans le langage des formules). Si nous avons une dépendance à l'égard de la volatilité (dépendance à l'égard des décalages les plus proches et du cyclique - 24 heures pour H1), alors pourquoi ne pas calculer la même information mutuelle pour les rendements pris modulo (qui seront de la pure volatilité), et ensuite soustraire la quantité d'information obtenue des rendements similaires (où les rendements étaient avec le signe +-). Si tout est calculé correctement, alors nous aurons une dépendance de signe dans le backlog. Ce cas peut déjà être comparé à une série temporelle de bruit.
 
alexeymosc:
Et j'ai conceptualisé un nouveau parcours de recherche (à écrire pour ceux qui sont intéressés, pas pour ceux qui jurent dans le langage des formules). Si nous avons une dépendance à l'égard de la volatilité (dépendance à l'égard des décalages les plus proches et du cyclique - 24 heures pour H1), alors pourquoi ne pas calculer la même information mutuelle pour les rendements pris modulo (qui seront de la pure volatilité), et ensuite soustraire la quantité d'information obtenue des rendements similaires (où les rendements étaient avec le signe +-). Si tout est calculé correctement, alors nous aurons une dépendance de signe dans le backlog. Ce cas peut être comparé à des séries chronologiques de bruit.

Même si l'on trouve quelque chose de non trivial, il restera toujours la question de l'application correcte des formules et, surtout, de la manière de l'appliquer en pratique. c'est-à-dire que l'intérêt est purement académique))))
 
avatara:

Mais pourriez-vous, Alexey, formuler plus clairement (à l'aide de votre tableau) quelle hypothèse sur la distribution des rendements correspond à l'estimation du chi-deux ?

Le "brun" à première vue, ou quelque chose de plus cool ?

Aucun. Lors de l'estimation de la relation chi-deux, aucune hypothèse sur les distributions n'est inventée. Il s'agit en fait d'un critère non paramétrique.

 
Mathemat:

Aucun. Aucune hypothèse sur les distributions n'est inventée lors de l'estimation de la relation chi-deux. Il s'agit donc d'un critère non paramétrique.

Comment ça, aucun ?

Pouvez-vous écrire la dépendance à estimer ?

Peut-être qu'après les formules, j'aurai l'idée. Ou bien vous espérez une distribution uniforme...

;)

 
Avals:

Même si l'on trouve quelque chose de non trivial, il restera toujours la question de l'application correcte des formules et, surtout, de la manière de l'appliquer en pratique. C'est-à-dire que l'intérêt est purement académique))))
Je pense que les résultats des expériences de prédiction sont le principal critère. S'il est évident que les statistiques de TI aident, alors tout va bien. Et pour appliquer les formules correctement bien sûr, je suis en train de lire des articles à ce sujet.
 
avatara: Comment ça, aucun ?

Puis-je noter l'estimation de la dépendance ?

Peut-être qu'après les formules, j'y verrai plus clair. Ou bien vous espérez une distribution uniforme...

Non, pas du tout, je vous dis la vérité. Hypothèses non fingo.

Avez-vous déjà essayé d'appliquer le critère d'indépendance des valeurs du chi-deux ? Je ne savais pas comment le faire moi-même il y a quelques mois, mais je l'ai fait. Essayez, il n'y a rien de difficile. Trouvez un manuel de matstat pour une institution hors de l'état et lisez-le. Plus la méthode sera décrite de manière simple et claire, plus vite vous la comprendrez.

En fait, il existe plusieurs critères de chi-deux. Mais je parle de celui qui évalue l'indépendance des valeurs. Ce critère ne l'évalue pas en fonction de distributions données a priori. Elle ne teste que l'hypothèse d'indépendance de deux variables à un niveau de signification donné (généralement 0,95 ou 0,99). Plus le niveau de signification est proche de 1, plus la conclusion est fiable.

La base idéologique du critère est la formule habituelle de la probabilité conjointe de deux quantités. Sur les doigts : si P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) pour tout x1,y1 admissible, alors X et Y sont indépendants. Et vice versa. Et le chi-deux calcule, en gros, une somme pondérée d'écarts par rapport à cette égalité pour tous les cas possibles et la compare à une certaine valeur limite. Si la somme obtenue est supérieure à cette valeur limite, alors l'hypothèse d'indépendance des variables (Null) n'est pas acceptée. Si elle est inférieure, alors l'hypothèse nulle n'est pas rejetée.

 
Mathemat:

Pas du tout, je te dis la vérité. Hypothèses non fingo.

Avez-vous déjà essayé d'appliquer le critère d'indépendance des valeurs du chi-deux ? Je ne savais pas comment le faire moi-même il y a quelques mois, mais je l'ai fait. Essayez, il n'y a rien de difficile. Trouvez un manuel de matstat pour une institution hors de l'état et lisez-le. Plus la méthode sera décrite de manière simple et claire, plus vite vous la comprendrez.

En fait, il existe plusieurs critères de chi-deux. Mais je parle de celui qui évalue l'indépendance des valeurs. Il n'évalue pas l'indépendance sur la base de distributions a priori. Elle ne teste que l'hypothèse d'indépendance de deux variables à un niveau de signification donné (généralement 0,95 ou 0,99). Plus le niveau de signification est proche de 1, plus la conclusion est fiable.

La base idéologique du critère est la formule habituelle de la probabilité conjointe de deux quantités. Sur les doigts : si P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) pour tout x1,y1 admissible, alors X et Y sont indépendants. Et vice versa. Et le chi-deux calcule, en gros, une somme pondérée d'écarts par rapport à cette égalité pour tous les cas possibles et la compare à une certaine valeur limite. Si la somme obtenue est supérieure à cette valeur limite, alors l'hypothèse de dépendance des valeurs est acceptée. Si c'est moins, l'hypothèse d'indépendance n'est pas rejetée.

Ne sois pas ridicule...

On vous a posé la question de l'hypothèse de la distribution, et vous êtes sur le point d'apprendre cette méthode hier encore.

Je veux toujours savoir - quelle est l'hypothèse nulle ? Qu'ils sont indépendants ?

 

Zéro - "les rendements sont indépendants". Ce n'est pas drôle, vraiment !

Aucune hypothèse sur les distributions que j'ai testées ! C'est un autre chi-deux. Et je n'ai testé que la dépendance !

Si vous voulez vérifier la distribution, je vous en prie. C'est un Laplacien avec une précision décente.

 
Mathemat:

Zéro - "les rendements sont indépendants". Rien de drôle, vraiment !

Aucune hypothèse sur les distributions que j'ai testées ! C'est un autre chi-deux. Et je n'ai testé que la dépendance !

Si vous voulez tester la distribution, je vous en prie. C'est un Laplacien avec une précision décente.

Ok.

Jetons un coup d'œil.

---

L'hypothèse d'indépendance est-elle la même que l'hypothèse d'une distribution uniforme ou d'une distribution normale ?

C'est ce que je veux découvrir.

Puis avec "Laplace-like", tout prend un sens.

 
alexeymosc:
Et j'ai conceptualisé un autre cours de recherche (écrire pour ceux qui sont intéressés, ne pas jurer dans un langage formel). Si nous avons des dépendances sur la volatilité (dépendance sur les décalages les plus proches ainsi que cyclique - 24 heures pour H1), alors pourquoi ne pas calculer la même information mutuelle pour les rendements pris modulo (ce serait la volatilité pure), et ensuite soustraire la quantité d'information obtenue du similaire (où les rendements étaient avec le signe +-). Si tout est calculé correctement, alors nous aurons une dépendance de signe dans le backlog. Ce cas peut déjà être comparé à une série temporelle de bruit.

Je peux le dire à ma façon ?

Ainsi, l'approche choisie montre qu'il existe des dépendances. La plus évidente, raisonnable et visible à l'œil nu est la périodicité quotidienne de la volatilité.

Par conséquent, la prochaine étape logique de ma recherche serait d'essayer d'exclure cette dépendance évidente et très forte des données et de voir si notre (votre) méthode montre la présence d'autres dépendances.

Comme méthode d'élimination, je propose de relier simplement les incréments au profil de volatilité quotidien.