Statistiques de dépendance entre guillemets (théorie de l'information, corrélation et autres méthodes de sélection de caractéristiques) - page 73

 
alexeymosc:

Bien dit ! Nous, Alexei, sommes en faveur des inefficacités du marché. Et nous avons déjà des résultats pratiques qui le montrent, mais qui ne sont pas visibles à travers le prisme de l'approche statistique-économétrique classique.

En ce qui concerne votre résultat, vous avez ignoré mon message.

Laisse faire. Mais.

L'ACF classique sait où se mettre et pas seulement moi, mais des millions. Après détrition, l'ACF donne rarement des dépendances supérieures à 10 et si c'est le cas, il ne s'agit probablement pas d'une tendance qualitative. Cependant, si des dépendances subsistent et que le nombre de retards dépasse 40 (135 dans votre image), cela implique des modèles d'intégration fractionnaire (FARIMA). Et qu'est-ce qui découle de votre approche non classique? Quels modèles suivent lorsque des dépendances d'informations sont détectées ?

 
faa1947:

Ça pourrait l'être.

Tout intervalle de confiance se présente comme suit : au niveau de 5% (par exemple), l'hypothèse nulle est (n'est pas) confirmée.

Que pensez-vous de votre hypothèse nulle ? Où est l'intervalle de confiance ? etc. Si l'ACF est une chose compréhensible pour moi, votre graphique n'est pas compréhensible. Si le maximum est de 2,098 bits, alors 0,05/2,098 ne doit pas être discuté. Et les problèmes au début de la ligne ne sont pas supprimés.

Au fait, sur quoi avez-vous calculé l'ACF ?

Sur ce que j'ai compté l'ACF - j'ai écrit. Sur les données du fichier joint, seulement je prends la ligne entière de données, pas 100 points comme vous. Au fait, je ne comprends pas pourquoi vous devez prendre 100 points de données. Ce n'est pas suffisant, IMHO.

A propos de l'intervalle de confiance. Mon résultat ressemble à ceci : au niveau 0,01, l'hypothèse nulle selon laquelle les statistiques d'information mutuelle entre la barre nulle et les retards ne sont pas différentes sur les séries aléatoire et source n'est pas confirmée.

Désolé de ne pas avoir répondu tout de suite. Ça m'est sorti de l'esprit, et j'étais un peu occupé.

 
Est-ce que je comprends bien que l'acf est considéré ici pour une séquence linéaire de séries ? Et est-il possible de passer à la notion de corrélation des courbes de distribution avec l'augmentation de la longueur des séries ?
 
alexeymosc:

Ce que j'ai utilisé pour calculer l'ACF - je l'ai écrit. Sur les données du fichier joint, seulement je prends la ligne entière de données, pas 100 points comme vous. Au fait, je ne comprends pas pourquoi vous devez prendre 100 points de données. Ce n'est pas suffisant, IMHO.

A propos de l'intervalle de confiance. Mon résultat ressemble à ceci : au niveau 0,01, l'hypothèse nulle selon laquelle les statistiques d'information mutuelle entre la barre nulle et les retards ne sont pas différentes sur les séries aléatoire et source n'est pas confirmée.

Merci, vous m'avez apporté une clarté totale.
 
faa1947:
Merci, vous m'avez donné une clarté totale.
Vous êtes les bienvenus. C'était le message principal de mon article. J'ai spécifiquement effectué un test à la fin : test U de Kolmogorov-Smirnov et Mann-Whitney - pour des échantillons sans spécifier le type de distribution. Les deux tests ont montré que l'hypothèse nulle n'est pas confirmée. La manière d'interpréter cela est un sujet beaucoup plus vaste.
 
alexeymosc:
S'il vous plaît. C'était le message principal de mon article. J'ai spécifiquement effectué un test U de Kolmogorov-Smirnov et de Mann-Whitney à la fin pour les échantillons sans indication du type de distribution. Les deux tests ont montré que l'hypothèse nulle n'est pas confirmée. La façon d'interpréter cela est un sujet beaucoup plus vaste.
Alors, d'où viennent les tests et le FAC ?
 
faa1947:
Alors, d'où viennent les tests et le FAC ?
Ah, maintenant je comprends la question. Statistica.
 
alexeymosc:
Ah, maintenant je comprends la question. Statistica.
L'avant-dernière étape est EViews, puis la dernière étape est R.
 
faa1947:
L'avant-dernière étape est EViews, puis la dernière est R.

J'ai déjà entendu beaucoup de choses sur EViwes de votre part, je vais l'essayer. R - ont également entendu et même vu. Je l'essaierai aussi quand j'aurai le temps. J'ai lu sur un forum médical que parfois les résultats des calculs sur les tests diffèrent entre les différents programmes, malheureusement.

Et Excel en général - même la qualité du PRNG, contrairement à Statistica. J'ai moi-même observé des différences dans la régularité de la cloche de la distribution normale.

 

Quand j'aurai le temps, j'aimerais le faire dans ce sujet. Par analogie avec l'autocorrélation privée (où l'influence des retards intermédiaires est coupée), faire couper l'influence des retards intermédiaires lors du calcul de l'information mutuelle.

Voici un exemple. C'est l'autocorrélation de la volatilité (modulo) de l'EURUSD H1 à la profondeur jusqu'à 480 lags :

Et voici à quoi ressemble un graphique d'autocorrélations partielles - c'est-à-dire que l'influence des retards intermédiaires (fausses corrélations) a été supprimée :

Vous pouvez voir que beaucoup de corrélations sont coupées en même temps.

Ici, je veux faire une chose similaire, mais pour une série de retours avec des signes. Au moins, on pourra voir jusqu'à quel bar il y a vraiment un souvenir.