Eine Stichprobenkorrelation von Null bedeutet nicht zwangsläufig, dass es keine lineare Beziehung gibt. - Seite 49

 
C-4:


Im Allgemeinen ist es ja so. Aber mit der einzigen Ausnahme, dass ich Methoden benötige, die es erlauben, die Beziehung zu bestimmen und nicht die Annahme zu verwenden, dass es eine solche Beziehung a priori gibt. Ich habe zum Beispiel einen Artikel über Regressionsanalyse auf Wikipedia gelesen:

Bevor wir also die gleiche Regressionsanalyse anwenden können, müssen wir die Beziehung ermitteln. Aber wie können wir sie identifizieren? Eine Regressionsanalyse ist unmöglich, da sie eine Folge der Beziehung ist, eine Korrelation ist ebenfalls unmöglich, da QC selbst nicht von Ursache-Wirkungs-Beziehungen spricht, eine Kreuzkorrelation? - scheint besser zu sein, aber da endet mein Wissen...

Keine große Sache. Moderne "Korrelationshändler" - es gibt sogar Stellen, die so genannt werden - gehen von der "Null"-Hypothese aus, dass ALLES MIT ALLEM VERBINDET ist, und berechnen dann durch Aufzählung die Stärke dieser Verbindung - von allem - zu allem.

Hier, in den Archiven, hat guardian.co.uk einen Blog über Finanziers. Und es gibt dort einige großartige Artikel über die wirkliche Arbeit eines Händlers in einer großen Bank oder einem Hedgefonds. Sie können bis zu ZWEI WOCHEN lang nach Korrelationen suchen, dann prüft der Händler alles in irgendeinem Mathe-Labor, hält eine Präsentation für seine Chefs, und dann eröffnet die Bank eine abgesicherte Position für etwa 100 Millionen.

http://www.guardian.co.uk/commentisfree/joris-luyendijk-banking-blog/2012/apr/02/quantatitive-prop-trader-voices-of-finance

Der Blog enthält eine Menge interessanter Informationen für professionelle Trader.

 
anonymous:

Der bekannteste Ansatz ist der Granger-Kausalitätstest. Sie können auch die Transferentropie betrachten

Wo kann ich die Dokumentation dazu finden und in welchen R-Paketen können diese Tests konsultiert werden?
 
C-4:
Und wo kann ich die Dokumentation dazu finden und in welchen R-Paketen kann ich diese Tests finden?


library(MSBVAR); ?granger.test

Es gibt keine Pakete für Transferentropie, aber es ist nicht schwer, sie selbst abzufragen.

 
Gibt es niemanden, der bereit ist, diesen Granger auf der emcool zu schreiben?
 
GaryKa: Sehr geehrte Besucher, welche Daten für die Preiszeitreihen (FX) verwenden Sie, wenn Sie Schlussfolgerungen über Stationarität, Verteilungen, Ergodizität, Korrelation und andere statistische Dinge ziehen? Die Frage ist unstrittig. Einfach oft eine der besten Bandmessungen, gemessen in astronomischer Zeit, vornehmen? Aber das ist ... wie soll ich es sagen... inakzeptabel. Es ist sinnvoll, die Abfolge der Kurswerte von "echten" Geschäften unter Berücksichtigung der realen Volumina zu analysieren. Vielleicht ist das der Sinn der Sache - die Daten für die Analyse vorzubereiten.

Lesen Sie die Definitionen in einem beliebigen Lehrbuch, um das Wesentliche zu verstehen. Es macht überhaupt keinen Unterschied, ob Sie Bid/Ask/Midprice verwenden. Die numerischen Merkmale können leicht unterschiedlich sein, aber die Schlussfolgerungen bezüglich der Stationarität sind die gleichen.

Die Frage ist etwas weiter gefasst und umfasst mehrere Teilfragen:


  • (1) Wie hoch ist der Preis bei den aktuellen Geschäften?

Angebot und Nachfrage sind nur die besten Angebote und, . und so weiter. Können sie sich ändern, wenn es keinen tatsächlichen Handel gibt? Ja, das können sie. Können sie im Falle eines Handels unverändert bleiben? Ja, absolut (teilweise ausgeführt). Mittlerer Preis! Was ist mit Zeiten, in denen sich der Spread mehrmals erhöht, was ist mit dem Midprice oder dem besten Band?

  • (2) Wie hoch ist das Volumen bei realen Geschäften?
Hier ist ein Beispiel, das ebenfalls erfunden wurde (das Bild stammt aus dem ersten Beitrag des Zweigs)


Die Korrelation ist im gesamten Bereich null, obwohl sich der gesamte Handel auf Bereiche konzentriert, in denen die Korrelation signifikant ist.
Es liegt auf der Hand, dass Geschäfte von einem Lot nicht gleichzusetzen sind mit Geschäften von 100 Lots. Und inzwischen leisten die Preisdaten solcher Mikrotransaktionen einen wichtigen Beitrag zur Berechnung selektiver Merkmale. Wenn wir die tatsächlichen Mengen kennen, könnten wir "gewichtete Durchschnitte" bilden, die besser geeignet wären.
  • (3) Wie man Daten quantisiert
Nehmen Sie den ersten Unterschied zwischen den Kerzen, es ist nicht HP BP. Und warum sollte es normal verteilt sein, wenn eine Kerze X Abschlüsse hat und die andere 100X Abschlüsse und alle mit unterschiedlichem Volumen. Vertiefung in die Zeckengeschichte, Geschichte der Stufe II? Je tiefer sie geht, desto mehr Unterschiede gibt es zwischen den Maklern.
 
C-4: I(0) ist einfach die erste Differenz von I(1).

Das ist logisch, da gibt es keinen Widerspruch. Aber die Wahrheit ist anders: I(1) ist das "Integral" von I(0) - von dem Prozess, der von Anfang an definiert ist. Es ist nicht I(0), das durch I(1) definiert wird, sondern andersherum.

I(1)-Eigenschaften könnten alles Mögliche sein, es könnte SB sein, es könnte ein realer Markt mit einer Nicht-Normalverteilung sein, Temperaturdynamik in Lissabon, was auch immer.

Entschuldigung, aber das ist nicht ganz richtig. Man muss von I(0) ausgehen, das immer stationär sein sollte und kein anderes. Aufeinanderfolgende "Integrationen" des I(0)-Prozesses führen zu unterschiedlichen I(n).

I(1) können auf keinen Fall reale Kurse sein, da der Prozess der Differenzen dieser Kurse nicht stationär ist, d. h. nicht I(0) sein kann. Ursprünglich war es (die Anführungszeichen) also nicht I(1).

 

Horror.

Bei allem Respekt, ich kann nicht verstehen, warum die Statistik auf Prozesse angewendet werden soll, deren Wesen erklärbar und beschreibbar ist.

Hier habe ich etwas entwickelt. Keiner weiß, ob sie gut oder schlecht ist. Schalten Sie die Statistik ein - sie wird entscheiden. Wenn es niemand weiß!

 
hMathemat:

Das ist logisch, da gibt es keinen Widerspruch. Aber die Wahrheit ist anders: I(1) ist das "Integral" von I(0) - des Prozesses, der von Anfang an definiert ist. Es ist nicht I(0), das durch I(1) definiert wird, sondern andersherum.

Entschuldigung, aber das ist nicht ganz richtig. Man muss von I(0) ausgehen, das immer stationär sein muss und kein anderes. Aufeinanderfolgende "Integrationen" des I(0)-Prozesses führen zu unterschiedlichen I(n).

I(1) können auf keinen Fall reale Kurse sein, weil der Prozess der Differenzen dieser Kurse nicht stationär ist, d. h. nicht I(0) sein kann. Ursprünglich war es (die Anführungszeichen) also nicht I(1).

Nehmen wir an, MQ hat beschlossen, MetaTrader 6 zu veröffentlichen, in dem anstelle der klassischen Diagramme in Form von Balken und Kerzen nur noch Kursinkremente angezeigt werden. Der Markt ist immer noch nicht normal, aber wir nutzen und verlassen uns jetzt auf I(0).

Beide Prozesse in der obigen Abbildung sind von der Ordnung I(0), aber der erste ist eine klassische Normalverteilung und der zweite ist ein realer und nicht-stationärer RTS-Markt. Wenn das untere Bild kein Prozess der Ordnung I(0) ist, welche Ordnung ist es dann und wie sollte man es nennen?

 
Integer:
Gibt es niemanden, der bereit ist, diesen Granger auf dem Emculus nachzuahmen?

Es wäre schön zu wissen, wie es funktioniert.

Hat jemand das Buch von Granger aus dem Jahr 1969"Investigating Causal Relations by Econometric Models and Cross-Spectral Methods")?

Und, um ehrlich zu sein, verstehe ich immer noch nicht, wer mehr Schuld am israelisch-polnischen Konflikt hat. Die Juden? Die Araber?

Es gibt nur einen speziellen Datensatz namens IsraelPalestineConflicte, der zu dem Test gehört und so aussieht:

Sie können sehen, dass die Daten eng korreliert sind, aber Sie können nicht erkennen, wer die Schuld trägt, und was Granger sagt, ist nicht klar.

 
C-4: Wenn das untere Bild kein Prozess der Ordnung I(0) ist, welche Ordnung ist es dann und wie nennt man sie?
Ich weiß es nicht, wir müssen es überprüfen. Hier lässt die FAA nach unidirektionalen Wurzeln suchen.