Ökonometrie: Vorhersage einen Schritt voraus - Seite 116

 
faa1947:

Ich verstehe es selbst nicht.

Muster gebrochen: zz_high eurusd(-1 bis -100) c @trend

Ich prognostiziere eine abhängige Variable mit den Werten "0" - kein Signal und "1" - Umkehrsignal nach unten. Wir nehmen 100 Barren EURUSD als abhängige Variable, d.h. einen Zufallswert. Nach Schätzung des Regressionskoeffizienten erhalten wir:

ZZ_HIGH = 1-@CNORM(-(1033.56764818*EURUSD(-1) + 361.005725087*EURUSD(-2) - 659.271726689*EURUSD(-3) + 1289.20797453*EURUSD(-4) - 1024.9175822*EURUSD(-5) - 173.354947231*EURUSD(-6) - 500.755211559*EURUSD(-7) + 487.538133239*EURUSD(-8) - 1741.90012073*EURUSD(-9) + 1250.27027863*EURUSD(-10) + 1204.01840496*EURUSD(-11) - 625.209628018*EURUSD(-12) - 88.4193896778*EURUSD(-13) - 821.374855285*EURUSD(-14) - 754.491291165*EURUSD(-15) + 538.519551372*EURUSD(-16) + 3220.86311608*EURUSD(-17) - 518.070207767*EURUSD(-18) - 2332.53473806*EURUSD(-19) + 569.684891562*EURUSD(-20) - 1619.61207529*EURUSD(-21) + 1641.76931445*EURUSD(-22) - 1414.74117489*EURUSD(-23) - 114.280781428*EURUSD(-24) + 450.449461697*EURUSD(-25) - 337.460964818*EURUSD(-26) + 908.232164753*EURUSD(-27) + 601.738993689*EURUSD(-28) + 861.74494980071*EURUSD(-29) + 259.833316285*EURUSD(-30) - 46.5215488696*EURUSD(-31) - 820.583809759*EURUSD(-32) - 1423.98506887*EURUSD(-33) + 935.969451579*EURUSD(-34) - 803.436564451*EURUSD(-35) + 221.143701299*EURUSD(-36) + 335.777492236*EURUSD(-37) + 650.456824302*EURUSD(-38) + 350.318958532*EURUSD(-39) - 467.384535354*EURUSD(-40) - 1463.62960078*EURUSD(-41) + 1023.33692559*EURUSD(-42) + 531.53858297*EURUSD(-43) - 1804.43807812*EURUSD(-44) + 505.327400995*EURUSD(-45) - 20.3151847226*EURUSD(-46) + 1454.71062626*EURUSD(-47) + 149.481921853*EURUSD(-48) - 1985.4346906*EURUSD(-49) + 8.64522845766*EURUSD(-50) + 1301.22397609*EURUSD(-51) + 1398.9062339*EURUSD(-52) - 1812.25415112*EURUSD(-53) - 815.17727151*EURUSD(-54) - 465.973849717*EURUSD(-55) + 891.665097704*EURUSD(-56) - 33.8677278433*EURUSD(-57) + 1802.96642724*EURUSD(-58) + 103.739651059*EURUSD(-59) + 395.877119657*EURUSD(-60) - 1358.3140469*EURUSD(-61) + 17.0144218275*EURUSD(-62) + 645.959444744*EURUSD(-63) - 1935.40489961*EURUSD(-64) + 847.657103772*EURUSD(-65) - 348.287297241*EURUSD(-66) + 1674.82953896*EURUSD(-67) - 1399.09585978*EURUSD(-68) + 442.848712733*EURUSD(-69) + 498.667519817*EURUSD(-70) + 175.460595585*EURUSD(-71) - 3.23177058628*EURUSD(-72) - 502.970783886*EURUSD(-73) - 486.45378574*EURUSD(-74) - 1284.12753179*EURUSD(-75) + 2212.99339275*EURUSD(-76) + 1011.83438787*EURUSD(-77) - 2762.97407148*EURUSD(-78) + 1603.46426721*EURUSD(-79) - 441.847609369*EURUSD(-80) - 173.0306096*EURUSD(-81) - 672.051786135*EURUSD(-82) - 1106.57500684*EURUSD(-83) + 337.977251734*EURUSD(-84) + 1392.23135411*EURUSD(-85) + 1222.020799*EURUSD(-86) + 327.446848701*EURUSD(-87) - 1208.41468022*EURUSD(-88) + 741.85661795*EURUSD(-89) + 1585.08937121*EURUSD(-90) - 2098.86445785*EURUSD(-91) + 58.0598765644*EURUSD(-92) - 166.744222595*EURUSD(-93) + 67.6457712184*EURUSD(-94) + 98.7949064574*EURUSD(-95) + 1406.32082135*EURUSD(-96) - 1658,83294022*EURUSD(-97) - 273,851042947*EURUSD(-98) + 93,5879401275*EURUSD(-99) + 243,060588194*EURUSD(-100) - 1295,0210728 + 0,08150857192*@TREND))

Alles scheint vorhanden zu sein.

Die Vorhersageberechnung ist irgendwie völlig identisch mit der Tatsache.


Ich würde das Modell gerne verstehen. Was ist CNORM? In welchem Intervall wurde das Modell trainiert und in welchem wurde es getestet? Verstehe ich das richtig, dass die ersten 100 Zeilen der Excel-Tabellen Trainingsdaten sind? Warum sind es so wenige (gleich der Anzahl der abhängigen Variablen im Modell)?
 
gpwr:

Ich würde das Modell gerne verstehen. Was ist CNORM? Auf welchem Intervall wurde das Modell trainiert und auf welchem wurde es getestet? Verstehe ich das richtig, dass die ersten 100 Zeilen der Excel-Tabellen Trainingsdaten sind? Warum sind es so wenige (gleich der Anzahl der abhängigen Variablen im Modell)?

@cnorm(x)

kumulative Normalverteilung (CDF)


Es braucht 500 Barren. Die ersten 100 Balken werden nicht berücksichtigt, da sie in der Formel als Periode in die Wellenbewegung einfließen. Keine Ausbildung, Schätzung der Koeffizienten auf 500 Balken

 
faa1947:

@cnorm(x)

kumulative Normalverteilung (CDF)


Es werden 500 Takte genommen. Die ersten 100 Balken werden nicht berücksichtigt, da diese Balken in der Formel als Periode in der Wellenbewegung enthalten sind. Keine Ausbildung, Schätzkoeffizient bei 500 bar

Solche Modelle können manchmal genaue Vorhersagen liefern, einfach wegen der hohen Wahrscheinlichkeit des Zusammentreffens aufgrund der geringen Anzahl möglicher Endzustände, und das hat nichts zu bedeuten - nehmen Sie zum Beispiel den tatsächlichen Zuwachs für den Zeitraum der nächsten 500 Balken durch die Koeffizienten, die aus den vorherigen 500 Balken abgeleitet wurden, und messen Sie die Korrelation mit dem Zuwachs der Vorhersage - das ist der Unterschied in den Detailwerten. Der erhaltene Koeffizient wird die Qualität der Vorhersage objektiv bewerten, in Ihrem Fall können Sie die Bewertung der quantitativen Korrelation verwenden. Aber auch dies ist keine Lösung für das Prognoseproblem, denn um es als "nützliches" System zu nutzen, muss man nicht nur in der Lage sein, erfolgreich in den Markt einzusteigen, sondern ihn auch wieder zu verlassen. Es ist falsch anzunehmen, dass sich der Vorhersagefehler um einen Balken erhöht, wenn mehr Balken entnommen werden, denn das ist nicht versprochen... Genauso wie die Auswahl der Signifikanz von Variablen eine separate lösbare Aufgabe der Wissensextraktion ist (Data Mining) und es gibt bereits Methoden dafür, und es wird nicht nach dem Prinzip gemacht - braucht es 100 oder 500 Takte oder nicht...
 
dasmen:
Solche Modelle können manchmal genaue Vorhersagen liefern, einfach aufgrund der hohen Wahrscheinlichkeit des Zusammentreffens, wegen der geringen Anzahl möglicher Endzustände, und das bedeutet gar nichts - nehmen Sie zum Beispiel den tatsächlichen Zuwachs für den Zeitraum der nächsten 500 Balken durch Koeffizienten, die aus den vorherigen 500 Balken extrahiert wurden, und messen Sie die Korrelation mit der Zuwachsvorhersage - das ist die Differenz der Detailwerte. Der erhaltene Koeffizient wird die Qualität der Vorhersage objektiv bewerten, in Ihrem Fall können Sie die Bewertung der quantitativen Korrelation verwenden. Aber auch dies ist keine Lösung für das Prognoseproblem, denn um es als "nützliches" System zu nutzen, muss man nicht nur in der Lage sein, erfolgreich in den Markt einzusteigen, sondern ihn auch zu verlassen. Es ist falsch anzunehmen, dass sich der Vorhersagefehler um einen Balken erhöht, wenn mehr Balken entnommen werden, denn das ist nicht versprochen... Genauso wie die Auswahl der Signifikanz von Variablen eine separate lösbare Aufgabe der Wissensextraktion (Data Mining) ist, für die es bereits Techniken gibt, und die nicht nach dem Prinzip erfolgt, ob 100 oder 500 Takte benötigt werden...

Das ganze Thema ist reichhaltiger als der letzte Beitrag, den Sie kommentiert haben. Die Frage der Signifikanz der Variablen wurde bereits mehrfach behandelt. Die Häufung von Vorhersagefehlern ist eine medizinische Tatsache, da man mangels Fakten den vorherigen Vorhersagewert für die nächste Vorhersage übernimmt. Wenn eine Tatsache angenommen wird, ist sie eine Vorhersage, die einen Schritt voraus ist.

Aber das sind nur geringfügige und technische Probleme.

Die Verwendung von Inkrementen war. Nichts funktioniert, weil es in den Inkrementen keinen Trend gibt, aber es gibt einen prognostizierten Trend. Und hier ist die Hauptfrage des Themas: Welche Eigenschaften des Modells garantieren die Vorhersagbarkeit? Es wurde eine ganze Reihe solcher Eigenschaften für ein gewöhnliches Regressionsmodell vorgeschlagen. Was Sie kommentieren, ist ein Ausbruchsmodell, und es gibt hier noch andere Modelle, die ich nicht verstehe.

Ich wäre Ihnen dankbar, wenn Sie zu einem der vielen Punkte in diesem Thema Stellung nehmen könnten.

 
faa1947:

...Die Verwendung von Inkrementen war. Nichts funktioniert, da es keinen Trend in den Inkrementen gibt, aber der Trend wird vorhergesagt. Und hier lautet die Hauptfrage des Themas: Welche Eigenschaften des Modells garantieren die Vorhersagbarkeit? Es wurde eine ganze Reihe solcher Eigenschaften für ein gewöhnliches Regressionsmodell vorgeschlagen. Was Sie hier kommentieren, ist ein Probit-Modell, und es gibt noch andere Modelle, die ich nicht verstehe...

  1. Es ist seit vielen Jahren mathematisch bewiesen, dass, wenn das Modell und der zu analysierende Prozess identisch sind (in Ihren Worten "das richtige Modell"), die beste Vorhersage für einen Schritt vorwärts durch den Kalman-Filter gegeben ist. Suchen Sie im Forum danach...
  2. Es wurde Ihnen schon oft gesagt, dass Ihr Modell falsch ist. Hängen Sie an diesem Regressionsmodell fest, dass es keine anderen Modelle gibt ?...die ganze Welt in all ihrer Vielfalt wird durch dieses einfache Modell beschrieben ?...
  3. Und über die Art von ACF und seine Eigenschaften wurde hier schon mehr als einmal berichtet ...

Hier ist ein Link zu meiner Arbeit, die schon seit langem existiert(https://www.mql5.com/ru/code/8295).... ACF und wenn Sie genau hinschauen, sehen Sie zwei Kurven. Die erste Kurve ist (blaue Linie), die zweite rote Kurve ist der ACF der Notierungen. Sie können sie (visuell) vergleichen ...

Es gibt ein Modell (es existiert und ist seit langem bekannt), mit dem man die Korit mit ausreichender Genauigkeit für die Praxis beschreiben kann, und es ist kein Regressionsmodell. Es stimmt, dass in den Lehrbüchern der Ökonometrie wahrscheinlich nichts über dieses Modell steht... suchen Sie nach anderen Lehrbüchern

Viel Glück für alle. Glück und Gesundheit für das kommende Jahr!

 

Frohes neues Jahr! Mögen alle Modelle siegen.

 
faa1947:

Die Verwendung von Inkrementen war. Nichts funktioniert, da es keinen Trend bei den Inkrementen gibt, aber der Trend wird vorhergesagt.

Sie erklären:

1. Durch die Umstellung auf Inkremente geht der Trend verloren. Dies ist nicht richtig, da sich das Vorhandensein eines Trends direkt auf die bedingte Erwartung der Zuwächse auswirkt. Somit ist die Vorhersage des einen gleichbedeutend mit der Vorhersage des anderen.

2. dass das inkrementelle Modell nicht die Eigenschaft der Reversibilität hat. Auch dies ist nicht wahr, denn wir kennen das letzte Preisniveau. Indem wir die Inkremente vorhersagen, eine kumulative Summe daraus bilden und den letzten bekannten Preiswert addieren, erhalten wir einen Eins-zu-Eins-Übergang im Zeit-/Preisraum.

Wir haben ein primitives Regressionsmodell. Es wird gezeigt, dass innerhalb der Stichprobe der Gewinnfaktor viel größer als 10 ist. Außerhalb der Stichprobe liegt sie bei etwas mehr als 1, und selbst das ist zweifelhaft. Dieses Modell ist "richtig" konstruiert.

Frage: Warum hat dieses "richtige" Modell nicht die Eigenschaft der Stabilität oder Vorhersagbarkeit?

Sie können ein Theoretiker sein und Modelle mit einem R^2 nahe eins erstellen und nichts verdienen. Sie können als Praktiker Modelle im Hinblick auf die erwarteten Gewinne und die damit verbundenen Risiken bewerten. Der erste Fall ist gut, wenn Sie einen Artikel/eine Dissertation/was auch immer schreiben wollen. Wenn Sie Geld verdienen wollen, schätzen Sie die Modelle zuerst nach Gewinn/Risiko und erst dann nach R^2 und anderen Statistiken.

Sie können Tests innerhalb der Probe nur betrachten, wenn Sie ein stabiles positives Ergebnis außerhalb der Probe erhalten haben. Andernfalls vergeuden Sie nur Ihre Zeit.

Nächster Schritt. Anwendbarkeit von stochastischen Diffusoren auf dem Markt, Links, bitte.

Diffurs sind besonders beliebt bei der Bewertung von Derivaten wie Optionen. Es gibt auch Anwendungen in der statistischen Arbitrage.

Das gilt auch für Sie. Das NS in den Paketen (EViews hat es nicht, aber andere haben es) nimmt den Platz der Glättung ein, und dies ist nur ein kleiner Teil des Problems und nicht das wichtigste, das es zu lösen gilt. Im Fall von NS ist es eine Kunst. Wenn Sie Splines und Wavelets nehmen, ist das Mathematik.

NS tritt an die Stelle von nichtlinearen Regressionsmodellen.

 
gpwr:

Ich würde das Modell gerne verstehen. Was ist CNORM? Auf welchem Intervall wurde das Modell trainiert und auf welchem wurde es getestet? Verstehe ich das richtig, dass die ersten 100 Zeilen der Excel-Tabellen Trainingsdaten sind? Warum sind es so wenige (gleich der Anzahl der abhängigen Variablen im Modell)?

Ich würde gerne eine Sache verstehen: Wenn Sie ZZ vorhersagen, wie berechnen Sie dann den vorhergesagten ZigZag-Schritt?
 
Trolls:
  1. Es ist seit vielen Jahren mathematisch bewiesen, dass, wenn das Modell und der analysierte Prozess übereinstimmen (in Ihren Worten das "richtige Modell"), der Kalman-Filter die beste Vorhersage für einen Schritt vorwärts liefert. Suchen Sie im Forum danach...
  2. Es wurde Ihnen schon oft gesagt, dass Ihr Modell falsch ist. Hängen Sie an diesem Regressionsmodell fest, dass es keine anderen Modelle gibt ?...die ganze Welt in all ihrer Vielfalt wird durch dieses einfache Modell beschrieben ?...
  3. Und über die Art von ACF und seine Eigenschaften wurde hier schon mehr als einmal berichtet ...

Hier ist ein Link zu meiner Arbeit, die schon seit langem existiert(https://www.mql5.com/ru/code/8295).... ACF und wenn Sie genau hinschauen, sehen Sie zwei Kurven. Die erste Kurve ist (blaue Linie), die zweite rote Kurve ist der ACF der Notierungen. Sie können sie (visuell) vergleichen ...

Es gibt ein Modell (es existiert und ist seit langem bekannt), mit dem man die Korit mit ausreichender Genauigkeit für die Praxis beschreiben kann, und es ist kein Regressionsmodell. Es stimmt, dass in den Lehrbüchern der Ökonometrie wahrscheinlich nichts über dieses Modell steht... suchen Sie nach anderen Lehrbüchern

Viel Glück für alle. Glück und Gesundheit für das kommende Jahr!!!

(in Ihren Worten "richtiges Modell")

Richtig bedeutet, dass es bestimmte Eigenschaften hat. Diese Eigenschaften werden von niemandem diskutiert.

dann ist die beste Vorhersage 1 Schritt voraus der Kalman-Filter. Sie können hier im Forum danach suchen...

In EViews gibt es ein Modell namens Zustandsraum, also Kalman-Filter. Aber ich kann ein solches Modell nicht formulieren, obwohl es nach allem, was man hört, das vielversprechendste Modell ist.

  1. Und über den ACF-Typ und seine Eigenschaften wurde hier schon mehr als einmal berichtet...

Hier ist ein Link zu meiner Arbeit, die dort schon lange liegt(https://www.mql5.com/ru/code/8295).... ACF und wenn Sie genau hinschauen, sehen Sie zwei Kurven. Die erste Kurve ist (blaue Linie), die zweite rote Kurve ist der ACF der Notierungen. Sie können sie (visuell) vergleichen...

Ihren Beitrag über AFC verstehe ich nicht.

Es gibt ein Modell (es existiert und ist seit langem bekannt), das zur Beschreibung von Kotir mit ausreichender Genauigkeit für die Praxis verwendet werden kann, und es ist kein Regressionsmodell.

Was ist, wenn Sie nicht intrigieren?

 

anonymous:



1. Dass der Trend beim Übergang zu Inkrementen verloren geht. Dies ist nicht richtig, da sich das Vorhandensein eines Trends direkt auf die bedingte Erwartung der Inkremente auswirkt. Somit ist die Vorhersage des einen gleichbedeutend mit der Vorhersage des anderen.

2. dass das inkrementelle Modell nicht die Eigenschaft der Reversibilität hat. Auch dies ist nicht wahr, denn wir kennen das letzte Preisniveau. Indem wir die Inkremente vorhersagen, die kumulative Summe daraus bilden und den letzten bekannten Preiswert addieren, erhalten wir einen eindeutigen Übergang im Zeit-/Preisraum

Ich behaupte nur eines - das Ergebnis auf Inkrementen ist viel schlechter als auf Stufen. Das bin ich, und ich verallgemeinere dieses Ergebnis nicht. Es ist möglich, dass jemand anderes es bekommt.

Man kann ein Theoretiker sein, Modelle mit einem R^2 nahe eins erstellen und nichts damit verdienen. Als Praktiker kann man Modelle unter dem Gesichtspunkt des erwarteten Gewinns und der damit verbundenen Risiken bewerten. Der erste Fall ist gut, wenn Sie einen Artikel/eine Dissertation/was auch immer schreiben wollen. Wenn Sie Geld verdienen wollen, schätzen Sie die Modelle zuerst nach Gewinn/Risiko und erst dann nach R^2 und anderen Statistiken.

Sie können Tests innerhalb der Probe nur betrachten, wenn Sie ein stabiles positives Ergebnis außerhalb der Probe erhalten haben. Andernfalls vergeuden Sie nur Ihre Zeit.

In diesem Punkt stimme ich mit vielen im Forum nicht überein. Wenn Sie einen Lkw wollen und ein Fahrrad bekommen, beweist ein erfolgreicher Fahrradtest nicht, dass Sie einen Lkw haben. Das sind alles Zufälligkeiten, die sich in der realen Welt zwangsläufig ergeben.

NS tritt an die Stelle von nichtlinearen Regressionsmodellen.

Noch einmal. NS löst die Probleme nicht in ihrer ganzen Vielfalt. Ihre Bemerkung zur Nichtlinearität zeigt dies. Was sind nicht-lineare Regressionsmodelle - nach Variablen oder nach Parametern? Handelt es sich bei den Parametern um Konstanten oder um Zufallsvariablen, und wenn sie zufällig sind, was sind ihre Merkmale? Hier geht es um die Frage der NS. Sie haben ihren eigenen Platz.