Das Sultonov-Regressionsmodell (SRM) - behauptet, ein mathematisches Modell des Marktes zu sein. - Seite 46

 
VladislavVG:


Das spielt keine Rolle. Die Methode zur Lösung der Gleichung hat keinen Einfluss auf die Lösung, wenn sie existiert und singulär ist, aber wenn es viele akzeptable Lösungen gibt und Yusuf ein lokales Minimum hat, dann sind Genetik oder Bienen besser. Für eine manuelle Lösung verwenden Sie einfach einen Tester: der genetische Algorithmus wird Ihnen helfen.

Es besteht die Gefahr, dass man in die Anpassung abrutscht - bei so vielen Parametern, die man variieren kann, muss man mehr Beispiele nehmen, um zu optimieren.

Und noch eine Bemerkung: Sie kennen den Stichprobenzeitraum nicht, in dem die Koeffizienten gesucht wurden. Wenn dieser Zeitraum mit der Periode des ausgeglichenen Wachstums in der Grafik zusammenfiel, dann ist leider nicht alles so rosig.

In meinem Fall gibt es, wenn überhaupt, nur eine einzige Lösung, und diese Lösung ergibt immer die Summe der Residuen Null (MO=0), d.h. es handelt sich um eine analytisch exakte Lösung der betreffenden Gleichung, und Näherungslösungen kommen nicht in Frage, obwohl Sie Recht haben und sie eine Existenzberechtigung haben. Aber jetzt, mit dem Aufkommen der exakten Lösungsmethode, ist es unsinnig, sich mit Näherungslösungen zu beschäftigen. Der Fall der Entartung der Eingabedaten, bei dem es unmöglich ist, die Gleichung zu lösen, wurde bei den OHLC-Devisen-Daten noch nicht beobachtet. Der Algorithmus ist nicht über sie gestolpert, also sind sie korrekt.
 

Versuchen wir nun, die Abhängigkeit des Durchschnittspreises der Bildung des nächsten Balkens als lineare Funktion des Typs auszudrücken:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Für eine ausgewählte Historie von 15 Tagesbalken D1 ergeben sich die folgenden Koeffizientenwerte:

a4 a3 a2 a1 a0 RR. %.
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894








Wir haben sehr wichtige Informationen über die Art der Preisänderung erhalten:
1. Die Schlusskurse des aktuellen Barren C sind für die Bildung des zukünftigen Barrenpreises am wichtigsten;
2. Am zweitwichtigsten sind die L-Preise, die auf eine erhebliche Stärke der Bären im Verhältnis zu den Bullen hinweisen;
3. Dann sind O-Eröffnungspreise von Bedeutung;
4. Die Geringfügigkeit der H-Preise deutet darauf hin, dass eine signifikante Aufwärtsbewegung der Preise unwahrscheinlich ist.
Fazit: Auf kurze Sicht ist VERKAUFEN vorzuziehen.




 
yosuf:

Versuchen wir nun, die Abhängigkeit des Durchschnittspreises der Bildung des nächsten Balkens als lineare Funktion des Typs auszudrücken:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Für eine ausgewählte Historie von 15 Tagesbalken D1 ergeben sich die folgenden Koeffizientenwerte:

a4 a3 a2 a1 a0 RR. %.
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894














Ich verstehe überhaupt nicht, wie Regressionskoeffizienten geschätzt werden.

Hier ist die Methode der kleinsten Quadrate (OLS) für EURUSD_H1 Stichprobenlänge = 50 Balken.

Abhängige Variable: F

Methode: Panel Least Squares

Datum: 12/02/12 Uhrzeit: 10:26

Probe: 1 50

Einbezogene Zeiträume: 23

Inklusive Querschnitte: 3

Gesamte Panelbeobachtungen (unausgewogen): 47

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Koeffizient Std. Fehler t-Statistik Prob.

C(1) 0,114716 0,046286 2,478392 0,0173

C(2) -0.051038 0.156544 -0.326030 0.7460

C(3) -0,343986 0,179835 -1,912786 0,0626

C(4) 0,139395 0,190961 0,729968 0,4695

C(5) 1,163942 0,207562 5,607671 0,0000

R-Quadrat 0,947458 Mittlere abhängige Variable 1,247037

Bereinigtes R-Quadrat 0,942454 S.D. abhängige Variable 0,002839

S.E. der Regression 0,000681 Akaike-Infokriterium -11,64578

Summe der quadrierten Residuen 1.95E-05 Schwarz-Kriterium -11.44895

Log Likelihood 278.6757 Hannan-Quinn-Kriterium. -11.57171

F-Statistik 189.3409 Durbin-Watson-Statistik 1.935322

Prob(F-Statistik) 0.000000

Hier ist das Diagramm

Hier istdie Methode der kleinsten Quadrate (LOS) für EURUSD_H1 mit einer Stichprobenlänge von 2000 Balken.

Abhängige Variable: F

Methode: Panel Least Squares

Datum: 12/02/12 Uhrzeit: 10:29

Stichprobe: 1.000

Einbezogene Zeiträume: 23

Einbezogene Querschnitte: 85

Gesamte (unausgewogene) Panelbeobachtungen: 1915

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Koeffizient Std. Fehler t-Statistik Prob.

C(1) 0,000190 0,000729 0,260526 0,7945

C(2) 0,026179 0,029181 0,897122 0,3698

C(3) -0,020055 0,028992 -0,691745 0,4892

C(4) -0,106262 0,032127 -3,307569 0,0010

C(5) 1,099945 0,031672 34,72901 0,0000

R-Quadrat 0,999362 Mittlere abhängige Variable 1,259869

Bereinigtes R-Quadrat 0,999361 S.D. abhängige Variable 0,031014

S.E. der Regression 0,000784 Akaike-Infokriterium -11,46178

Summe der quadrierten Residuen 0,001174 Schwarz-Kriterium -11,44727

Log Likelihood 10979.66 Hannan-Quinn-Kriterium. -11.45644

F-Statistik 748391.1 Durbin-Watson-Statistik 2.058272

Prob(F-Statistik) 0.000000

Bei jeder Stichprobenlänge ist es obligatorisch, den Fehler der geschätzten Koeffizienten zu berechnen. Und wir sehen, dass bei der letzten Schätzung mit dem Wert des Koeffizienten =0,000190 der skop =0,000729. Nicht nur der Wert des Koeffizienten ist lächerlich, sondern auch das 7-fache des Nennwerts!

Tut mir leid, Yusuf, aber das ist ein anderes Fahrrad. Jedes Lehrbuch über Regressionsanalyse beginnt mit einer Gleichung wie der Ihren. Aber im Gegensatz zu Ihnen wissen die Schüler, wie man das Ergebnis der Anpassung bewertet - jeder von ihnen wird Ihnen sagen, dass die besagte Regression nicht verwendet werden kann.

 
faa1947:


Ich verstehe überhaupt nicht, wie Regressionskoeffizienten geschätzt werden.

Hier ist die Methode der kleinsten Quadrate (OLS) für EURUSD_H1 Stichprobenlänge = 50 Balken.


Bei jeder Stichprobenlänge ist es obligatorisch, den Fehler der geschätzten Koeffizienten zu berechnen. Und wir sehen, dass bei der letzten Schätzung mit dem Koeffizienten =0,000190 sko =0,000729. Nicht nur der Wert des Koeffizienten ist lächerlich, sondern auch das Siebenfache des Nennwerts!

Bitte nennen Sie mir die Art der Regressionsgleichung, die Sie untersuchen.
 
yosuf:
Bitte geben Sie die Art der Regressionsgleichung an, die Sie untersuchen.


Es ist im Beitrag aufgeführt. Hier ist eine Kopie:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Für 50 Balken ergibt sich der folgende Koeffizient.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Aber es geht um die Schätzung dieser Koeffizienten, und Sie wollen nicht verstehen, dass man der Schätzung der Koeffizienten (ihrem Wert) bei weitem nicht immer, sondern eher immer, nicht trauen kann. Dies ist das Herzstück der Regressionsanalyse.

Sie müssen die Frage beantworten: Auf welcher Grundlage glauben wir, dass die Koeffizienten, die wir berechnen, genau den Wert haben, den wir sehen?

 
faa1947:


So steht es in dem Beitrag. Hier ist eine Kopie:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Für 50 Balken ergibt sich der folgende Koeffizient.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Aber es geht um die Schätzung dieser Koeffizienten, und Sie wollen nicht verstehen, dass man der Schätzung der Koeffizienten (ihrem Wert) keineswegs immer, sondern eher immer, nicht trauen kann. Dies ist das Herzstück der Regressionsanalyse.

Wir müssen die Frage beantworten: Auf welcher Grundlage glauben wir, dass die Koeffizienten, die wir berechnen, genau den Wert haben, den wir sehen?

Definitionsgemäß liefert MNC die beste Schätzung der Koeffizienten der betreffenden Gleichung, und wenn Sie diese aus irgendeinem Grund nicht mögen, suchen Sie nach einer anderen Möglichkeit, sie zu schätzen, oder ändern Sie die Form der Gleichung. Dies ist der Standardansatz bei der Untersuchung von Phänomenen und Prozessen. Wenn die Regressionsgleichung mit dem gefundenen ANC einen relativen Fehler von weniger als 1 % (in diesem Fall 0,29 %) ergibt, was will ich dann noch von diesen Koeffizienten? Sie stehen vor dem Problem der Zuverlässigkeit der Koeffizienten, denn es wurde noch kein zuverlässigeres Verfahren als das ANC entwickelt, um die Koeffizienten zu bestimmen. Wir müssen uns jedoch darüber im Klaren sein, dass alle unsere Überlegungen und Schlussfolgerungen nur innerhalb der betreffenden Stichprobe zutreffen und es keine Garantie dafür gibt, dass sie auch außerhalb dieser Stichprobe, einschließlich der Zukunft, zutreffen werden. Aber wir sind gezwungen, mit einer gewissen Wahrscheinlichkeit davon auszugehen, dass sie in naher Zukunft anwendbar sein werden. Nichts und niemand kann die Zukunft mit absoluter Gewissheit vorhersagen.
 
yosuf:
Definitionsgemäß liefert MNC die beste Schätzung der Koeffizienten der betreffenden Gleichung, und wenn Ihnen diese aus irgendeinem Grund nicht gefällt, suchen Sie nach einer anderen Möglichkeit, sie zu schätzen, oder ändern Sie die Form der Gleichung. Dies ist der Standardansatz bei der Untersuchung von Phänomenen und Prozessen. Wenn die Regressionsgleichung mit dem gefundenen ANC einen relativen Fehler von weniger als 1 % (in diesem Fall 0,29 %) ergibt, was will ich dann noch von diesen Koeffizienten? Sie stehen vor dem Problem der Zuverlässigkeit der Koeffizienten, denn es wurde noch kein zuverlässigeres Verfahren als das ANC entwickelt, um die Koeffizienten zu bestimmen. Wir müssen uns jedoch darüber im Klaren sein, dass alle unsere Überlegungen und Schlussfolgerungen nur innerhalb der betreffenden Stichprobe zutreffen und es keine Garantie dafür gibt, dass sie auch außerhalb dieser Stichprobe, einschließlich der Zukunft, zutreffen werden. Aber wir sind gezwungen, mit einer gewissen Wahrscheinlichkeit davon auszugehen, dass sie in naher Zukunft anwendbar sein werden. Nichts und niemand kann die Zukunft mit absoluter Gewissheit vorhersagen.


Irgendwie sind Sie nicht in den Bericht über die Regressionsanpassung gekommen. Bei letzteren haben die verschiedenen Koeffizienten eine unterschiedliche Berechnungsgenauigkeit. Der beste Wert ist 3%. Es gibt aber auch ein Vielfaches von Par.

Ich hänge mich nicht an irgendetwas auf. Ich führe einfach die Standard-Regressionsschätzung durch. Jedenfalls gebe ich keine Koeffizientenwerte an, ohne sie zu schätzen.

Über das ISC. Ich möchte Sie enttäuschen. Die MNC-Methode ist nicht die einzige Methode, und sie ist zudem mit zahlreichen Einschränkungen verbunden. Es gibt andere Methoden, die keine solchen Einschränkungen haben.

 
yosuf:

Versuchen wir nun, die Abhängigkeit des Durchschnittspreises der Bildung des nächsten Balkens als lineare Funktion des Typs auszudrücken:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Für eine ausgewählte Historie von 15 Tagesbalken D1 ergeben sich die folgenden Koeffizientenwerte:






Diese 15 Tagesbalken - welche Daten wurden genommen?
 
Demi:
Diese 15-Tage-Balken - welche Daten wurden genommen?

Daten verwendet auf D1 vom 16. 09. 12 bis 05. 10. 12
 
yosuf:
Daten verwendet auf D1 vom 16. 09. 12 bis 05. 10. 12




))))I dachte das:

1. Ihre Daten sind nicht homogen. Das Modell enthält Daten zur Beschreibung der 24-Stunden-Preisdynamik und Daten zur Beschreibung der 4-Stunden-Preisdynamik. Die Daten für Sonntag sollten entfernt werden. Diesen Fehler macht jeder.

2) Sie müssen eine optimale Anzahl von Beobachtungen haben. Es gibt keine genaue Formel, aber die Zahl liegt irgendwo zwischen 5 und 10 Beobachtungen pro Variable. Sie haben vier Variablen und fünfzehn Beobachtungen. Das Modell ist unzureichend. Und machen Sie es nicht wie ein großer Experte in diesem Forum - nehmen Sie ein Modell mit vier Variablen und 5.000 Beobachtungen! ))))

3. wenn Sie das Modell erstellt haben, bestimmen Sie die partiellen Korrelationskoeffizienten für jede Variable. Und Sie stellen fest, dass nur C statistisch signifikant ist. Erstellen Sie ein Modell, das nur C enthält, und der Koeffizient vor C wird positiv sein.

Daraus lässt sich eine Schlussfolgerung ziehen, die für ALLE autoregressiven Modelle gilt: WENN DER PREIS STEIGT, dann ist die Wahrscheinlichkeit höher, dass er auch in Zukunft steigen wird und umgekehrt. Dann werfen Sie das Modell weg.