Das Sultonov-Regressionsmodell (SRM) - behauptet, ein mathematisches Modell des Marktes zu sein. - Seite 44

 
yosuf: wobei - A, a1, a2, a3, a4 konstante Koeffizienten sind, die durch die MNC-Gauß-Methode bestimmt werden, und dies ist, was wir für 15 Takte von TF D1 erhalten:

Fünf Parameter für 15 Punkte sind zu viel. Die übliche Anprobe.

Versuchen Sie dieselbe Gleichung mit denselben Parametern für tausend Takte.

Ihre Forschung scheint eine andere Richtung einzuschlagen. Früher haben Sie Difuras erfunden und versucht, den Markt zu erklären.

Jetzt versuchen Sie nur, es zu beschreiben, ohne es überhaupt zu erklären.

 
Mathemat:

Fünf Parameter für 15 Punkte sind zu viel. Die übliche Passform.

Versuchen Sie dieselbe Gleichung mit denselben Parametern für tausend Takte.

Ihre Forschung scheint eine andere Richtung einzuschlagen. Früher haben Sie Difuras erfunden und versucht, den Markt zu erklären.

Jetzt versuchen Sie nur, es zu beschreiben, ohne es überhaupt zu erklären.

1. richtig bemerkt, handelt es sich hier um bloße Statistik und ein Nebenprodukt einer anderen Forschungsrichtung, die nichts mit Forex zu tun hat. Wie Sie wissen, hat Gauß für die Schätzung der Koeffizienten einer linearen Gleichung mit einer Reihe von Variablen nach der ANC-Methode nur eine zweistufige Methode angegeben, bei der die Variablen im ersten Schritt schrittweise eliminiert und die Koeffizienten im zweiten Schritt ermittelt werden, was sehr arbeitsintensiv und umständlich ist. Die zweite Methode basiert auf der Cramer-Methode mit Determinanten, die nicht einfacher ist als die Gauß-Methode und die gleiche Rechenkomplexität aufweist, obwohl sie eleganter ist. Ich habe es geschafft, die Methode entscheidend zu vereinfachen und die Koeffizienten direkt zu bestimmen, und das obige Beispiel ist ein Debüt, und ich dachte, Sie werden darauf achten, wie ich es geschafft habe, 5 Koeffizienten zu finden, während ich vier Variablen gleichzeitig variierte. Normalerweise wird zum Beispiel bei der Planung eines Experiments empfohlen, die Koeffizienten schrittweise mit nur einer Variablen zu bestimmen und die anderen Variablen konstant zu halten - Sie erinnern sich vielleicht an diesen nicht sehr erfolgreichen Hit der 60er und 70er Jahre. Ich habe kein Problem damit, 1000 Tafeln gleichzeitig zu recherchieren, und ich werde das auch tun. Sagen Sie mir bitte, wie man die Geschichte direkt in exel mit Kommas herunterlädt, sorry, ich bin eine Null in der Technik der Verwendung eines Computers. Ich lerne allmählich und nur das, was ich im Moment brauche. Bitte spezifizieren Sie sehr detailliert, bis hin zur Reihenfolge des Tastendrucks.

2. Keine Anpassung, aber die Menge der Daten ist in der Tat nicht sehr groß, da sie manuell eingegeben wurden. Es ist jedoch bemerkenswert, dass diese einfache Gleichung versucht, die Preisschwankungen so zu beschreiben, als ob sie periodisch wären, obwohl sie es keineswegs sind.

3. Halten Sie es für sinnvoll, diesen vier Parametern Volumina hinzuzufügen, zumal sie verfügbar sind, obwohl sie als verzerrt gelten?

4. hat den Unterschied der Koeffizienten bei OHLC bemerkt, der offenbar auf einen Mangel an Daten zurückzuführen ist.

 
yosuf:



Sagen Sie mir bitte einfach, wie ich die Geschichte direkt in exel mit Kommas herunterladen kann, sorry, ich bin ein Anfänger in Computertechnik.

1. Drücken Sie im Terminal die Taste F2. Wählen Sie in der sich öffnenden Tabelle ein Symbol aus und drücken Sie "Exportieren". Wir haben eine Akte.

Wir öffnen die Datei in Excel. Sieht so aus:

2012.06.27,00:00,1.2494,1.2500,1.2491,1.2492,167
2012.06.27,01:00,1.2493,1.2494,1.2486,1.2489,108
2012.06.27,02:00,1.2488,1.2493,1.2484,1.2486,217
2012.06.27,03:00,1.2487,1.2499,1.2484,1.2492,244
2012.06.27,04:00,1.2493,1.2506,1.2491,1.2503,265

3. In Excel oben auf der Registerkarte "Daten".

4. Markieren Sie den gewünschten Datenabschnitt in der Tabelle.

5. Klicken Sie auf "Spaltenweise" Der Text-Assistent wird geöffnet.

6. Im ersten Schritt wählen wir "Abgegrenzt".

7. Im zweiten Schritt des Assistenten sollten Sie zusätzlich das Komma-Trennzeichen angeben.

8. Auf der dritten Stufe:

8.1. Für die ersten beiden Spalten geben Sie das Datenformat der Spalte "Text" an.

8.3 Im Übrigen belassen wir es bei "Allgemein", öffnen aber "Mehr Details" und setzen "Punkt" als Platzhalter.

Sie sollte wie folgt aussehen

2012.06.27 00:00 1,2494 1,25 1,2491 1,2492 167
2012.06.27 01:00 1,2493 1,2494 1,2486 1,2489 108
2012.06.27 02:00 1,2488 1,2493 1,2484 1,2486 217
2012.06.27 03:00 1,2487 1,2499 1,2484 1,2492 244
2012.06.27 04:00 1,2493 1,2506 1,2491 1,2503 265
2012.06.27 05:00 1,2504 1,2508 1,2497 1,2499 220
2012.06.27 06:00 1,25 1,2506 1,2496 1,2503 248
2012.06.27 07:00 1,2502 1,2506 1,2498 1,2499 236
2012.06.27 08:00 1,25 1,2503 1,2487 1,2494 437
2012.06.27 09:00 1,2493 1,2503 1,2482 1,2499 667
2012.06.27 10:00 1,2498 1,2502 1,2491 1,2494 581
 

Es braucht nur diese Gleichung

F=1.00010409798*CLOSE(-1)^0.999631066509

Der Versuch, einen weiteren Wert hinzuzufügen, führt zu einer degenerierten (singulären) Matrix.

Die Passform ist sehr gut.

Abhängige Variable: F

Methode: Panel Least Squares

Datum: 30.11.12 Uhrzeit: 10:57

Probe: 1 2652

Einbezogene Zeiträume: 23

Einbezogene Querschnitte: 113

Gesamte Panelbeobachtungen (unausgewogen): 2538

Konvergenz nach 1 Iteration erreicht

F=C(1)*SCHLIESSEN(-1)^C(2)

Koeffizient Std. Fehler t-Statistik Prob.

C(1) 1.000104 0.000122 8222.019 0.0000

C(2) 0.999631 0.000511 1955.530 0.0000

R-Quadrat 0,999342 Mittlere abhängige Variable 1,266171

Bereinigtes R-Quadrat 0,999342 S.D. abhängige Variable 0,029512

S.E. der Regression 0,000757 Akaike-Infokriterium -11,53332

Summe der quadrierten Residuen 0,001454 Schwarz-Kriterium -11,52872

Log Likelihood 14637.78 Hannan-Quinn-Kriterium. -11.53165

Durbin-Watson-Statistik 1.951579

Sie kann rückgängig gemacht werden:

Abhängige Variable: CLOSE

Methode: Panel Least Squares

Datum: 30.11.12 Uhrzeit: 10:59

Probe: 1 2652

Einbezogene Zeiträume: 23

Einbezogene Querschnitte: 113

Gesamte Panelbeobachtungen (unausgewogen): 2538

Konvergenz nach 2 Iterationen erreicht

SCHLIESSEN=C(1)*F(-1)^C(2)

Koeffizient Std. Fehler t-Statistik Prob.

C(1) 1.000222 0.000233 4283.747 0.0000

C(2) 0.999132 0.000981 1018.334 0.0000

R-Quadrat 0,997578 Mittlere abhängige Variable 1,266170

Bereinigtes R-Quadrat 0,997577 S.D. abhängige Variable 0,029520

S.E. der Regression 0,001453 Akaike-Infokriterium -10,22961

Summe der quadrierten Residuen 0,005354 Schwarz-Kriterium -10,22501

Log Likelihood 12983.38 Hannan-Quinn-Kriterium. -10.22794

Durbin-Watson-Statistik 1.294442

Hier ist die Tabelle

Wir sehen Ausschläge von etwa 100 Punkten. Aber ein sehr ordentliches Histogramm, wenn auch nicht normal

Quoten = 14 Pips.

Aber die Konfidenzellipse ist deprimierend - wir sehen eine extrem hohe Korrelation unserer Koeffizienten. Dies ist der Grund für die Singularität der Matrix, wenn zusätzliche Variablen hinzugefügt werden.

Ich würde davon absehen, die obige Gleichung zu verwenden

 
yosuf:

Ich habe versucht, den durchschnittlichen prognostizierten Preis eines zukünftigen Balkens (F) durch die OHLC-Preise der vorangegangenen Balken als folgende Beziehung auszudrücken, obwohl ich nicht weiß, ob dies in dieser Form schon einmal versucht wurde oder nicht:

F=A*O^a1*H^a2*L^a3*C^a4,

wobei - A, a1, a2, a3, a4 konstante Koeffizienten sind, die durch die MNC-Gauß-Methode bestimmt werden, und dies ist, was wir für 15 Takte von TF D1 erhalten

A a4 a3 a2 a1
1,0531049 1,17477 -0,70935 0,04371 0,27950

Der Quotient kann also im Prinzip durch eine einzige Gleichung ausgedrückt werden, aber wir wollen herausfinden, welchen praktischen Nutzen dies hat. Was sind Ihre Ansichten?

Ich habe den Zeitraum, aus dem Sie die Preisstichprobe entnommen haben, nicht gefunden, aber die letzten 15 Balken zeigen das gleiche Bild (gemäß der obigen Formel und den abgeleiteten Koeffizienten):

Das grüne МА mit der Periode = 1 wird zum besseren Vergleich der Vorhersage verwendet.

Die Preismarken werden durch ein Skript gezeichnet (im Anhang).

Dateien:
 
TarasBY:

Ich habe den Zeitraum, aus dem Sie die Preisstichprobe genommen haben, nicht gefunden, aber die letzten 15 Balken zeigen dieses Bild (gemäß der Formel und den von Ihnen abgeleiteten Koeffizienten):

Das grüne МА mit der Periode = 1 wird zum besseren Vergleich der Vorhersage verwendet.

Die Preismarken werden durch ein Skript gezeichnet (im Anhang).

Daten zu D1 vom 16. 09. 12 bis 05. 10. 12
 
yosuf:
Daten verwendet auf D1 vom 16. 09. 12 bis 05. 10. 12
Ich habe nicht sofort bemerkt, dass die Koeffizienten in umgekehrter Reihenfolge angeordnet sind: a4 -> a1. Dann, einen Monat später, sind die berechneten Koeffizienten nicht "ein Fingerzeig"... ;)

P.S. Und wenn es nicht das Ende des Monats wäre, wäre die aktuelle Kerze "bearish"... :)))
 
TarasBY:
Ich habe nicht sofort bemerkt, dass die Koeffizienten in umgekehrter Reihenfolge angeordnet sind: a4 -> a1. Dann, einen Monat später, sind die berechneten Koeffizienten nicht "ein Fingerzeig"... ;)

P.S. Und wenn es nicht das Ende des Monats wäre, wäre die aktuelle Kerze "bearish"... :)))
Heißt das, so weit, so gut? In der Tat, nach einem Monat ist nicht schlecht, jetzt werden wir versuchen, die Koeffizienten bis jetzt zu bestimmen. Dann werden wir das Verhalten der Koeffizienten untersuchen, vielleicht finden wir einige zuverlässige Vorläufer des Trends.
 
faa1947:

Es braucht nur diese Gleichung

F=1.00010409798*CLOSE(-1)^0.999631066509

Der Versuch, einen weiteren Wert hinzuzufügen, führt zu einer degenerierten (singulären) Matrix.

Die Passform ist sehr gut.

Abhängige Variable: F

Methode: Panel Least Squares

Datum: 30.11.12 Uhrzeit: 10:57

Probe: 1 2652

Einbezogene Zeiträume: 23

Einbezogene Querschnitte: 113

Gesamte Panelbeobachtungen (unausgewogen): 2538

Konvergenz nach 1 Iteration erreicht

F=C(1)*SCHLIESSEN(-1)^C(2)

Koeffizient Std. Fehler t-Statistik Prob.

C(1) 1.000104 0.000122 8222.019 0.0000

C(2) 0.999631 0.000511 1955.530 0.0000

R-Quadrat 0,999342 Mittlere abhängige Variable 1,266171

Bereinigtes R-Quadrat 0,999342 S.D. abhängige Variable 0,029512

S.E. der Regression 0,000757 Akaike-Infokriterium -11,53332

Summe der quadrierten Residuen 0,001454 Schwarz-Kriterium -11,52872

Log Likelihood 14637.78 Hannan-Quinn-Kriterium. -11.53165

Durbin-Watson-Statistik 1.951579

Sie kann rückgängig gemacht werden:

Abhängige Variable: CLOSE

Methode: Panel Least Squares

Datum: 30.11.12 Uhrzeit: 10:59

Probe: 1 2652

Einbezogene Zeiträume: 23

Einbezogene Querschnitte: 113

Gesamte Panelbeobachtungen (unausgewogen): 2538

Konvergenz nach 2 Iterationen erreicht

SCHLIESSEN=C(1)*F(-1)^C(2)

Koeffizient Std. Fehler t-Statistik Prob.

C(1) 1.000222 0.000233 4283.747 0.0000

C(2) 0.999132 0.000981 1018.334 0.0000

R-Quadrat 0,997578 Mittlere abhängige Variable 1,266170

Bereinigtes R-Quadrat 0,997577 S.D. abhängige Variable 0,029520

S.E. der Regression 0,001453 Akaike-Infokriterium -10,22961

Summe der quadrierten Residuen 0,005354 Schwarz-Kriterium -10,22501

Log Likelihood 12983.38 Hannan-Quinn-Kriterium. -10.22794

Durbin-Watson-Statistik 1.294442

Hier ist die Tabelle

Wir sehen Ausschläge von etwa 100 Punkten. Aber ein sehr ordentliches Histogramm, wenn auch nicht normal

Quoten = 14 Pips.

Aber die Konfidenzellipse ist deprimierend - wir sehen eine extrem hohe Korrelation unserer Koeffizienten. Dies ist der Grund für die Singularität der Matrix, wenn zusätzliche Variablen hinzugefügt werden.

Ich würde davon absehen, die obige Gleichung zu verwenden

Ziehen Sie keine voreiligen Schlüsse
 
yosuf:
Ziehen Sie keine voreiligen Schlüsse
Wenn Sie das Ellipsenproblem lösen, was auf einen hohen Korrelationskoeffizienten hindeutet, können Sie eine Lösung finden.