Regressionsgleichung - Seite 8

 
Andrei01:
Was ist falsch an einem Zickzackkurs, um das Minimum einer Funktion zu finden?
Und wie soll man zum Beispiel einen Zickzackkurs im zehndimensionalen Raum bauen? )))))) Und wie viele Rechenressourcen werden dafür benötigt?
 
alsu:
Und wie wollen Sie zum Beispiel einen Zickzackkurs im zehndimensionalen Raum bauen? )))))) Und wie viele Rechenressourcen werden dafür benötigt?
nicht viel, man kann den Ring nicht schließen. ein voller Kreis ist nötig ))
 
alsu:
Und wie wollen Sie zum Beispiel einen Zickzackkurs im zehndimensionalen Raum bauen? )))))) Und wie viele Rechenressourcen werden dafür benötigt?
Ich denke, dass die Ressourcen in diesem Stadium zweitrangig sind, aber wenn es rentabel ist, können wir über eine Optimierung nachdenken)).
 
j21:

Ich habe mich für die Regressionsgleichungen interessiert. Ich bin jedoch auf ein Problem gestoßen, sie angemessen zu beschreiben. Welche Daten haben wir: Zeit (z.B. M15), HIGH, LOW, OPEN, CLOSE, VOLUME. Für uns ist es eine Reihe von Beobachtungen. Wir haben einen Indikator, für den wir eine funktionale Beziehung zu den Objektparametern (in unserem Fall die Veränderung des Wechselkurses) herstellen müssen - Faktoren. Erforderlich: Herstellung einer quantitativen Beziehung zwischen dem Indikator und den Faktoren. In diesem Fall wird die Aufgabe der Regressionsanalyse als die Aufgabe verstanden, die funktionale Abhängigkeit y* = f(x 1, x 2, ..., x t) zu identifizieren, die die vorliegenden Daten am besten beschreibt.

Die Funktion f(x 1, x 2, ..., x t), die die Abhängigkeit des Indikators von den Parametern beschreibt, wird Regressionsgleichung (Funktion) genannt.

Also. Frage 1: Welche der uns zur Verfügung stehenden Daten sollten wir als Indikator und welche als Faktor wählen? Der logische Indikator ist die Zeit, die Faktoren sind H, L, O, C, V

In unserem Fall handelt es sich um eine Zeitreihe.

Die nächste Aufgabe besteht darin, die funktionale Abhängigkeit zu wählen. Eine Gleichung, die die Beziehung zwischen der Veränderung des Indikators und der Veränderung der Faktoren beschreibt. Häufig handelt es sich dabei um polynomische Funktionen. Ein Sonderfall ist das Polynom vom Grad 1 - die lineare Regressionsgleichung.

Frage 2: Welches Polynom ist am besten zu wählen und wie kann man es angemessen in Form von Zeitreihen beschreiben, welche Parameter sind zu verwenden, wie hoch ist der Grad des Polynoms. Hat jemand ein Tschebyscheff-Polynom verwendet? Wenn ja, wie lautet die Reihenfolge?

Als nächstes müssen wir die Koeffizienten der Regressionsgleichung berechnen. Der übliche Weg ist die Verwendung von ANC.

Frage 3: Welches ist die beste Methode zur Berechnung der Koeffizienten für unseren Fall?

Frage 4: Müssen Sie die Daten normalisieren?

Das Thema ist sicherlich ein wichtiges und interessantes.

Wir haben also eine Zeitreihe mit N Stichproben. In diesem Stadium ist es nicht wichtig, was genau als Muster zu verstehen ist - Ticks, OHLC oder etwas anderes. Wichtig erscheint die Antwort auf die Frage nach der optimalen Länge der Trainingsstichprobe n ungleich N, der optimalen Anzahl der einstellbaren Parameter k<=n (Grad des Polynoms) und dem Vorhersagehorizont T (gemessen in Zählungen).

In diesem Stadium sind die besondere Art der Näherungsfunktion und die Methode ihrer Annäherung an die ursprüngliche Reihe nicht wichtig. Es ist wichtig, die Abhängigkeiten der oben genannten Parameter von den Eigenschaften des ursprünglichen BP zu ermitteln. Es ist beispielsweise bekannt, dass, wenn der Blutdruck eine integrierte Zufallsvariable ist, die optimale Vorhersage eine Konstante ist, die dem Wert des letzten Messwerts (Nullbar) entspricht. Wenn die Reihe Regelmäßigkeiten enthält, muss man nach dem Optimum in Bezug auf die Regressionsparameter suchen.

Gibt es in diesem Zusammenhang Überlegungen zum gesunden Menschenverstand?

 
Grad 3. die Anzahl der Stichproben n wird durch die Tageszeit und den ACF bestimmt. der Vorhersagehorizont wird experimentell bestimmt, da er von der gegebenen Genauigkeit und dem Modell abhängt (das Modell kann auch ein Polynom sein)
 
Neutron:

Das Thema ist sicherlich ein wichtiges und interessantes.

Wir haben also eine Zeitreihe mit N Zählungen. In diesem Stadium spielt es keine Rolle, was genau mit Zählungen gemeint ist - Ticks, OHLC oder etwas anderes. Wichtig scheint die Antwort auf die Frage nach der optimalen Länge der Trainingsstichprobe n ungleich N, der optimalen Anzahl der einstellbaren Parameter k<=n (Grad des Polynoms) und dem Vorhersagehorizont T (gemessen in Zählungen) zu sein.

In diesem Stadium ist es nicht wichtig, welche Art von Näherungsfunktion und welche Methode der Annäherung an die ursprüngliche Reihe verwendet wird. Es ist wichtig, die Abhängigkeiten der oben genannten Parameter von den Eigenschaften des ursprünglichen BP zu ermitteln. Es ist beispielsweise bekannt, dass, wenn der Blutdruck eine integrierte Zufallsvariable ist, die optimale Vorhersage eine Konstante ist, die dem Wert des letzten Messwerts (Nullbar) entspricht. Wenn die Reihe Regelmäßigkeiten enthält, muss man ein Optimum durch Regressionsparameter suchen.

Gibt es bei dieser Formulierung Überlegungen zum gesunden Menschenverstand?

In dieser Formulierung steckt kein Scheiß. Verdammte Theorien. Diese polynomiale Regression wird mit einem BP an die Wand gefahren.

Wir brauchen Gewinnmaximierung. Scheiß auf alle univariaten Regressionen. Warum nur einen Bruchteil der Marktinformationen nutzen? Wenn es eine Fülle von Informationen gibt.

Die Regressionsanalyse sollte mindestens multivariat sein. Analyse der verschiedenen Schätzmethoden (IOC, MO der absoluten Fehlerwerte (Laplace oder Lagrange - kann mich nicht erinnern), Vorzeichen, Quantile usw.) der Regression auf die Effizienz.

Auch die Schätzung des Prognosehorizonts ist ein interessantes Thema.

Ich habe ein paar Sachen zu diesem Thema geschrieben. Da gibt es natürlich nicht viel. Das ist nur der Anfang. Davor steht die Schätzung des BP-Gewinnprognosehorizonts und viele interessante...

 
hrenfx: Warum nur einen Teil der Marktinformationen nutzen? Wenn es eine Menge Informationen gibt.

Er hat etwas zu diesem Thema geschrieben.

Worüber freuen Sie sich so sehr?

Glauben Sie, dass je mehr Sie die verschiedenen, vorzugsweise nicht einfach und transparent, wird besser sein?

Die Erfahrung spricht eine andere Sprache. Es ist richtig - einfacher, und gründlich im studierten Fach richtig zu verstehen! Und "multivariate Regression", "Quantil"... - Es handelt sich um eine Art Spinoranalyse der Torsionswechselwirkung.

 

Scheiße, ich habe nichts geworfen, woher hast du das denn? Ich habe eine einfache multivariate LINEAR-Regression im Allgemeinen. Der Grund für die Verwendung der linearen Regression liegt in der Logik, ein optimales Portfolio zu erstellen und Korrelationen zu finden. Das ist der Ausgangspunkt - von einfach.

Der Teufel weiß, was Sie mit Regression meinen, ich habe es neulich selbst herausgefunden. Ich meine die Regressionsanalyse.

 
hrenfx:

... Ich habe eine einfache multivariate LINEAR-Regression...


aber man kann eine multivariate polynomiale Regression durchführen... Ist es schlechter als linear? Ich weiß nicht, es gibt nur eine Prüfung - wenn die Vorhersagegenauigkeit zunimmt oder die Vorhersagezeit bei gleicher Genauigkeit zunimmt, dann ja, es ist besser ... Aber um das zu überprüfen, muss man nicht nur wissen, wie man es macht, sondern es auch der Maschine erklären ...

 
Prival:


aber Sie können eine multivariate polynomiale Regression durchführen ... Ich weiß nicht, es gibt nur eine Prüfung - wenn die Vorhersagegenauigkeit zunimmt oder die Vorhersagezeit bei gleicher Genauigkeit zunimmt, dann ist es besser... Aber um das zu überprüfen, muss man nicht nur wissen, wie man es macht, sondern es auch der Maschine erklären ...

es wird natürlich besser sein, aber der Computer wird auch belastet sein:)