Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2219

 
Maxim Dmitrievsky:

Haben Sie ein anderes Clustering als GMM ausprobiert?

 
mytarmailS:

Haben Sie ein anderes Clustering als GMM ausprobiert?

Sie brauchen kein Clustering, sondern eine Dichteschätzung. Encoder und GAN sind ausreichend.

Es gibt spezielle Techniken für die Arbeit mit schwanzförmigen Verteilungen in MO, aber ich habe sie noch nicht ganz gemeistert.

Es gibt zum Beispiel einen solchen Trick. Bei einer geschwänzten Verteilung (während Inkremente genau solche Verteilungen bilden) muss der Stichprobenumfang für das Training nahezu unendlich sein, damit etwas mit den neuen Daten funktioniert. Und das ist erwiesen. Was meinen Sie dazu?

 
Maxim Dmitrievsky:

Es geht nicht um Clustering, sondern um die Schätzung der Dichte. Encoder und GAN sind ausreichend.

Es gibt spezielle Techniken für die Arbeit mit schwanzförmigen Verteilungen in MO, aber ich bin noch nicht dazu gekommen, sie anzuwenden. Das ist buchstäblich das Neueste, was es gibt.

Ich kann es einfach nicht begreifen.

Ich habe das Modell mit zwei Clustern trainiert.

> gm <- ClusterR::GMM(X,gaussian_comps = 2)
> gm
$centroids
            [,1]       [,2]       [,3]
[1,] -0.24224591 -0.5103346  0.7653689
[2,]  0.07675401  0.1668665 -0.2967750

$covariance_matrices
         [,1]      [,2]      [,3]
[1,] 1.169446 0.5971381 0.5771400
[2,] 1.006148 0.7724611 0.8297428

$weights
[1] 0.2505878 0.7494122

$Log_likelihood
            [,1]      [,2]
 [1,]  -4.060188 -3.111429
 [2,]  -6.105358 -3.516479
 [3,]  -4.301979 -4.310115
 [4,]  -3.752352 -3.583401
 [5,]  -3.172447 -3.302278
 [6,]  -7.849530 -5.254127
 [7,]  -3.055816 -3.157801
 [8,]  -5.307695 -2.795444
 [9,] -11.721658 -6.764240
[10,] -10.575876 -5.565554
[11,]  -6.760511 -5.193087
[12,]  -3.978182 -5.066543
[13,]  -2.577926 -4.418768
[14,]  -4.398716 -3.614050
[15,]  -4.082245 -5.268694
[16,]  -2.918141 -2.901401
[17,]  -9.153176 -4.797331
[18,]  -5.678321 -3.599856
[19,]  -4.500670 -2.622113
[20,]  -2.965878 -4.415078
[21,]  -4.453389 -4.152286
[22,]  -5.365306 -4.368355
[23,]  -8.533327 -3.813763
[24,]  -4.142515 -2.811048
[25,]  -7.174136 -5.631351
[26,]  -5.063518 -3.491408
[27,]  -4.935992 -8.336194
[28,]  -4.210241 -5.869093
[29,]  -3.605818 -2.577456
[30,]  -3.670845 -5.686447
[31,]  -2.733389 -5.010803
[32,]  -3.730563 -2.646749
[33,]  -3.201767 -3.689452
[34,]  -4.879268 -3.111545

die Verteilung ist.

$centroids

oder

$covariance_matrices

und wie man sie simuliert (ähnliche Rassen)

 
Maxim Dmitrievsky:

Und es ist bewiesen. Was meinen Sie dazu?

Die Bombe.

Wo haben Sie es gelesen?

 
mytarmailS:

Die Bombe.

Wo haben Sie es gelesen?

Ich habe einige Artikel gesehen.

überprüfen Sie es.

https://venturebeat.com/2020/08/14/how-to-improve-ai-economics-by-taming-the-long-tail-of-data/

How to improve AI economics by taming the long tail of data
How to improve AI economics by taming the long tail of data
  • 2020.08.14
  • Matt Bornstein, Andreessen Horowitz
  • venturebeat.com
As the CTO of one late-stage data startup put it, AI development often feels “closer to molecule discovery in pharma” than software engineering. This is because AI development is a process of experimenting, much like chemistry or physics. The job of an AI developer is to fit a statistical model to a dataset, test how well the model performs on...
 
mytarmailS:

Ich kann es einfach nicht begreifen.

Ich habe das Modell mit zwei Clustern trainiert.

Wie ist die Verteilung

oder

und wie man sie simuliert (ähnliche Rassen)

Suchen Sie nach einem Paket, mit dem Sie Stichproben aus einem trainierten Modell ziehen können.

 
Maxim Dmitrievsky:

Suchen Sie nach einem Paket, mit dem Sie Stichproben aus einem trainierten Modell ziehen können.

Es gibt drei Verteilungen (Linien).

Normal Mixture' object   ``#9 Trimodal'' 
       mu sigma    w
[1,] -1.2  0.60 0.45
[2,]  1.2  0.60 0.45
[3,]  0.0  0.25 0.10

Soll es so aussehen?

 
mytarmailS:

Es gibt drei Verteilungen (Linien)

Soll es so aussehen?

Dies sind die Gaußschen Parameter

 
Maxim Dmitrievsky:

Es geht nicht um Clustering, sondern um die Schätzung der Dichte. Encoder und GAN sind ausreichend.

Es gibt spezielle Techniken für die Arbeit mit schwanzförmigen Verteilungen in MO, aber ich bin noch nicht ganz dazu gekommen, sie anzuwenden.

Es gibt zum Beispiel einen solchen Trick. Bei einer schwanzförmigen Verteilung (während Inkremente genau solche Verteilungen bilden) muss der Stichprobenumfang für das Training nahezu unendlich sein, damit etwas mit den neuen Daten funktioniert. Und das ist erwiesen. Was meinen Sie dazu?

Nun, die Ähnlichkeit der Preisreihe mit der SB.)))) wurde gerade durch die schwanzförmigen Abstufungen bewiesen. Und damit das funktioniert, müssen wir die gesamte Reihe betrachten, also auch die zukünftige Reihe, oder wenn wir annehmen, dass die Reihe unendlich ist, dann wird auch die zukünftige Reihe anerkannt. Als ob die Schlussfolgerung wäre, dass es eine unendliche Anzahl von Variationen einer unendlichen Reihe gibt und wir sie trainieren und sehen werden.

Sie ist für die Praxis nutzlos, muss aber verstanden werden.

ZS und in Bezug auf die Dichte können Sie nach der Bewertung in Abschnitte unterteilt werden.
 
Valeriy Yastremskiy:

Nun, es war nur der Beweis für die Ähnlichkeit der Preisreihen mit der SB.)))) durch geschwänzte Inkremente. Und als Schlussfolgerung würde es funktionieren, die gesamte Serie zu sehen, d.h. auch die zukünftige Serie, oder wenn wir akzeptieren, dass die Serie unendlich ist, dann wird die zukünftige Serie erkannt. Als ob die Schlussfolgerung wäre, dass es eine unendliche Anzahl von Variationen einer unendlichen Reihe gibt und wir sie trainieren und sehen werden.

Für die Praxis ist es nutzlos, aber zum Verständnis ist es notwendig.

SZY und durch die Dichte nach der Auswertung können Sie es in Abschnitte unterteilen.

sie in Abschnitte unterteilen und die häufigsten Beispiele auswählen, der Rest sollte als Rauschen verworfen werden

oder umgekehrt, Grenzen bei seltenen Ereignissen ziehen

Wie Sie dem Artikel entnehmen können, ist dies ein Problem der realen Welt, nicht nur des Forex. Und die MOs haben in verschiedenen Bereichen damit zu kämpfen