Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 838

 
Mihail Marchukajtes:

Im Allgemeinen verwende ich dieses spezielle Paket zur Auswahl von Prädiktoren. Es ist klar, dass es Nachteile gibt, insbesondere die fehlende Interaktion mehrerer Prädiktoren in Bezug auf das Ziel. Aber im Großen und Ganzen reicht es für meine Optimierung bisher aus... Wenn es also andere Pakete für die Datenvorverarbeitung gibt, würde ich sie gerne in Betracht ziehen...

Aus meiner Erfahrung kann ich das RandomUniformForest-Paket empfehlen, da es die verschiedenen Aspekte der Bedeutung von Prädiktoren am umfassendsten und professionellsten behandelt. Beispiele sind hier zu sehen

Viel Glück!

PS: Übrigens ist es eines der wenigen Programme, das es Ihnen erlaubt, das Modell auf neue Daten zu trainieren. Das spart eine Menge Zeit.

 
Dr. Trader:

Jede Woche eine neue Tour. In einer Woche müssen Sie das Modell trainieren und ihm die Vorhersagen übermitteln. Aber die Vorausschätzung Ihres Modells wird erst nach weiteren drei Wochen bekannt sein, und Ihre Vorhersagen werden mit den tatsächlichen Vorhersagen für diese drei Wochen verglichen.

Ich glaube, sie behalten mindestens 90 %.

Was meinen Sie mit "Ich glaube, sie behalten mindestens 90 %"? Glauben Sie, dass sie mit den Prognosen, die ihnen übermittelt werden, handeln? Wie kann man im Allgemeinen die Vorzeichen herausfinden, um die Prognose im Voraus zu berechnen? Durch Interpolation oder so? Sie haben es in ihrem Dokument geschrieben, dass es nur ein "Proof of Work" ist, wie im Bergbau, und der Gewinner wird zufällig ausgewählt, wahrscheinlich ist die Hälfte der Ergebnisse fast gleich, dann wird zufällig ein Filter geworfen, der zusätzlich rangiert, nun, es ist ein beschämendes Casino, und der Datensatz ist wahrscheinlich rein synthetisch, Rauschen mit geringer Signalpräponderanz, es gibt überhaupt keinen Markt. Dieser ganze Mist über Hedge-Fonds usw. dient nur dazu, die Popularität ihrer Münzen zu steigern.

 
Maxim Dmitrievsky:

Also, Mikhail, haben Sie sich von Ihrer Raserei erholt, werden Sie bald anfangen, Ihre ts vernünftig und ohne Fanatismus zu bewerten? :)

Ich hatte keine Tollwut. Nur die kalte Berechnung, die sich seit dem letzten Mal in keiner Weise geändert hat. Ganz zu schweigen von der Theorie der Annäherung, die immer noch funktioniert. Einen Moment lang...

 
govich:

Wie viel genau sie einbehalten, ist nicht offiziell festgehalten. Alle möglichen Finanzmagazine schrieben über einen Gewinn von 1,5 Millionen im Jahr 2016, und wenn man vergleicht, wie viel davon sie an die Teilnehmer gezahlt haben, ist das nicht viel.

> Glauben Sie, dass sie mit den Prognosen, die sie erhalten, handeln?
Ja, das ist die Strategie. Ich erstelle zum Beispiel eine Reihe von Merkmalen, erstelle eine Trainingstabelle, schicke sie ins Forum, 10 Leute geben ihre Prognosen ab und ich handele nach ihnen - so einfach ist das.
Sie hatten lange Zeit keine eigene Kryptowährung, sondern zahlten mit Bitcoins. Sie haben einfach ein Jahr lang jede Woche ein paar tausend Dollar in Bitcoins genommen. Dann brachten sie ihre eigene Kryptowährung heraus, um sich nicht mit Bitcoins herumschlagen zu müssen.

> Woher wissen Sie im Voraus, für welche Zeichen Sie die Prognose berechnen können? Handelt es sich um eine Interpolation?
Interpolation, Vorhersage durch nächste Nachbarn, Clustering, es gibt viele Möglichkeiten, die Ihnen keine konkrete Antwort geben, Sie können nur raten.

 
Vladimir Perervenko:

Aus meiner Erfahrung kann ich das RandomUniformForest-Paket als den umfassendsten und professionellsten Weg empfehlen, um mit den verschiedenen Aspekten der Bedeutung von Prädiktoren umzugehen. Beispiele sind hier zu finden

Viel Glück!

PS: Übrigens ist es eines der wenigen Programme, die es Ihnen ermöglichen, das Modell auf neue Daten zu trainieren. Das spart eine Menge Zeit.

Ich habe es ausprobiert. Ich konnte keine Ergebnisse erzielen.

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

In 5 Minuten erzeugt es.
Fehler in OOB.votes - Y: Unähnliche mehrdimensionale Matrizen

Struktur der zu fütternden Matrizen:

> str(x1)
num [1:20000, 1:9] 0,00148 0,33309 0,46698 0,26331 -0,05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0,000746 0,162699 0,379051 -0,529729 -0,340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Es ist nicht klar, wie die Ähnlichkeit zwischen dem, was man braucht, und dem, was man braucht, aussieht.
Versucht ohne xtest = x2, ytest = y2 - gleiches Ergebnis.
Weiter geht es mit dem nächsten Paket.

 
elibrarius:

Ich habe es ausprobiert. Konnte keine Ergebnisse erzielen...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

Nach 5 min.
Fehler in OOB.

Die Struktur der eingespeisten Matrizen:

> str(x1)
num [1:20000, 1:9] 0,00148 0,33309 0,46698 0,26331 -0,05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0,000746 0,162699 0,379051 -0,529729 -0,340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Es ist nicht klar - die Ähnlichkeit von was mit was es erfordert.
Versucht ohne xtest = x2, ytest = y2 - gleiches Ergebnis.
Weiter geht es mit dem nächsten Paket.

Ich weiß nicht, warum es nicht funktioniert hat, bei mir funktioniert es.

Ich habe gute Ergebnisse in der Pflege. Es gibt drei Funktionen für die Prädiktorenauswahl - sie sind unterschiedlich effizient und verbrauchen verschiedene Rechenressourcen.


Es gibt ein weiteres sehr interessantes Paket - CORElearn. Dieses Paket enthält zwei Funktionen zur Auswahl von Prädiktoren, die ich zusammen verwendet habe und die sehr gute Ergebnisse für meine Prädiktoren liefern. Besonders kurios ist attrEval mit einem absolut fantastischen Satz von Selektionsauswertungsmethoden, unter denen eine besondere Stellung die Relief-Gruppe einnimmt, die nicht nur eine Beobachtung (String), sondern auch die nächstgelegenen Strings auswertet.


Viel Glück!


PS.

Vergessen Sie nicht, dass die Auswahl der Prädiktoren mindestens die folgenden Schritte umfassen sollte:

  • Auswahl nach: Prädiktoren, die für das Ziel relevant sind. Wizard hat hier einen Link zur Theorie dieses Schrittes angegeben. Es lassen sich zwei Methoden unterscheiden: Statistik und Entropie. Für beide gab es hier einen Code
  • Auswahl durch Aufzählung von Paketen, die für das zukünftige Modell NICHT relevant sind
  • Die Auswahl erfolgt anhand der Modellergebnisse. Sehr wirksam bei linearen Modellen. Mit glm wählen wir zum Beispiel nur aussagekräftige Prädiktoren aus und nehmen nur diese in das Netz auf. Das Ergebnis mag überraschend sein.


Vor der Auswahl von Prädiktoren kann eine Vorverarbeitung erforderlich sein, z. B. eine Zentrierung. Sie wird in dem Artikelvon Vladimir Perervenko gut beschrieben

 
elibrarius:

Ich habe es ausprobiert. Konnte keine Ergebnisse erzielen...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300,threads = 2, nodesize = 2)

Nach 5 min.
Fehler in OOB.

Die Struktur der eingespeisten Matrizen:

> str(x1)
num [1:20000, 1:9] 0,00148 0,33309 0,46698 0,26331 -0,05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 0 1 1 1 ...
> str(x2)
num [1:10000, 1:9] 0,000746 0,162699 0,379051 -0,529729 -0,340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 0 0 ...

Es ist nicht klar - die Ähnlichkeit von was mit was es erfordert.
Versucht ohne xtest = x2, ytest = y2 - gleiches Ergebnis.
Weiter geht es mit dem nächsten Paket.

Können Sie die Originalsätze veröffentlichen?

Sie müssen angeben, dass es sich nicht um eine Regression handelt, da Ihr Ziel kein Faktor ist. Parameter hinzufügen

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, regression = FALSE)

oder

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

Viel Glück!

 
SanSanych Fomenko:

Es gibt ein weiteres sehr interessantes Paket: CORElearn. In diesem Paket gibt es zwei Funktionen zur Auswahl von Prädiktoren, die ich paarweise verwendet habe und die bei meinen Prädiktoren sehr gute Ergebnisse liefern. Besonders kurios ist attrEval mit einem absolut fantastischen Satz von Selektionsauswertungsmethoden, unter denen eine besondere Stellung die Relief-Gruppe einnimmt, die nicht nur eine Beobachtung (String), sondern auch die nächstgelegenen Strings auswertet.


Einverstanden. Im Prinzip ist dies wahrscheinlich das seriöseste Paket für RF. Sie sollten dem Entwickler Marko Robnik-Sikonja Ihre Aufmerksamkeit schenken.

Viel Glück!

 
Vladimir Perervenko:

Können Sie die Originalsätze veröffentlichen?

Sie müssen angeben, dass es sich nicht um eine Regression handelt, da Ihr Ziel kein Faktor ist. Parameter hinzufügen

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300,threads = 2, nodesize = 2, regression = FALSE)

oder

ruf <- randomUniformForest( X = x1, Y = y1 %>% as.factor, xtest = x2, ytest = y2 %>% as.factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

Viel Glück!

Das hat geholfen. Ich danke Ihnen!
 
Dr. Trader:

Wie viel genau sie für sich behalten, ist nicht offiziell festgehalten. Alle möglichen Finanzmagazine schrieben über 1,5 Millionen Gewinn im Jahr 2016, und wenn man vergleicht, wie viel davon an die Teilnehmer gezahlt wurde, ist das nicht viel.

> Glauben Sie, dass sie mit den Prognosen, die sie erhalten, handeln?
Ja, das ist die ganze Strategie. Ich erstelle zum Beispiel eine Reihe von Merkmalen, erstelle eine Trainingstabelle, schicke sie ins Forum, 10 Leute geben ihre Prognosen ab und ich handele nach ihnen - alles ganz einfach.
Sie hatten lange Zeit keine eigene Kryptowährung, sondern zahlten mit Bitcoins. Sie haben einfach ein Jahr lang jede Woche ein paar tausend Dollar in Bitcoins genommen. Dann brachten sie ihre eigene Kryptowährung heraus, um sich nicht mit Bitcoins herumschlagen zu müssen.

> Woher wissen Sie im Voraus, welche Zeichen Sie für die Berechnung der Prognose verwenden müssen? Handelt es sich um eine Interpolation?
Sie können die genaue Antwort nicht wissen, aber Sie können nur raten.

1.5m$ sind Pfennige, wie für Entire Kantor, ich hörte, dass zu diesem Zeitpunkt, als sie ihre Krypto auf Austausch, einige Teilnehmer (wer war in der Spitze) nahm jeder, wenn nicht Millionen $, dann Hunderte von Tausenden $, konnte man den ersten Platz und 4000NMR für $200 pro Münze = 800.000k$ NUR einmal, aber dieser Ball schnell lief aus und NMR abgestürzt und begann geben Münzen weniger, aber wahrscheinlich jemand hatte Glück schön.

IMHO denke ich, dass sie am Anfang vielleicht versucht haben, Prognosen zu handeln, und sogar Orte, an denen es mehr oder weniger vorhersehbar war, wahrscheinlich 90% des Geldes haben sie selbst bezahlt, die meisten der ersten hundert waren wahrscheinlich ihre Gefolgsleute, das Geld ist nicht zu wer weiß was durchgesickert. Aber jetzt ist es ein reines Kasino mit "proof of work" und viel Zufall, so lautet zumindest das Gerücht.


PS: vor ihrer Münze zahlten sie 6k$ pro Woche (aber an wen?), d.h. 288k$ pro Jahr sind nur die "ehrlichen" ~20% von 1,5m Gewinn für die Quants))) Aber all diese Zahlen können natürlich gefälscht sein.