Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2742

 
Aleksey Nikolayev #:

Ich glaube, ich habe einige Hinweise auf eine Anwendung zur Überlebensanalyse gesehen.

Ich habe es nicht selbst gemacht, aber ich habe einmal eine ähnliche Frage gestellt. Dieser Ansatz scheint mir vielversprechend zu sein, aber er kommt aus einem ganz anderen Bereich.

 
СанСаныч Фоменко #:

Er sagt classDist {caret}, d.h. er gibt eine bestimmte Funktion an, die Teil des caret PACKAGE ist

Wie ich verstanden habe, kennen Sie R nicht. Warum vergeuden Sie dann Ihre Zeit mit diesem Thema und mit MO im Allgemeinen?

Ohne die Beherrschung von R ist eine Diskussion über MO sinnlos.

Ich habe über die Entropie nur deshalb geschwiegen, weil die Kreuzentropie eine Standardverlustfunktion für Klassifizierungsmodelle ist.... MO ist nicht nur in R implementiert! (wenn man eine Bibliothek kennt und die Art der Entitäten, mit denen sie arbeitet, nicht kennt, geht man ohne zu verstehen, in welche Richtung man sich bewegt).

zu deiner noch schwierigeren Frage - warum distanzierst du dich kategorisch von der Statistik, wenn du von"Informationstheorie" sprichst?... während sie genau als eine

Das Gebiet liegt an der Schnittstelle von Mathematik , Statistik , Informatik , Physik , Neurobiologie , Informationstechnik und Elektrotechnik.

in der Tat ist die Diskussion themenlos, wenn man in Schnipseln und seinem Ego operiert (und sogar über jemanden, nicht nur über sich selbst), und nicht über das Thema des Dialogs... der Thread ändert sich leider nicht (es wird keine Spezifität und Thematik in den Antworten hinzugefügt)
 
Maxim Dmitrievsky #:
Wieder einmal ruft dieses stumpfe Sprachrohr alle zur Wahrheit auf, hat sich aber noch nicht entschieden, welche

Du hast den Moderator schon so sehr gelangweilt, dass er alles niederreißt.

Lesen Sie nicht den provokativen Beitrag von Benutzer JeeyCi (sein Beitrag ist eine Provokation und Aufforderung, "das Bankett fortzusetzen").
Gestern habe ich mehrere Beiträge mit Beschimpfungen und Unflätigkeiten mit persönlichen Angriffen gelöscht, geleitet von diesem - ich habe die Beiträge
von JeeyCi gelöscht .

Ich habe in dem Thread zwei Verwarnungen ausgesprochen, sie wurden ignoriert, und dann habe ich mehrere Beiträge mit Flüchen gelöscht.
Der einzige literarische Beitrag dort (der überhaupt lesbar war) war Ihr Beitrag - dieser hier (mit dem gestern alles begann):

Forum über Handel, automatische Handelssysteme und das Testen von Handelsstrategien

...

Maxim Dmitrievsky, 2022.09.10 12:15

Es gibt die modellbasierte, die modellunabhängige und die gemischte Merkmalsauswahl. Bei der agnostischen Auswahl handelt es sich um die Korrelation und die gegenseitige Information (Entropie-basiert). Letztere unterscheidet sich von der ersteren durch ihre Fähigkeit, nichtlineare Abhängigkeiten zu erfassen, ansonsten ist es dasselbe. Es ist schwer, in diesem Fall von einer Beziehung zwischen Merkmal und Ziel zu sprechen, sogar unmöglich. Es handelt sich lediglich um eine Korrelation. Aber es ist nützlich, um uninformative Merkmale loszuwerden.

Man kann dies in einem Schiebefenster oder in einem Ausweichfenster oder in einem Schiebefenster oder in einem Reibefenster tun

Wenn Sie speziell die Kausalität bestimmen wollen, ist das eine kausale Inferenz, einschließlich der Verwendung von MO, von der ich nicht weiß, wie man sie auf eine Zeitreihe anwendet, da ich das Thema nicht studiert habe.

Und alle bisherigen Methoden eignen sich nicht für die Ermittlung von Kausalität, sondern nur für das optimale Training von Algorithmen.

Also können sich die Bürger wieder einmal nicht konzentrieren und die Fliegen aus ihren Koteletts nehmen.

Über das große und allmächtige R haben wir schon oft gehört. Wenn man einen Affen dahinter setzt, kann er sich natürlich auch für einen Statistiker und Analytiker halten, so großartig ist er.

Ja, ich werde gelegentlich Schimpfwörter löschen, vor allem, wenn sie einen halben Tag und zwei Seiten Text dauern (wie gestern).

----------------

Dieser Thread ist sehr beliebt (er wird sogar im englischsprachigen Forum gelesen und gilt als der wichtigste Thread zu diesem Thema).
Also bitte - weniger fluchen.

 
mytarmailS #:

Wenn Sie die TS von mehr oder weniger erfolgreichen Händlern analysieren, werden Sie feststellen, dass alle von ihnen mit Levels handeln.

Ich habe noch keinen einzigen erfolgreichen Trader gesehen, der mit Hilfe von Indikatoren gehandelt hat.

Ein Level ist ein klarer und verständlicher Einstiegspunkt mit einem klaren Stop....

Wenn Sie mit geringem Risiko handeln können, brauchen Sie nichts anderes, ein geringes Risiko pro Handel/präziser Einstieg ist das Wichtigste!

Mit Hilfe von MO können Sie nach Levels von PD/SP suchen, die exakte Einstiege ermöglichen, es ist nicht trivial, nicht einfach, Sie können nicht in Blogs über MO darüber lesen, hier müssen Sie Ihren eigenen Kopf benutzen....

Sie können auch Ebenen auf dem sb Chart zeichnen und es ist auch eine Zeitreihe. Alle haben genug von dir, wir antworten nicht mehr auf dich. Du redest tagein, tagaus Unsinn.
 
mytarmailS #:

Hier ein Beispiel für eine zufällig generierte Stichprobe von 5 Merkmalen und 1 binären Zielvorgabe

forrest und fiche selector

Die Aufgabenwarteschlange wurde ein wenig entladen - es wurde möglich, das Skript auszuführen. Ich führe es aus und erhalte einen Fehler.

> install.packages("randomForest")
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Installing package into ‘C:/Users/S_V_A/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Warning in install.packages :
  package ‘randomForest’ is not available (for R version 4.0.5)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/bin/windows/contrib/4.0:
  cannot open URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/PACKAGES'

> library(randomForest)
Error in library(randomForest) : нет пакета под названием ‘randomForest’

Verstehe ich das richtig, dass das Programm eine alte Version von R 4.0 haben will?

Nun, ich habe nach einer alten Version gesucht und sie nicht gefunden. Schreckliche Inkompatibilität ist natürlich abstoßend.

 
Aleksey Vyazmikin #:

Die Aufgabenwarteschlange wurde ein wenig entladen - es wurde möglich, das Skript auszuführen. Ich führe es aus und erhalte einen Fehler.

Verstehe ich das richtig, dass das Programm die alte Version R 4.0 haben will?

Ich habe R 3.6.3.

Ich schreibe dies auf der alten R-3.6.3 aus eigenen Gründen, also ist es mein Problem...

Ich konnte mir nicht vorstellen, dass das Paket aus dem tap.... entfernt werden würde.

Aleksey Vyazmikin #:

Verstehe ich das richtig, dass das Programm die alte Version von R 4.0 haben will?

richtig

Aleksey Vyazmikin #:

Nun, im Allgemeinen habe ich nach der alten Version gesucht und sienicht gefunden. Schreckliche Inkompatibilität ist natürlich abstoßend.

Hören Sie, vielleicht können Sie nicht in den Handel gehen, mit einem solchen smikalka ??? ))

Mit der Kompatibilität ist dort alles in Ordnung, Python, zum Beispiel, nur beneiden solche Kompatibilität....


Siehe auch

https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2

Versuchen Sie es auf die aktuelle Version

urlPackage <- "https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-12.tar.gz"
install.packages(urlPackage, repos=NULL, type="source") 

 
Um die Theorie von Sanych zusammenzufassen (da er sie selbst nicht richtig formalisiert und Beispiele genannt hat):

*Seine Art der Merkmalsauswahl basiert auf Korrelation, da "Beziehung" und "Verbindung" Definitionen von Korrelation sind.

*Auf diese Weise führen wir eine implizite Anpassung an die Geschichte durch, ähnlich wie bei LDA (lineare Diskriminanzanalyse) oder PCA, vereinfachen den Lernprozess und reduzieren Fehler.

*Es gibt nicht einmal die Theorie, dass das trainierte Modell bei neuen Daten (die nicht mit der Schätzung der Verbindungen zwischen Merkmalen und Zielen zu tun haben) besser abschneiden sollte, weil die Merkmale an das Merkmal oder (schlimmer) an die verfügbare Historie angepasst wurden.

*Die Situation wird durch die Mittelwertbildung von QC in einem gleitenden Fenster etwas verbessert, so wie man die Streuung schätzen und stabilere auswählen kann. Wenigstens können wir uns auf einige Statistiken stützen.

*Ich dachte an Kausalität oder eine statistisch signifikante Beziehung, aber das ist bei seinem Ansatz nicht der Fall.
 
Maxim Dmitrievsky #:
Um die Theorie von Sanych zusammenzufassen (da er sie selbst nicht richtig formalisiert und Beispiele genannt hat):

*Seine Art der Merkmalsauswahl basiert auf Korrelation, da "Beziehung" und "Beziehung" Definitionen von Korrelation sind.

*Auf diese Weise wird eine implizite Anpassung an die Geschichte vorgenommen, ähnlich wie bei der LDA (linearen Diskriminanzanalyse) oder der PCA, was den Lernprozess vereinfacht und die Fehlerquote verringert.

*Es gibt nicht einmal die Theorie, dass das trainierte Modell bei neuen Daten (die nicht in die Schätzung der Merkmal-Ziel-Beziehungen einbezogen sind) besser abschneiden sollte, weil die Merkmale zuvor an das Merkmal oder (schlimmer) an die gesamte verfügbare Historie angepasst wurden.

*Mit Beziehung meinte ich Kausalität oder eine statistisch signifikante Beziehung, aber das ist bei seinem Ansatz nicht der Fall.

Bei allem Respekt, aber dies ist keine Zusammenfassung (keine Zusammenfassung oder Zusammenschau). Es ist voll von persönlichen Einstellungen und unbegründeten Angriffen.

Man sollte meinen, dass jemand eine gültige Theorie hat, nach der "ein trainiertes Modell auf neuen Daten funktionieren sollte" :-) und validiert ist...ja.

 
Maxim Kuznetsov #:

bei allem Respekt, aber dies ist keine Zusammenfassung (keine Zusammenfassung oder Zusammenschau). Dies ist eine persönliche Einstellung und unbegründete Angriffe.

Man sollte meinen, dass jemand eine gültige Theorie hat, die besagt, dass "ein trainiertes Modell auf neuen Daten funktionieren sollte" :-) und validiert ist...ja.

Und wenn Sie genau lesen, können Sie den Hinterhalt in Punkt 2 erkennen, d.h. die anfängliche Anpassung an die Geschichte. Deshalb gibt es auch einen Lernfehlerabfall.

Punkt 4 ist etwas optimistischer, wenn er nicht für die gesamte verfügbare Geschichte durchgeführt wird. Sie sollte nur für das Trainee-Sampling durchgeführt werden, um eine gute Anpassung zu erreichen. Um eine angemessene Schätzung des Modells für neue Daten zu erhalten.

Ich bin nicht dafür bekannt, dass ich mich für Psychologie interessiere, also wird es nie irgendwo auftauchen. Und ich kenne niemanden persönlich.
 
СанСаныч Фоменко #:

Die Leistung reicht nicht aus, um die EA-Ebene zu erreichen. Aber das Ergebnis des Modellanpassungsfehlers: von 8% bis 22% ist ein Anpassungsfehler, der sich im Anpassungsabschnitt und außerhalb der Stichprobe kaum unterscheidet.

Dies deutet darauf hin, dass die Anpassung an die gesamte Historie vor dem Training durchgeführt wurde. Falls dies nicht der Fall ist, korrigieren Sie mich bitte. In welchem Intervall wurden die Merkmale geschätzt/ausgewählt und in welchem Intervall wurde das Training durchgeführt?

Ich habe gerade eine ähnliche Methode entwickelt und kann die Ergebnisse dieses Wochenende mitteilen. Aber nur, wenn es eine substanzielle Kommunikation gibt und nicht nur ein Wortspiel.