Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1272

 
Maxim Dmitrievsky:

Ich bin es leid, über offensichtliche Dinge zu streiten, das steht alles in dem Artikel. Jeder soll es verstehen, wie er will.

Mit ein wenig mehr Abstraktion wird klar, warum es dasselbe ist, gegen den Markt zu spielen.

Und ich schlage vor, zumindest in den Begriffen zu diskutieren, die sie selbst verwenden, und nicht in geschickt erfundenen Begriffen. Ansonsten ist das Argument wertlos.

Hier wird versucht, Analogien für den Handel und das Glücksspiel zu finden, auch unter Berücksichtigung der gleichen Dynamik ihres Gleichgewichts der Wahrscheinlichkeiten, die von beiden Seiten des Prozesses beeinflusst wird. Lassen Sie uns das Problem im Detail untersuchen, anstatt sich auf die Terminologie zu stützen.

 
Aleksey Vyazmikin:

Versuchen Sie, Analogien für den Handel und das Glücksspiel zu finden, auch wenn die Dynamik des Gleichgewichts der Wahrscheinlichkeiten, die von beiden Seiten des Prozesses beeinflusst werden, dieselbe ist. Lassen Sie uns das Problem objektiv betrachten, anstatt sich hinter Begriffen zu verstecken.

Zum letzten Mal, ich werde nichts mehr schreiben.

Dem RL-Agenten ist es egal, gegen was er spielt - den Markt oder einen anderen Gegner in der SC, er versteht es nicht, weil es ein Programm ist. Der Rest ist nur Ihr "Know-how".

Es spielt keine Rolle, ob der Gegner statisch oder dynamisch ist, der Agent lernt in jedem Fall die optimale Strategie.

Du wirst die Kurve kriegen und es herausfinden. Eines Tages.

 
Maxim Dmitrievsky:

zum letzten Mal, ich werde nichts mehr sagen.

Dem RL-Agenten ist es egal, gegen was er spielt - den Markt oder einen anderen Gegner in der SC, er versteht es nicht, weil es ein Programm ist. Der Rest ist nur Ihr "Know-how".

Es spielt keine Rolle, ob der Gegner statisch oder dynamisch ist, der Agent lernt in jedem Fall die optimale Strategie.

Du wirst die Kurve kriegen und es herausfinden. Eines Tages.

Der Name der Trainingsmethode ist zweitrangig. Ich versuche schon seit langem, mit Ihnen über Prädiktoren zu sprechen.

Und wie kann man nicht verstehen, dass NS lernen kann, die Situation zu beeinflussen, und je nach Wirksamkeit der Beeinflussung die Wahrscheinlichkeit des Ausgangs des Ereignisses beeinflussen kann. Und genau das ist der Vorteil eines solchen Netzwerks - die Möglichkeit, die Situation zu beeinflussen. Bei jedem Frame wird eine Entscheidung getroffen, was zu tun ist, um die Zielleistung zu verbessern (genau dieses Diagramm), der Prozess der Aktivität ist mehrstufig, die endgültige Wahrscheinlichkeit von Sieg oder Niederlage steht nicht zu Beginn des Spiels fest, sondern ändert sich ständig, auch aufgrund von Aktionen der Spieler, und hier liegt der größte Unterschied zum Handel.

Ich sage nicht, dass man die PL-Methode nicht verwenden kann, um den Handel zu lehren, sondern ich spreche von der Wirksamkeit eines Netzwerks, das die Situation beeinflusst, um sein Ziel zu erreichen, und nicht nur passiv errät, was der Gegner tun wird (wohin der Preis gehen wird).

 
Maxim Dmitrievsky:

Warum Emotionen zeigen, schreiben Sie lieber eine begründete Widerlegung meiner Argumente.

 
Aleksey Vyazmikin:

Dies wird als OPTIMALE POLITIK oder STRATEGIE bezeichnet, die alle möglichen feindlichen Verhaltensweisen berücksichtigt.

Lesen Sie ein Buch, schämen Sie sich nicht. Ich habe Ihnen schon 100 Mal geschrieben, dass das, was Sie zum Ausdruck bringen wollen, in ein paar Worten passt.

Machen Sie sich nicht lustig.

 
Maxim Dmitrievsky:

Dies wird als OPTIMALE POLITIK oder STRATEGIE bezeichnet, die alle möglichen feindlichen Verhaltensweisen berücksichtigt.

Lesen Sie ein Buch, blamieren Sie sich nicht. Ich habe Ihnen schon 100 Mal geschrieben, dass das, was Sie zum Ausdruck bringen wollen, in ein paar Worten passt.

Mach dich nicht so über mich lustig.

Ich kenne den Begriff nicht, das Internet ist genauso zurückhaltend, etwas zu sagen - geben Sie mir einen Link, damit ich sehen kann, ob es wirklich so heißt.

Und wenn meine Beschreibung auf einen bestimmten Begriff passt, verstehe ich Ihre inhaltlichen Einwände nicht. Es geht nicht um die Bedingungen, sondern um die Beeinflussung der Situation, um das langfristige Ziel zu erreichen - das Spiel durch eine Kette von Aktionen zu gewinnen, die je nach den Aktionen des Gegners variieren können.

Es geht um das unterschiedliche Umfeld, in dem die Entscheidungsfindung stattfindet - in dem einen kann man mit der Umgebung interagieren, in dem anderen nicht - man kann nur durch das Glas beobachten.
 
 

Sie wissen nicht, dass ich keine ausländischen Bücher lese... Ich habe sie durchgesehen, ja, sie sind fortgeschrittener als die im russischsprachigen Internet.

 
Maxim Dmitrievsky:

wenn mehr als die Hälfte der zusätzlichen Wörter herausgenommen werden und die Kette von Handlungen (Markov-Ketten) mit probabilistischen Übergängen übrig bleibt, dann ist es besser

der Rest des Unsinns kann weggelassen werden

Die Trennung zwischen Akteur und Umwelt ist immer vorhanden, es gibt keine Beobachtungen durch das Glas. Auch hier handelt es sich um eine abstrakte Ebene, die nicht für jeden zugänglich ist. Und auch hier rennen Sie wieder mit der Stirn gegen die Wand, weil Sie es sich ausdenken, anstatt es zu studieren.

Zum letzten Mal schreibe ich und höre auf mit diesem Tohuwabohu: Es gibt keinen Einfluss, es gibt Wahrscheinlichkeiten für Übergänge und Annäherungen an die Politik.

Ich weiß nicht, wie Sie denken, aber Begriffe verzerren nur dann das Wesen des Denkens, wenn es sich nicht um ein Axiom handelt, das längst feststeht und nicht überprüft werden kann.

Sie können keine Analogie liefern, sich auf die Terminologie zu beziehen ist unproduktiv.

 
Aleksey Vyazmikin:

Weil Sie nicht wissen, dass ich keine ausländischen Bücher lese... Ich habe sie durchgesehen, ja, es gibt dort mehr fortgeschrittenes Zeug als im russischsprachigen Internet.

Nun, es gibt nichts anderes zu lesen. Sutton, Barto"Training mit Verstärkung" ist online übersetzt, nur ein altes Buch, aber auch nützlich.