Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 373

 
elibrarius:
Auszug aus dem Artikel von Reshetov, in dem er die Funktionsweise seines RNN erklärt.

"In diesem Beitrag wird das Problem des Übertrainierens neuronaler Netze eingehend erörtert, seine Ursachen aufgezeigt und ein Weg zur Lösung des Problems vorgeschlagen.

1. Warum wird ein neuronales Netz neu trainiert?

Was ist der Grund für die Umschulung neuronaler Netze? Dafür kann es tatsächlich mehrere Gründe geben:
  1. Die Anzahl der Beispiele in einer Trainingsstichprobe reicht nicht aus, um Probleme außerhalb der Stichprobe zu lösen.
  2. Die Eingabedaten sind nach dem Grad der Korrelation zu den Ausgabedaten in verschiedenen Stichproben ungleich verteilt, was bei der Verarbeitung nicht-stationärer Daten sehr häufig der Fall ist. Beispielsweise ist die Korrelation eines oder mehrerer Eingangsparameter mit den Ausgangswerten in einer Trainingsstichprobe deutlich höher als in einer Teststichprobe, oder schlimmer noch, die Korrelationskoeffizienten in verschiedenen Stichproben haben unterschiedliche Vorzeichen. Dies lässt sich leicht überprüfen, indem man die Korrelationskoeffizienten für alle Parameter in verschiedenen Stichproben berechnet, bevor man das neuronale Netz trainiert. Und um diesen Nachteil zu beseitigen, ist es auch ganz einfach: Die Trainingsbeispiele werden nach dem Zufallsprinzip auf die Stichproben verteilt.
  3. Die Eingangsparameter stehen in keinem Zusammenhang mit den Ausgangsparametern, d. h. es besteht keine Ursache-Wirkungs-Beziehung zwischen ihnen - sie sind nicht repräsentativ und daher gibt es nichts, womit das neuronale Netz trainiert werden könnte. Und wenn die Prüfung auf Korrelationen zwischen Eingabe- und Ausgabedaten eine Korrelation nahe Null ergibt, müssen Sie nach anderen Eingabedaten suchen, mit denen Sie das neuronale Netz trainieren können.
  4. Die Eingabedaten sind stark miteinander korreliert. In diesem Fall sollten Sie die Eingabedaten mit der höchsten Korrelation zu den Ausgabedaten belassen und die anderen Daten, die gut mit den übrigen Daten korrelieren, entfernen.
Alle oben genannten Gründe für Übertraining und die Methoden zu ihrer Beseitigung sind allgemein bekannt, da sie bereits in verschiedener Literatur oder in Artikeln über die Technologie neuronaler Netze beschrieben worden sind. "


Nur ist es kein neuronales Netz im eigentlichen Sinne, sondern ein Klassifikator. Deshalb wird es auch nicht neu trainiert, sondern die Parameter werden im Optimierer angepasst. Es spricht nichts dagegen, auch neuronale Netze in Optimierern zu verwenden, mit einer unterschiedlichen Anzahl von Schichten und einer unterschiedlichen Periode von Merkmalen und sogar deren Anzahl, das wäre noch besser.

Lesen Sie hier mehr, es gibt einen ganzen Rahmen auch https://www.mql5.com/ru/articles/3264

Наивный байесовский классификатор для сигналов набора индикаторов
Наивный байесовский классификатор для сигналов набора индикаторов
  • 2017.05.12
  • Stanislav Korotky
  • www.mql5.com
В статье анализируется применение формулы Байеса для повышения надежности торговых систем за счет использования сигналов нескольких независимых индикаторов. Теоретические расчеты проверяются с помощью простого универсального эксперта, настраиваемого для работы с произвольными индикаторами.
 
Oleg Avtomat:

Bendat J., Pearsol A.

Angewandte Zufallsdatenanalyse: Aus dem Englischen übersetzt: World, 1989.

In. 126

BEISPIEL 5.4. UNKORRELIERTE ABHÄNGIGE ZUFALLSVARIABLEN.



Zwei Zufallsvariablen X und Y werden alskorreliertbezeichnet, wenn ihr Korrelationsmoment (oder Korrelationskoeffizient, was dasselbe ist) von Null verschieden ist; X und Y werden als unkorreliert bezeichnet, wenn ihr Korrelationsmoment Null ist.
Zwei korrelierte Größen sind ebenfalls abhängig. Andernfalls müssten wir nämlich zu dem Schluss kommen, dass µxy=0 ist, was der Bedingung widerspricht, da
für die korrelierten Größen µxy ≠ 0.
Die umgekehrte Annahme ist nicht immer wahr, d. h. wenn zwei Variablen abhängig sind, können sie korreliert oder unkorreliert sein. Mit anderen Worten: Das Korrelationsmoment zweier abhängiger Variablen kann nicht gleich Null sein, kann aber auch gleich Null sein.


Eine Korrelation zwischen zwei Zufallsvariablen bedeutet also , dass sie voneinander abhängig sind, aber eine Korrelation bedeutet nicht unbedingt eine Korrelation. Die Unabhängigkeit zweier Variablen impliziert, dass sie nicht korreliert sind, aber aus der Unkorrelation kann noch nicht auf die Unabhängigkeit geschlossen werden.

http://www.uchimatchast.ru/teory/stat/korell_zavis.php

Задачи оптимизации/ Статистика / Корреляция /Коррелированность и зависимость
Задачи оптимизации/ Статистика / Корреляция /Коррелированность и зависимость
  • www.uchimatchast.ru
Главная|Решения онлайн |Теория | Основные формулы и обозначения |Обратная связь | Корреллированность и зависимость случайных величин Две случайные величины X и У называют коррелированными, если их корреляционный момент (или, что то же, коэффициент корреляции) отличен от нуля; X и У называют некоррелированными величинами, если их...
 
Dimitri:


1. Niemand analysiert die Korrelation - es geht um die Wahl der Prädiktoren.

2) Sie wiederholten meinen Standpunkt drei Seiten zuvor: "Abhängigkeit ist ein Spezialfall von Korrelation. Wenn zwei Variablen voneinander abhängig sind, besteht definitiv eine Korrelation. Wenn es eine Korrelation gibt, dann muss nicht unbedingt eine Abhängigkeit bestehen.

3) Die Kreuzentropie wird ebenso wie die Korrelation keine Antwort auf das Vorhandensein einer funktionalen Abhängigkeit geben.


Hier habe ich mich geirrt - ich gebe es zu.

Wenn Zufallsvariablen unabhängig sind, sind sie auch unkorreliert, aber man kann nicht von der Unkorrelation auf die Unabhängigkeit schließen.

Wenn zwei Variablen abhängig sind, können sie korreliert oder unkorreliert sein.

 
Maxim Dmitrievsky:


Nur ist es kein neuronales Netz im eigentlichen Sinne, sondern ein Klassifikator. Deshalb wird es nicht neu trainiert, sondern die Parameter werden im Optimierer angepasst. Es spricht nichts dagegen, auch neuronale Netze in Optimierern zu verwenden, mit einer unterschiedlichen Anzahl von Schichten und einer unterschiedlichen Periode von Merkmalen und sogar deren Anzahl, das wäre noch besser.

Lesen Sie hier mehr, es gibt einen ganzen Rahmen auch https://www.mql5.com/ru/articles/3264

Dieses Zitat bezieht sich genau auf neuronale Netze im vollen Sinne des Wortes, und es sind genau diese Probleme, die er mit seinem RNN zu lösen versucht. Es geht nicht um RNN, sondern um die Tatsache, dass die Input-Output-Korrelation wichtig ist und die Korrelation der Inputs untereinander schädlich ist, und ich denke, dass dies auf konventionelle NS und RNN und auch auf konventionelle EAs angewendet werden kann.
 
elibrarius:
Das obige Zitat bezieht sich genau auf neuronale Netze im vollen Sinne des Wortes, und dies sind die Probleme, die er in seinem RNN zu lösen versucht

Ja, und sie werden einfach dadurch gelöst, dass man alle möglichen Parameter aufzählt und sie mit der Vorwärtsrichtung vergleicht... genau das Gleiche kann man mit NS machen. Sein RNN wird auf dieselbe Weise neu trainiert, wir wählen einfach die optimalsten stabilen Parameter, indem wir Backtest mit Forward vergleichen... alles ist genau dasselbe wie bei NS, nur dass wir im Falle von NS nicht die Gewichte, sondern die Input-Outputs im Optimierer wählen müssen.
 
Dimitri:

Wenn zwei Größen voneinander abhängig sind, können sie entweder korreliert oder unkorreliert sein.

Du hast es endlich verstanden))) Die Korrelation gibt nur eine lineare Abhängigkeit an, und NS hat nichts damit zu tun. Bitte verwechseln Sie auch nicht "Korrelation für nichtlineare Regression" und "nichtlineare Korrelation", Korrelation ist:

Alles andere ist Alternativlosigkeit und Humanismus.

 
Aljoscha:
Du hast es endlich verstanden))) Die Korrelation gibt nur eine lineare Abhängigkeit an, und NS hat nichts damit zu tun. Bitte verwechseln Sie auch nicht "Korrelation für nichtlineare Regression" und "nichtlineare Korrelation", es ist Korrelation:

Alles andere ist alternativ und humanitär.


Nochmals, fünfundvierzig....

Was für ein seltsamer Mensch Sie sind - über Ihrem Beitrag steht zwei Posts weiter schwarz auf weiß, dass das Vorhandensein oder Nichtvorhandensein einer Korrelation nicht bedeutet, dass es überhaupt eine Korrelation gibt, und dass Korrelation wiederum jemandem etwas "gibt".

Ich habe kaum noch Hände....

 
Dimitri:


Nochmals - vierzigfach....

Was für ein seltsamer Mensch Sie sind - über Ihrem Beitrag steht zwei Posts weiter schwarz auf weiß, dass das Vorhandensein oder Nichtvorhandensein von Korrelation überhaupt keine Korrelation bedeutet und wiederum Korrelation jemandem etwas "gibt".

Ich werde ein wenig niedergeschlagen....


Das haben Sie behauptet:

Dimitri:


Alle MO beruhen auf der Tatsache, dass die Eingangsvariablen sollte mit der Ausgangsvariablenkorrelieren.

Ansonsten haben ALLE MO-Modelle keinen Sinn.

Im Data Mining wird in ALLEN MODELLEN VARIABEL-VARIABEL-AUSWAHLMODELLEN der Mechanismus der maximalen Korrelation von Eingangsvariable und Ausgangsvariable umgesetzt:

Sie haben es also gründlich vermasselt und sich blamiert.


SZZ: "Das Vorhandensein oder Nichtvorhandensein einer Korrelation bedeutet überhaupt keine Korrelation" - wieder einmal - Unsinn. Die Korrelation ist genau das, was das Vorhandensein einer LINEAREN ZUVERLÄSSIGKEIT anzeigt, aber es gibt nicht-lineare, die die Korrelation nicht anzeigt.

 
Aljoscha:


Das haben Sie erklärt:

Das heißt, sie haben es vermasselt, sie haben sich blamiert.


ZS: "Das Vorhandensein oder Nichtvorhandensein einer Korrelation bedeutet überhaupt keine Abhängigkeit" - wieder einmal - Unsinn. Die Korrelation ist genau das, was eine lineare Abhängigkeit zeigt, aber es gibt nichtlineare Abhängigkeiten, die die Korrelation nicht zeigt.


Ich genieße es, wenn jemand jemanden wissenschaftlich überrollt :))
 
Aljoscha:


ZS: "Das Vorhandensein oder Nichtvorhandensein einer Korrelation bedeutet überhaupt keine Abhängigkeit" - wieder einmal - Unsinn. Die Korrelation zeigt zwar eine lineare Abhängigkeit, aber es gibt auch nichtlineare Abhängigkeiten, die die Korrelation nicht zeigt.

Es gibt ein klassisches Beispiel für eine falsche Korrelation: Die Zahl der Menschen, die in US-Schwimmbädern ertrinken, korreliert direkt und stark mit der Zahl der Filme mit Nicolas Cage in der Hauptrolle.

Es gibt eine Korrelation - wo ist die GROSSE Korrelation?