Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 352

 
Maxim Dmitrievsky:

Wie falsch, Sie erstellen ein Klassifizierungsmodell. Je größer die Stichprobe ist, desto stärker ist die Verallgemeinerung, das Modell wird im Allgemeinen robuster und im Besonderen ungenauer, bzw. desto geringer ist der Gewinn

Betrachten wir es einmal unter dem Aspekt der Effizienz. Wenn die Effizienz des Systems mit zunehmender Komplexität abnimmt, ist das System uninteressant. Ein Rückgang von Gewinn + Verlust deutet auf einen Rückgang der Effizienz hin.

Mit zunehmender Nachhaltigkeit sollte auch die Effizienz steigen. Die Effizienz kann definiert werden als das Verhältnis zwischen Gewinn und (Gewinn+Verlust). Sie können auch die Effizienz pro Handel nutzen.

 
Yuriy Asaulenko:

Betrachten wir es einmal unter dem Aspekt der Effizienz. Wenn die Effizienz des Systems mit zunehmender Komplexität abnimmt, ist das System uninteressant. Ein Rückgang von Gewinn + Verlust deutet auf einen Rückgang der Effizienz hin.

Mit zunehmender Nachhaltigkeit sollte auch die Effizienz steigen. Die Effizienz kann definiert werden als das Verhältnis zwischen Gewinn und (Gewinn+Verlust). Auch KPI pro Handel können berücksichtigt werden.


Sie kann nicht auf VS angewandt werden)) es zeigt sich, dass die langfristige Effizienz steigt und die kurzfristige Effizienz sinkt) Es gibt eine Strategie und eine Taktik... kurzfristiges Lernen hilft NS taktisch, und langfristiges Lernen - verschiedene Faktoren können es beeinflussen...
 
Yuriy Asaulenko:

Betrachten wir es einmal unter dem Aspekt der Effizienz. Wenn die Effizienz des Systems mit zunehmender Komplexität abnimmt, ist das System uninteressant. Ein Rückgang von Gewinn + Verlust deutet auf einen Rückgang der Effizienz hin.

Mit zunehmender Nachhaltigkeit sollte auch die Effizienz steigen. Die Effizienz kann als das Verhältnis von Gewinn zu (Gewinn + Verlust) definiert werden. Sie können auch KPI pro Handel nehmen.

Vermeiden wir Fahrräder namens KPI.

Die Ökonometrie verwendet Informationskriterien.

Hier ist die Definition

DasInformationskriterium ist ein Maß für die relative Qualität ökonometrischer (statistischer) Modelle, das in der Ökonometrie (Statistik) angewandt wird und den Grad der "Anpassung" des Modells an die Daten berücksichtigt, korrigiert (bestraft) durch die verwendete Anzahl der geschätzten Parameter. Das heißt, die Kriterien beruhen auf einem Kompromiss zwischen Modellgenauigkeit und Komplexität.

Informative Kriterien werden ausschließlich für den Vergleich von Modellen untereinander verwendet, ohne dass ihre Werte sinnvoll interpretiert werden. Sie ermöglichen keine Modellprüfung im Sinne eines statistischen Hypothesentests. Im Allgemeinen gilt: Je niedriger die Werte der Kriterien sind, desto höher ist die relative Qualität des Modells.


Wenn wir ein Paket nehmen, bei dem eine Modellauswahl vorausgesetzt wird, wird eines der Informationskriterien verwendet.

 
Dimitri:


Faa schreibt das Richtige, aber er drückt es nicht richtig aus.

Sie haben eine Serie und eine Reihe von Prädiktoren. Sie unterteilen die Reihe in drei Teile - eine Trainingsstichprobe und eine Vorwärtsprobe (der einfachste Fall).

Sie bauen z. B. 20 Modelle.

Der Punkt ist, dass die Auswahl eines Modells aus der Liste nicht durch das beste auf der Trainingsstichprobe und nicht durch das beste auf der Vorwärtsstichprobe durchgeführt wird. Und wir wählen das Modell aus, das in der Trainingsstichprobe und in der Vorwärtsstichprobe annähernd die gleichen Qualitätswerte erzielt.

Wir haben beide Recht.

Ein Informationskriterium wird verwendet, um die einfachere Variante auszuwählen, aber das Informationskriterium schließt keineswegs die Vorwärtsprüfung aus.

 
SanSanych Fomenko:

Lassen wir die Fahrräder namens KPIs beiseite.

Die Ökonometrie verwendet Informationskriterien.

Das eine beeinträchtigt oder ersetzt das andere keineswegs. In den Wirtschaftswissenschaften gibt es Effizienzkriterien in dem Sinne, dass sie den KPI absolut entsprechen. Es ist nicht nötig, etwas zu erfinden.

In diesem Fall bewerten wir das Ergebnis, nicht den Prozess. Wir kümmern uns nicht mehr um Prozesskriterien. Das System ist eine Blackbox. Aus diesem Grund vergleichen wir die Merkmale der Boxen.

Es gibt auch Bewertungskriterien - Effektivität pro 1 Rubel der Investition, durchschnittliche Effizienz eines Geschäfts, usw. Das ganze Geschäft läuft nach solchen Kriterien. Was tun wir am Ende?

 
Maxim Dmitrievsky:
Gut. Sie haben die Stabilität des Systems erhöht - Sie haben Drawdowns eliminiert. Auch wenn der Gesamtgewinn nicht einmal gesunken ist, so ist er doch konstant geblieben. Die Frage ist: Was ist aus den Geschäften geworden, die es Ihnen ermöglicht haben, aus diesen Gruben herauszukommen? Hätten Sie sie nicht entfernt, hätten sie nur den Gewinn des Systems erhöht.
 
Yuriy Asaulenko:
Gut. Sie haben die Stabilität des Systems durch die Beseitigung von Drawdowns erhöht. Auch wenn der Gesamtgewinn nicht einmal gesunken ist, sondern konstant bleibt. Die Frage ist: Was ist aus den Geschäften geworden, die es Ihnen ermöglicht haben, aus diesen Gruben herauszukommen? Hätten Sie sie nicht entfernt, hätten sie nur den Gewinn des Systems erhöht.

Wenn Sie das Neuron auf verschiedenen Zeitrahmen trainieren, werden Sie unterschiedliche Ergebnisse erhalten, es gibt nichts zu vergleichen. Die Signale werden unterschiedlich sein, das Modell wird unterschiedlich trainiert und es gibt nichts, was Sie tun können, um das zu beeinflussen. Ich habe nichts entfernt)
 
Maxim Dmitrievsky:

Wenn Sie das Neuron in unterschiedlichen Zeitintervallen trainieren, werden Sie unterschiedliche Ergebnisse erhalten, es gibt nichts zu vergleichen... die Signale werden unterschiedlich sein, das Modell wird unterschiedlich trainiert und Sie können es überhaupt nicht beeinflussen. Ich habe nichts entfernt)

Es ist verständlich, dass der Optimierer entfernt wird. Die Wiederholbarkeit der Ergebnisse ist jedoch eine Voraussetzung für jedes Experiment. D.h. wenn wir unterschiedliche Ergebnisse im Test haben, wenn wir auf verschiedenen Abschnitten trainieren, ist das ein Grund zum Nachdenken.

Stellen Sie sich vor, wir bringen identischen NS bei, Sprache mit der gleichen ToR zu erkennen, und entscheiden dann, dass sie nicht einmal verglichen werden können, weil sie unterschiedlich trainiert wurden.

 
Yuriy Asaulenko:

Es ist verständlich, dass der Optimierer entfernt wird. Die Wiederholbarkeit der Ergebnisse ist jedoch eine Voraussetzung für jedes Experiment. D.h. wenn wir unterschiedliche Ergebnisse im Test haben, wenn wir auf verschiedenen Abschnitten trainieren, ist das ein Grund zum Nachdenken.

Stellen Sie sich vor, wir bringen identischen NS bei, Sprache mit der gleichen ToR zu erkennen, und entscheiden dann, dass sie nicht einmal verglichen werden können, weil sie unterschiedlich trainiert wurden.


In gewisser Weise ja, aber im aktuellen Modell ist das nicht möglich, es ist nicht so komplex, dass es einen kleinen Datensatz und einen großen Datensatz in gleicher Weise approximieren würde.
 
Maxim Dmitrievsky:

Nun, in gewisser Weise schon, aber beim derzeitigen Modell ist es unmöglich, einen kleinen und einen großen Datensatz auf die gleiche Weise zu approximieren.

Im Allgemeinen ist der Markt, wenn es um Minuten geht, statistisch homogen, d. h. die Statistiken ändern sich von Woche zu Woche oder von Monat zu Monat nur wenig (stabil). Ich weiß es nicht, ich habe mich mit dieser Frage nicht beschäftigt. Soweit ich mich erinnere, arbeiten Sie an 1 Minute.

Im Prinzip sollten einfache Systeme schneller konvergieren, wenn sie konvergent sind. D.h. sie haben ein hohes Maximum. Übrigens erzeugen wir diese Höchstwerte selbst mit "falschen" Prädiktoren.