Neuronales Netz und Eingaben - Seite 39

 

Die Qualität der Modellierung in out of sample:
*
* TruePositives: 83
* TrueNegatives: 111
* FalschePositive: 96
* FalschNegative: 47
* Gesamtzahl der Muster in den Stichproben mit Statistik: 337
* Die restlichen Muster in den Stichproben ohne Statistik: 78
* Gesamtfehler in der nicht in die Stichprobe einbezogenen Gruppe: 143
* Empfindlichkeit der Verallgemeinerungsfähigkeit: 46.36871508379888%
* Spezifität der Verallgemeinerungsfähigkeit: 70,25316455696202%
* Verallgemeinerungsfähigkeit: 16.621879640760895%
* Indikator von Reshetov: 0.004123184591376475
*/
double x0 = 2,0 * (v0 - 19,0) / 35,0 - 1,0;
double x1 = 2,0 * (v1 - 12,26) / 57,8300000000005 - 1,0
double x2 = 2,0 * (v2 - 21,0) / 13,0 - 1,0
double x3 = 2,0 * (v3 - 12,11) / 24,3800000000003 - 1,0
double x4 = 2,0 * (v4 - 18,0) / 40,0 - 1,0
double x5 = 2,0 * (v5 - 11,61) / 58,5 - 1,0;
double decision = -0.03426154451479057 + 0.09136531101334192 * x0 -0.16115463032514218 * x1 + 0.3774761240476446 * x0 * x1 -0.149536367886396967 * x2 -0.2182655506670959 * x0 * x2 -0.686972851164288 * x1 * x2 -0.7274492971348857 * x0 * x1 * x2 -0.06979110777265085 * x3 + 0.27356476016739995 * x0 * x3 -0.026662374360625248 * x1 * x3 + 0.12474514432879064 * x0 * x1 * x3 -0.291989483838501985 * x2 * x3 -0.2863737167793397 * x0 * x2 * x3 + 0.04656257824516221 * x1 * x2 * x3 + 0,11427907143112637 * x0 * x1 * x2 * x3 + 0,01709410880995815 * x4 + 0,21856958901169654 * x0 * x4 -9.925957720785493E-4 * x1 * x4 + 0.9723342991021926 * x0 * x1 * x4 + 0.04599384769467396 * x2 * x4 -0.05459813284687198 * x0 * x2 * x4 + 0.37290192411918303 * x1 * x2 * x4 + 0,010296169116858033 * x0 * x1 * x2 * x4 + 0,058584612082841506 * x3 * x4 + 0,531371391780234 * x0 * x3 * x4 -0.025018778838931215 * x1 * x3 * x4 + 0,1861984476159817 * x0 * x1 * x3 * x4 + 0,07319097184962621 * x2 * x3 * x4 + 0,0968827127374181818 * x0 * x2 * x3 * x4 + 01411041957291555 * x1 * x2 * x3 * x4 + 0.16417712916264263 * x0 * x1 * x2 * x3 * x4 -0.1726597989770004 * x5 + 0.36239224523375185 * x0 * x5 -0.008892292227349143328 * x1 * x5 -0.04417677147047251 * x0 * x1 * x5 -0.7319687377043317 * x2 * x5 -0.7806416997531924 * x0 * x2 * x5 + 0.01225632222209106843 * x1 * x2 * x5 + 0,04393711771649319 * x0 * x1 * x2 * x5 -0,006563651321672569 * x3 * x5 + 0,0627642424509067496 * x0 * x3 * x5 -0.015999570769395857 * x1 * x3 * x5 -0.05302786422005222 * x0 * x1 * x3 * x5 + 0.03534892871195049 * x2 * x3 * x5 + 0.1463193475694817 * x0 * x2 * x3 * x5 -0.027476124047644598 * x1 * x2 * x3 * x5 + 0,052884787352004865 * x0 * x1 * x2 * x3 * x5 -0,018202954537325178 * x4 * x5 + 1,0 * x0 * x4 * x5 -0.07118968415781378 * x1 * x4 * x5 -0.003138748792788926 * x0 * x1 * x4 * x5 + 0.2624137067639589 * x2 * x4 * x5 -0.02015595378617162 * x0 * x2 * x4 * x5 + 0.08019279607969382 * x1 * x2 * x4 * x5 + 0,06399649461673285 * x0 * x1 * x2 * x4 * x5 -0,02596308616804378 * x3 * x4 * x5 + 0.18361769860857746 * x0 * x3 * x4 * x5 -0.08407017017920377723 * x1 * x3 * x4 * x5 + 0.03014271917587724 * x0 * x1 * x3 * x4 * x5 + 0.07432306756805093 * x2 * x3 * x4 * x5 + 0.20722895875809277 * x0 * x2 * x3 * x4 * x5 + 0,0075079586507851345 * x1 * x2 * x3 * x4 * x5 + 0,20670493972886933 * x0 * x1 * x2 * x3 * x4 * x5

Es ist kompliziert..... Wie gut die Daten die abhängige Variable beschreiben????

 

Ich habe eine Ausbildungsdatei eingereicht. Noch kein Testintervall :-( Aber das ist kein Problem.....

Und soweit ich verstanden habe, waren 337 Beiträge nötig, obwohl ich 600 eingereicht habe.

Hier werde ich versuchen, das Ergebnis in meiner Umgebung zu reproduzieren. Ich frage mich, was das Ergebnis sein wird, auch auf verschiedenen Rechnern?

Dateien:
 
Und was die Daten betrifft, so ist nicht ganz klar, wie man sie zum Trainieren des Netzes auf saubere Daten nehmen kann..... Wie wählt man TruePositives: TrueNegatives: FalsePositives: FalseNegatives aus der Trainingsstichprobe aus und versucht, das Netz zu trainieren. Schauen Sie, was passiert. Normalisierung der eingehenden Daten, das ist eine gute Sache.... Ich weiß nicht, wie man.... verwendet. Nur, damit es gut aussieht...
 

Das Ergebnis entspricht....... Angenommen, wir haben 83 echte positive Beispiele gefunden. Wie können wir sie von der Gesamtprobe trennen...... Und füttern Sie rein diese 83 Datensätze natürlich normalisiert. Und wenn das Netz mit minimalem Fehler zu diesen 83 Datensätzen lernt. Dann wird es (theoretisch) in der Lage sein, solche Datensätze in der Eingabe noise...... zu klassifizieren. So....

 
nikelodeon:

Ich habe eine Ausbildungsdatei eingereicht. Noch kein Testintervall :-( Aber das ist kein Problem.....

Und soweit ich verstanden habe, waren 337 Beiträge nötig, obwohl ich 600 eingereicht habe.

Hier werde ich versuchen, das Ergebnis in meiner Umgebung zu reproduzieren. Ich frage mich, was das Ergebnis sein wird, auch auf verschiedenen Rechnern?

Die VMR unterteilt die Gesamtstichprobe in zwei Teile: Training und Kontrolle. Wenn also die Gesamtstichprobe 600 Beispiele enthält, bedeutet dies, dass 600 - 337 = 263 Beispiele in der Trainingsstichprobe enthalten waren, auf deren Grundlage das Modell erstellt (trainiert) wurde, und 337 Beispiele in der Kontrollstichprobe enthalten waren, auf deren Grundlage das Modell dann getestet (aber nicht trainiert) wurde.
nikelodeon:
Und was die Daten betrifft, so ist nicht ganz klar, wie man sie zum Trainieren des Netzes auf saubere Daten verwenden kann..... Wie extrahiert man aus einer Trainingsmenge TruePositives: TrueNegatives: FalsePositives: FalseNegatives und versucht, das Netz zu trainieren.
Es macht keinen Sinn, irgendetwas aus der Trainingsmenge zu extrahieren. Die Trainingsstichprobe dient nur zur Erstellung des Modells, und das Modell gilt für andere Daten, die nicht in dieser Stichprobe enthalten sind, so dass VMR alle Berechnungen nur mit der Kontrollstichprobe durchführt.
 

JPrediction wurde nicht geschaffen, um Finanzinstrumente vorherzusagen, sondern um die Rentabilität von Signalen für den nächsten Monat vorherzusagen.

Mit anderen Worten, ich stelle eine Stichprobe zusammen, die die aktuellen Signaleigenschaften enthält: Anzahl der Geschäfte, Laufzeit, monatlicher Gewinnanteil, Prozentsatz der gewinnbringenden Geschäfte, Prozentsatz der Verlustgeschäfte, Gewinnfaktor, Sharps Ratio usw. Dann warte ich einen Monat und markiere mit 1 pro Monat profitable und 0 unprofitable Trades.

Dann trainiere ich das Modell anhand dieser Stichprobe und verwende es zur Vorhersage der Signale für den nächsten Monat.

Der Gedanke dahinter ist, dass Signale leichter zu prognostizieren sind, weil sie neben den historischen Daten viele zusätzliche nützliche Informationen enthalten. Für Finanzinstrumente gibt es außer den historischen Daten keine weiteren Daten.

 
Wizard, welches Programm verwenden Sie zur Auswertung der Daten? E-excel???
 

Ich überlege also... wie man das Ergebnis interpretieren kann... um es schneller zu machen und sicherlich nicht per Hand........

 
Reshetov:

JPrediction wurde nicht geschaffen, um Finanzinstrumente vorherzusagen, sondern um die Rentabilität von Signalen für den nächsten Monat vorherzusagen.

Mit anderen Worten, ich stelle eine Stichprobe zusammen, die die aktuellen Signaleigenschaften enthält: Anzahl der Geschäfte, Laufzeit, monatlicher Gewinnprozentsatz, Prozentsatz der gewinnbringenden Geschäfte, Prozentsatz der Verlustgeschäfte, Gewinnfaktor, Sharp's Ratio usw. Dann warte ich einen Monat und markiere 1 Markierung für Signale, die innerhalb eines Monats einen Gewinn erzielt haben, während ich 0 Markierung für unrentable Geschäfte markiere.

Dann trainiere ich das Modell anhand dieser Stichprobe und verwende es zur Vorhersage der Signale für den nächsten Monat.

Der Gedanke dahinter ist, dass Signale leichter zu prognostizieren sind, weil sie zusätzlich zu den historischen Daten eine Menge zusätzlicher nützlicher Informationen enthalten. Für Finanzinstrumente gibt es außer den historischen Daten keine weiteren Daten.

Ich unterstütze diese Sichtweise voll und ganz, ich habe einen Indikator, der Signale gibt. Die gleichen Berufe. Ich denke, es ist möglich, es auch in JPrediction laufen zu lassen, aber es ist nicht klar, wie man das Trainingsintervall wählt? Und es wäre praktisch, die Datei mit dem berechneten Indikator für jeden Datensatz zu speichern....., wie es von Vizard gemacht wird...... und die Daten selbst, so dass man sie erhalten könnte.... Auf ihnen kann man später versuchen, ein anderes Netzwerk zu trainieren..... Das war's. Sag mal Juri, ist das geplant????
 
Das Ärgerlichste ist, dass Excel solche langen Formeln auch nicht unterstützt :-(