Marktknigge oder gute Manieren im Minenfeld - Seite 83

 
paralocus писал(а) >>

Die optimale Cagey-Partitionierung eines Tick-BP mit Schwellenwert H sollte als die Partitionierung angesehen werden, bei der es die minimale Anzahl aufeinanderfolgender einfarbiger Schultern einer Reihe von Transaktionen gibt.

Wenn die Verteilung der sich ergebenden Reihe von Transaktionen so ist, dass mehr als 50 % der aufeinanderfolgenden Schultern unterschiedliche Farben haben, warum dann überhaupt NS?

Das ist richtig. Der von Ihnen vorgetragene Fall entspricht in der Tat einem ineffizienten Markt, auf dem man Geld verdienen kann und sollte! Wenn Sie die Transaktionsreihe (RT) isoliert von der Endzeit (nur der Countdown der Reihe) darstellen, ist der Effekt am deutlichsten:

Genau solche Gebiete (und für H+/--Strategien sehen sie gleich aus) werden von TC auf der Grundlage der in Pastukhovs Dissertation beschriebenen Kagi-Gebäude befischt. Es gibt jedoch ein Problem im Zusammenhang mit der geringen Rentabilität (im Vergleich zu den Maklerprovisionen) solcher TS. Das hängt damit zusammen, dass die klassische Strategie die einfachste und am leichtesten zugängliche Eigenschaft der Kagi-Formation nutzt - die Umkehrung der PT, aber es gibt noch andere Regelmäßigkeiten... Das sollte der NS erkennen können!

 
Neutron >> :

es gibt noch andere Muster... Das sollte der NS erkennen können!

Können wir diesen Punkt näher erläutern? Ich kann mir nichts anderes vorstellen als schulterlang (wenn man an NS und Kagi denkt)

Ich bin also irgendwie ratlos:

Angenommen, es gibt einen NS, der mit einer Anzahl von: +1,-1,+1,-1,+1,-1,-1.... trainiert wird. (d.h. binäre Eingänge). In diesem Fall kann ich mit einer Genauigkeit von etwa 80 % aus dem Dreifachen erraten, was er lernen wird. Die Nichtlinearität des NS ist irrelevant.

 

Ich würde genauso gerne wie Sie die Antworten auf einige Fragen wissen!

Schauen wir uns an, wie ein binärer NS funktioniert. Angenommen, wir haben einen Trainingsvektor. Alles, was eine solche NS tun kann, um den Ausgabefehler zu minimieren, ist, die Wahrscheinlichkeiten der Ergebnisse für alle möglichen Eingabekombinationen zu berechnen. Der Klarheit halber nehmen wir drei Eingaben an, dann werden alle Eingabekombinationen auf die folgenden Muster reduziert (für die Schönheit gehen wir von +/-1 bis 0/1):

000

001

010

011

100

101

110

111

Wenn der Trainingsvektor P um ein Vielfaches länger ist als die Anzahl der Eingaben d, dann berechnet das NS einfach die Wahrscheinlichkeit p, dass bei jedem Muster eine 1 herausfällt (die Wahrscheinlichkeit für Null ist 1-p). Aber wir schaffen das auch ohne NS! Hier gibt es eine kleine Besonderheit. Was tun Sie nämlich, wenn Sie im Trainingsvektor keine Kombinationen finden? Was werden Sie diesem Muster in der Realität zuordnen? - Nichts! Sie müssen die Länge des Vektors P erhöhen, bis Sie auf ihn (das Muster) stoßen. Und es ist kein Faktum, dass man genügend Daten zur Verfügung hat, und selbst wenn, ist es kein Faktum, dass man die optimale Lerndauer nicht überschreiten kann. Sie wissen, was ich meine? Hier kommt der Vorteil von NS ins Spiel. Es stellt sich heraus, dass es nicht das gesamte Training (für alle Gelegenheiten) benötigt, sondern in der Lage ist, vorhandenes Wissen mit maximaler Verallgemeinerungssicherheit zu verallgemeinern! Mit anderen Worten: Es rekonstruiert das wahrscheinlichste Ergebnis für ein Muster von selbst, auch wenn es vorher im Trainingsprogramm nicht vorhanden war. Es ist wie bei einem Erwachsenen - wir brauchen keinen Präzedenzfall, um in dieser oder jener Situation eine Entscheidung zu treffen.

Es trifft also eine Entscheidung, indem es die verfügbaren Daten (Input) auf eine bestimmte Hyperfläche projiziert, die es während seines Trainings im Merkmalsraum aufbaut. Diese Fläche ist mehrdimensional (nach Anzahl der Eingänge) und kann eine Ebene oder eine Fläche höherer Ordnung sein (Paraboloid, Hyperboloid für drei Dimensionen usw.). Das Vorhandensein von Nichtlinearität ermöglicht komplexe Oberflächentopologien, und es spielt keine Rolle, dass die Eingabe binär ist, wichtig ist nur, dass sie auf eine nichttriviale Oberfläche projiziert wird.

Ich denke also, dass die Nichtlinearität auch bei einer binären Eingabe eine Rolle spielt.

 
Ja, ich habe verstanden. Es gibt eine Idee. Es soll die Wahrscheinlichkeit berechnet werden, dass der Projektionsmodul des nächsten Hebels einer Reihe von Transaktionen auf der Y-Achse eine Streuung von n>1 hat. Berechnen Sie dann die Größe der Bestechung als MO der Länge des Hebels, und das Gleiche wird der Anschlag sein. Ich fürchte, das ist alles, was die Statistik hergibt, aber es ist +.
 

Ich bin ein wenig verwirrt über die Fehlerberechnung für die verborgene Schicht mit nicht-linearem FA. Können Sie bitte überprüfen, ob ich den Fehler der verborgenen Schicht richtig einschätze?

Hier verwirrt mich die Tatsache, dass der Fehler am Ausgang der verborgenen Schicht gleich dem Wert der Mikrokorrektur der entsprechenden Synapse der Ausgangsschicht ist

 

Nein, das ist nicht in Ordnung!

1. Suchen Sie den NS-Ausgang - OUT. Da haben Sie recht.

2. Berechnen Sie den Fehler des NS: dOUT=x-OUT. Finden Sie in Kenntnis dieses Fehlers den Wert der Korrekturgewichte des Ausgangsneurons. Auch das ist richtig.

3. derselbe Fehler liegt am Ausgang jedes i-ten Neurons der versteckten Schicht (Eingang), berechne ihn mit der Formel zum Eingang zurück: dIn[i]=dOUT*(1-out[i]^2), wobei out[i ] die Ausgabe des i-ten Neurons der versteckten Schicht ist. Wenn man den Fehler kennt, der an den Eingang jedes Neurons gelangt(dIn[i]), kann man den Wert der Korrekturgewichte in der Eingangsschicht ermitteln.

 

Ich habe 100 bis 120 Epochen für eine einzelne Schicht angegeben. Reicht das für eine zweischichtige Anlage wahrscheinlich nicht aus? Das Kotier(Uhrwerk) liefert noch keine guten Ergebnisse.


 
paralocus писал(а) >>

Irgendetwas an ihr auf dem Kotier (Uhrwerk) bringt bisher keine guten Ergebnisse.

Erwarten Sie etwas anderes?

 
Neutron >> :

Haben Sie etwas anderes erwartet?

Ehrlich gesagt, ja. Ich meine, die Sache mit den einzelnen Schichten hat funktioniert. Aber Sie haben recht, Sie sollten endgültig mit den Zeitrahmen aufhören.

 
paralocus писал(а) >>

Ich habe 100 bis 120 Epochen für eine einzelne Schicht angegeben. Reicht das für eine zweischichtige Anlage wahrscheinlich nicht aus? Die Ergebnisse im Kotier (Uhrwerk) sind noch nicht gut.

Ich dachte, du hättest das mit der einzelnen Schicht gesagt...

Ich habe eine doppelte Schicht auf der Kapelle, die durchweg th<=0,05 ergibt, und eine einfache Schicht um Null herum.