Was soll in den Eingang des neuronalen Netzes eingespeist werden? Ihre Ideen... - Seite 63

 
Forester #:

Betrachten wir den Fall von gemusterten Daten. Multiplikationstabellen, zum Beispiel. Je mehr Beispiele Sie geben, desto genauer werden die Antworten auf die neuen Daten sein.
Die neuen Daten sollten nicht völlig anders sein, sondern zwischen den Trainingsbeispielen liegen. D.h. die Interpolation wird mehr oder weniger gut funktionieren. 1 Baum ergibt das nächstgelegene Trainingsbeispiel. Wenn Sie mit anderen Daten Daten außerhalb der Grenzen der Trainingsdaten meinen, ist dies bereits eine Extrapolation. Der Baum liefert das äußerste Beispiel, weil es am nächsten liegt.


Wenn wir Marktdaten betrachten, dann wird bei einem großen Wert des Rauschens jeder Peak des wahren Musters mit den Rauschpeaks vermischt und wir müssen irgendwie den wahren Peak und nicht den Rauschpeak auswählen. Ihre Aussagen sind hier korrekt.


I van Butko #:







Nochmals zum Rauschen: Alle reden von Rauschen. Aber wie können wir Rauschen definieren, wenn wir die Regeln und Gesetze nicht kennen? Was, wenn jeder Tick eine Komponente von Regeln und Gesetzen ist und das Problem in der Unfähigkeit der Architekturen liegt, den "Code" eines Graphen zu entschlüsseln?

Es scheint hier ein Postulat zu sein (die Idee des Rauschens in einem Kursdiagramm)

Über Rauschen und Muster

Es ist nicht bekannt, wie groß das Rauschen in den Marktdaten ist und ob und in welchem Ausmaß Muster existieren.

Über Lernen, Einprägen und Behalten

Bewahrung - Wenn Daten einfach in Variablen geschrieben werden , ohne ihre Qualität zu bewerten, kann man von Bewahrung sprechen. Ein Beispiel dafür ist das normale Schreiben von Daten in Variablen (Datenbank, Tabelle, Matrix, usw.).

Speicherung: Wenn während des Speichervorgangs eine Qualitäts bewertung vorgenommen wird, handelt es sich bereits um eine Speicherung. Zum Beispiel die Schätzung des Prozentsatzes der richtigen Antworten bei der Anzahl der zu speichernden Fragen. In diesem Fall gilt: Je mehr Beispiele, desto größer der Anwendungsbereich. Bei einer 2 x 8-Aufgabe wäre die Antwort beispielsweise 16, aber bei 18 x 67 könnte die Antwort alles sein, da diese Frage nicht in den Beispielen enthalten war.

Lernen: Das Lernen aus gespeicherten und gemerkten Daten ist mit der Qualitätsbewertung möglich. Training ist der Prozess der Bildung von Regeln für die Verarbeitung gespeicherter Daten. Zum Beispiel das Üben der Anwendung der Regel der Multiplikation mit einer Spalte. Hier muss man sich nur die minimal notwendigen Informationen (Multiplikationstabelle) merken, und mit Hilfe der Spaltenregel kann man jede beliebige Zahlenkombination multiplizieren, einschließlich 18 x 67 und sogar 1,657875 x 3,876754.

Ein Beispiel für das Lernen wären GPT-ähnliche Modelle, die sich nicht nur Daten merken, sondern auch Regeln zur Verarbeitung verschiedener Daten anwenden, indem sie Berechnungen wie die Spaltenmultiplikation durchführen.

Nachdem wir uns nun mit den Konzepten des Lernens, des Einprägens und des Behaltens beschäftigt haben, können wir die Frage stellen: Wo wird beim maschinellen Lernen (das keine GPT-ähnlichen Modelle umfasst) das Lernen zur Analyse von Marktdaten angewandt?

P.S. Dies sind die Grundlagen, später werden wir uns mit der Bedeutung der Bewertung und anderen interessanten Aspekten befassen.

P.P.S. Überlernen , Unterlernen und ähnliche Zustände können weder quantitativ noch qualitativ bewertet werden, so dass es wenig Sinn macht, darüber sinnvoll und aussagekräftig zu sprechen.

 
Andrey Dik #:

Auswendiglernen: Wenn die Qualitätsbewertung während des Bewahrungsprozesses durchgeführt wird, handelt es sich bereits um Auswendiglernen.

Datenbanken, Bäume und Cluster, die sich Informationen zu 100 % einprägen, müssen nicht bewertet werden. Aber Sie können überprüfen, was 3*3 gleich ist, indem Sie alle möglichen Varianten ausprobieren. Es liegt an dir und deiner Zeit... Ich werde mich um wichtigere Dinge kümmern.

P.P.S. Übertraining , Untertraining und ähnliche Zustände können weder quantitativ noch qualitativ ausgewertet werden, so dass es praktisch keinen Sinn macht, darüber sinnvoll und aussagekräftig zu sprechen.

Nur untertrainierte Modelle müssen evaluiert werden.

 
Forester #:

1. Datenbanken, Bäume und Cluster, die Informationen zu 100 % speichern, müssen nicht ausgewertet werden.

2. Nur untrainierte Modelle müssen evaluiert werden.

1. Wenn es keine Evaluierung gibt, bedeutet dies, dass der Prozess des Behaltens und nicht des Erinnerns stattfindet. Oben wurde der Unterschied deutlich.

2. Wie kann man feststellen, wann ein Modell "zu wenig gelernt" ist und um wie viel?

 
Wahrscheinlich ist das ein anderes Thema, aber meine Erfahrung sagt, dass nur Oszillatoren (Wahrscheinlichkeiten, Gewinnraten usw.) qualitativ vorhergesagt werden können. Diejenigen, die von der Vorhersage von Kursbewegungen träumen, sind meiner persönlichen Meinung nach noch nicht in der Lage, dies zu tun (oder vielleicht sogar überhaupt nicht)!
 
Sergey Pavlov #:
Wahrscheinlich ist das ein anderes Thema, aber meine Erfahrung sagt, dass nur Oszillatoren (Wahrscheinlichkeiten, Gewinnraten usw.) qualitativ vorhergesagt werden können. Diejenigen, die davon träumen, Kursbewegungen vorherzusagen, sind meiner persönlichen Meinung nach noch nicht in der Lage, dies zu tun (oder vielleicht sogar überhaupt nicht)!

was bedeutet winrate?

 
Andrey Dik #:

1. Wenn es keine Bewertung gibt, dann ist es ein Prozess des Behaltens, nicht des Auswendiglernens. Ich habe den Unterschied oben aufgezeigt.

2. Wie kann man feststellen, wann ein Modell "zu wenig gelernt" ist und um wie viel?

1) Das Auswendiglernen besteht nur für Sie darin, mögliche Varianten durchzugehen und jede einzelne zu bewerten. Sie haben es nicht nötig, dies anderen aufzudrängen und es als Wahrheit auszugeben.

2) Es muss nicht definiert werden, vor dem Training wird es in den Parametern festgelegt - zu 100% trainieren oder unterlernen.

 
Forester #:

1) Das Auswendiglernen besteht nur für Sie darin, mögliche Optionen durchzugehen. Zwingen Sie es nicht anderen auf und geben Sie es als Wahrheit aus.

2) Es muss nicht definiert werden, vor dem Training wird es in den Parametern festgelegt - zu 100% trainieren oder untertrainieren.

1. Was hat das Auswendiglernen und das "Durchgehen der möglichen Optionen" damit zu tun? Sie müssen sich nicht etwas ausdenken, was ich nicht behauptet habe und daher auch niemandem auferlegen konnte.))

2. In der Art und Weise, wie Sie MO anwenden, und viele Menschen im Allgemeinen, ist Lernen nur bedingt vorhanden. Denn es findet keine Regelbildung zur Verarbeitung neuer unbekannter Daten statt. Es gibt ein Auswendiglernen. Das habe ich oben gezeigt.


Mir ist klar, dass es schmerzhaft sein kann, manche Dinge zu akzeptieren, weil sie etablierte Überzeugungen erschüttern. Aber wenn man sie akzeptiert, wird klar, warum manche Methoden nicht die erwarteten Ergebnisse bringen, und man kann daher die Richtung der Forschung ändern.

 
Andrey Dik #:

1. Was hat das Auswendiglernen und das "Durchgehen der Optionen" damit zu tun? Sie müssen sich nicht etwas ausdenken, was ich nicht behauptet habe und daher auch niemandem aufzwingen konnte.))

2. In der Art und Weise, wie Sie MO anwenden, und viele Menschen im Allgemeinen, ist Lernen nur bedingt vorhanden. Denn es findet keine Regelbildung zur Verarbeitung neuer unbekannter Daten statt. Es gibt ein Auswendiglernen. Das habe ich oben gezeigt.


Mir ist klar, dass es schmerzhaft sein kann, einige Dinge zu akzeptieren, weil sie etablierte Überzeugungen zunichte machen. Aber wenn man sie akzeptiert, wird klar, warum manche Methoden nicht die erwarteten Ergebnisse bringen, und das erlaubt es, die Richtung der Forschung zu ändern.


Was ist der Unterschied zwischen einer gewöhnlichen Datenbank und einem intelligenten System?

 
Ivan Butko #:


Was ist der Unterschied zwischen einer normalen Datenbank und intelligenten Systemen?


Ein Beispiel: Das gleiche gpt merkt sich nicht nur die Multiplikationstabelle, sondern ist darauf trainiert, die Spaltenregel zu verwenden. Das bedeutet, dass es jede Zahl multiplizieren kann, nicht nur innerhalb der Multiplikationstabelle.

Dies ist der Unterschied zwischen einer gewöhnlichen Datenbank und intelligenten Systemen. Solche Systeme können bekannte Regeln anwenden, um neue Informationen zu verarbeiten, wie es ein Mensch tut. Eine noch höhere Stufe der Intelligenz ist die Fähigkeit, neue Regeln zu entwickeln und dabei alte Regeln als Grundlage zu verwenden.

Das herkömmliche "Training" eines neuronalen Netzes schafft keine Regeln und funktioniert daher nicht gut bei unbekannten Daten. Es handelt sich lediglich um eine Annäherung an die Daten, und wir erwarten, dass diese Annäherung bei neuen Daten genauso gut funktioniert wie bei den Trainingsdaten.