Gibt es ein Muster in diesem Chaos? Lassen Sie uns versuchen, es zu finden! Maschinelles Lernen am Beispiel einer bestimmten Stichprobe. - Seite 12

 
elibrarius #:

Wählen Sie diese Modelle auf der Grundlage des besten Modells im Test aus?

Oder ist unter den vielen Besten im Test auch der Beste in der Prüfung?

Konkret gab es eine Auswahl einfach nach dem Besten in der Prüfung.

 
Aleksey Vyazmikin #:

Konkret ging es um die Auswahl der Besten bei der Prüfung.

Ich habe auch in der Prüfung am besten abgeschnitten. Es wird keine Prüfung geben, bevor man in den echten Handel einsteigt. Oder besser gesagt, es wird um echtes Geld gehen....

Jetzt habe ich eine Auswahl von Zeichen durch Valking vorwärts (10000 bis 5000 und eine Trainee wie Sie und ein Test), auf der Prüfung beide zusammen.

Es ist notwendig, die Auswahl irgendwie auf dem Test zu machen, so dass die Lernfähigkeit auf der Prüfung erhalten bleibt.

 
elibrarius #:

Ich habe auch in der Prüfung das beste Ergebnis gezeigt. Es wird keine Prüfung geben, bevor wir in den echten Handel einsteigen. Oder besser gesagt, es wird um echtes Geld gehen....

Jetzt habe ich eine Auswahl von Zeichen durch valking vorwärts (10000 bis 5000 und eine Trainee wie Sie und ein Test), auf die Prüfung beide zusammen.

Es ist notwendig, die Auswahl irgendwie auf dem Test zu machen, so dass die Lernfähigkeit auf der Prüfung erhalten bleibt.

Im Moment kann man leider nur die Wahrscheinlichkeit der richtigen Auswahl erhöhen. Deshalb denke ich über Batch-Trading nach, bei dem viele Modelle auf einmal ausgewählt werden, in der Hoffnung, dass die durchschnittliche Genauigkeit ausreichend ist und ich einen durchschnittlichen Gewinn erzielen kann.

 
Es ist notwendig, aus Hunderttausenden von Merkmalen funktionierende Merkmale zu finden und dann zu verstehen, warum sie funktionieren. Und dann muss man verschiedene TCs für sie schreiben, nicht durch Brute-Forcing, sondern durch die Auswahl optimaler Hyperparameter.
Andernfalls wird es sich immer noch als passend herausstellen, wenn man aus Hunderten von Modellen für die Prüfung auswählen muss.
Das Wichtigste ist, dass man versteht, warum die Merkmale funktionieren, zumindest annähernd. Dann können sie verbessert werden, oder man kann sie beschriften.

Es ist auch keine gute Idee, einen Haufen unklarer Modelle zu stapeln. Denn dann müssen Sie einen Haufen unbekannter Dinge erneut trainieren.

Man muss mit Brachialgewalt eine Auswahl von Merkmalen treffen, um gute auszuwählen, und dann darüber nachdenken, warum sie funktionieren. Dann wird klar, was man als nächstes tun muss. Bruteforce selbst ist für die TK-Vorbereitung uneffektiv, es sollte als Sondierungsmethode betrachtet werden.
 
Maxim Dmitrievsky #:
Es ist notwendig, aus Hunderttausenden von Merkmalen funktionierende Merkmale zu finden und dann zu verstehen, warum sie funktionieren. Und dann muss man verschiedene TCs für sie schreiben, nicht durch Bruteforcing, sondern durch die Auswahl optimaler Hyperparameter.
Andernfalls wird es sich immer noch als passend herausstellen, wenn man aus Hunderten von Modellen für die Prüfung auswählen muss.
Das Wichtigste ist, zu verstehen, warum die Merkmale funktionieren, zumindest ungefähr. Dann können sie verbessert werden, oder man kann sie beschriften.

Es ist auch keine gute Idee, einen Haufen unklarer Modelle zu stapeln. Denn dann müssen Sie einen Haufen unbekannter Dinge erneut trainieren.

Man muss mit Brachialgewalt eine Auswahl von Merkmalen treffen, um gute auszuwählen, und dann darüber nachdenken, warum sie funktionieren. Dann wird klar, was man als nächstes tun muss. Bruteforce selbst ist uneffektiv für die TC-Vorbereitung, man sollte es als Sondierungsmethode betrachten.
Ich stimme zu. Das Verständnis des Prozesses kann aus verschiedenen Blickwinkeln erreicht werden)
 
Maxim Dmitrievsky #:
Es ist notwendig, aus Hunderttausenden von Merkmalen funktionierende Merkmale zu finden und dann zu verstehen, warum sie funktionieren. Und dann muss man verschiedene TCs für sie schreiben, nicht durch Brute-Forcing, sondern durch die Auswahl optimaler Hyperparameter.
Andernfalls wird es sich immer noch als passend herausstellen, wenn man aus Hunderten von Modellen für die Prüfung auswählt.
Das Wichtigste ist, dass man versteht, warum die Merkmale funktionieren, zumindest ungefähr. Dann können sie verbessert werden, oder die Bezeichnungen für sie können verbessert werden.

Es ist auch keine gute Idee, einen Haufen obskurer Modelle zu packen. Denn dann muss man einen Haufen unbekannter Dinge wieder neu trainieren.

Man muss mit Bruteforce und Feature Selection die guten auswählen und dann darüber nachdenken, warum sie funktionieren. Dann wird klar, wohin man als nächstes gehen muss. Bruteforce selbst ist für die TK-Vorbereitung uneffektiv, man sollte es als Sondierungsmethode betrachten.

Der Punkt ist, dass die Aufgabe, den Grund für die Effizienz der Prädiktoren zu verstehen, extrem schwierig ist und im Bereich der Interpretation des Marktverhaltens liegt, oder haben Sie einen zuverlässigeren Ansatz? Außerdem funktionieren Prädiktoren in einer Gruppe, weil sie primitiv sind, und wie man Prädiktoren, die in einer Gruppe funktionieren, zusammenstellt, ist keine einfache Frage, wenn sie denn auftaucht - die naheliegendste ist bisher die Verwendung eines Entscheidungsbaums. Und um wirksame Entscheidungsbäume zu erstellen, muss man die Stichprobe erheblich reduzieren und am besten nur die Prädiktoren einspeisen, die vermutlich eine wirksame Beziehung bilden. Und hier kann die Methode der Modellsuche sehr nützlich sein, da das Modell in der Regel nur einen Teil der Prädiktoren verwendet.

Anpassen oder nicht - ich denke, alle Maßnahmen zur Wahrscheinlichkeitsanpassung sind passend. Eine andere Sache ist, dass die Geschichte der Verteilung dieser Wahrscheinlichkeiten über die Prädiktoren wiederholt werden kann, oder sie kann für einen langen Zeitraum vergessen werden. Und hier ist es wichtig, eine Methode zu haben, um den Übergang dieser Phasen zu bestimmen.

 
Aleksey Vyazmikin #:

DasTraining von CatBoost mit den untenstehenden Einstellungen - mit Seed brute force - ergibt diese Wahrscheinlichkeitsverteilung.

1. Sampling Zug

2. Auswahl des Tests

3. Prüfungsbeispiel

Wie Sie sehen können, zieht es das Modell vor, fast alles mit Null zu klassifizieren - so ist die Chance, einen Fehler zu machen, geringer.

Alexey, Training ist im Wesentlichen Anpassung, nicht wahr?

 
Renat Akhtyamov #:

Alexej, die Ausbildung ist im Wesentlichen eine Anprobe, nicht wahr?

Im Wesentlichen, ja.

Bei der Optimierung in einem Prüfgerät geht es darum, die Metriken zu ändern, auf denen der Algorithmus arbeitet, und beim Lernen in MO-Methoden (Bäume und ihre Varianten, NS) geht es darum, den Algorithmus durch Auswertung und Interpretation der Geschichte der Metriken zu ändern.

Symbiose, wäre epic.....

 
Renat Akhtyamov #:

Alexej, die Ausbildung ist im Wesentlichen eine Anprobe, nicht wahr?

Das Unterrichten von Schulkindern ist auch ein Anpassen ihres Wissens an das vorhandene Wissen.)

 
Aleksey Vyazmikin #:

Das ist der Punkt, die Aufgabe, den Grund für die Leistung der Prädiktoren zu verstehen, ist extrem schwierig und liegt im Bereich der Interpretation des Marktverhaltens, oder haben Sie einen robusteren Ansatz? Außerdem funktionieren Prädiktoren in einer Gruppe, weil sie primitiv sind, und wie man Prädiktoren zusammenstellt, die in einer Gruppe funktionieren, ist keine einfache Frage, wenn sie überhaupt auftaucht - das Naheliegendste ist bisher die Verwendung eines Entscheidungsbaums. Und um effektive Entscheidungsbäume zu erstellen, muss man die Stichprobe deutlich reduzieren und am besten nur die Prädiktoren einspeisen, die vermutlich eine effektive Beziehung bilden. Und hier kann die Methode der Modellsuche sehr nützlich sein, da das Modell in der Regel nur einen Teil der Prädiktoren verwendet.

Anpassen oder nicht - ich denke, alle Maßnahmen zur Wahrscheinlichkeitsanpassung sind passend. Eine andere Sache ist, dass die Geschichte der Verteilung dieser Wahrscheinlichkeiten über die Prädiktoren wiederholt werden kann, oder sie kann für einen langen Zeitraum vergessen werden. Und hier ist es wichtig, eine Methode zu haben, um den Übergang dieser Phasen zu bestimmen.

kleine Gruppen von 5 bis 10 Personen zu trainieren.

1-3 sind besser.

Wenn keine von ihnen etwas hervorbringt, was bringt es dann, über eine mythische Verbindung zwischen ihnen zu reden? Unsinn + Unsinn...

Grund der Beschwerde: