Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2729

 
Aleksey Nikolayev #:

Die Bedeutung liegt nicht in den Kriterien, sondern in der Art und Weise, wie sie verwendet werden. Die Art und Weise, wie Sie sie verwenden, ist überhaupt nicht klar - was Sie womit vergleichen und zu welchem Zweck).

Okay, da du schlau bist, bist du nicht bereit, in diese Richtung zu denken. Ich werde mir nicht die Mühe machen.

 
Aleksey Vyazmikin #:

Okay, wenn Sie schlau sind, dann wollen Sie nicht in diese Richtung denken. Ich werde mir nicht die Mühe machen.

Alexej, lernen Sie, Ihre Gedanken zu formulieren, wenn Sie wirklich verstanden werden wollen ...

 
mytarmailS #:

Alexej, lernen Sie, Ihre Gedanken zu formulieren, wenn Sie verstanden werden wollen.

Und wo haben Sie meinen Gedankengang verloren?

Meine Gedanken sind formuliert - ich verstehe, wovon ich spreche, wenn es jemand nicht versteht - fragen Sie. Vielleicht müssen Sie lernen, das Wesentliche besser zu verstehen, ohne sich an Begriffe zu klammern....

 
Aleksey Vyazmikin #:

Okay, wenn Sie schlau sind, dann wollen Sie nicht in diese Richtung denken. Ich werde mir nicht die Mühe machen.

Entweder können Sie keine Idee formulieren oder Sie wollen sie nicht teilen. In beiden Fällen hat es keinen Sinn, das Thema weiter zu vertiefen, und wir sollten darauf verzichten, persönlich zu werden.

 
Aleksey Vyazmikin #:

Glauben Sie, dass das Kriterium keinen Sinn macht? Nehmen Sie zehn Proben unterschiedlicher Größe und vergleichen Sie sie - wählen Sie diejenige mit den besten Ergebnissen bei mehreren Indikatoren, die für die Ähnlichkeit/Unähnlichkeit/Homogenität der Proben verantwortlich sind.

Wir nehmen und mischen die Stichproben, wir erhalten unterschiedliche Werte... wir erhalten traurige

* mischen sie untereinander. Da niemand es verbietet, da es sich nicht um ein sequentielles Modell handelt, das trainiert wird, spielt die Reihenfolge der Proben keine Rolle. Es geht nur um den Klassifizierungsfehler, der durch Mischen immer reduziert werden kann.

Um nach etwas zu suchen, muss man sehr genau wissen, wonach man sucht, sonst spielt man so lange mit Proben, bis man verblüfft ist. Nun, niemand weiß, wonach gesucht wird, wenn es jemand herausfindet, lasst es mich wissen.
 
Es gibt einen weiteren Trick. Je uninformativer die Merkmale sind, desto kleiner sollte die Trainingsstichprobe sein.

Je informativer die Merkmale sind und je weniger es von ihnen gibt, desto größer kann/sollte die Stichprobe sein. Und fast jeder denkt das Gegenteil.
 
Aleksey Nikolayev #:

Entweder können Sie keine Idee formulieren oder Sie wollen sie nicht teilen. In beiden Fällen hat es keinen Sinn, das Thema weiterzuentwickeln, und wir sollten darauf verzichten, persönlich zu werden.

Habe ich nicht geschrieben, dass es darum geht, Stichproben (Ausbildung und Bewerbung) zu vergleichen, dass, wenn Ihre Theorie richtig ist, die Stichprobe mit zunehmender Größe aufhört, ähnlich zu sein, und dass man, um das zu verstehen, Kriterien für die Bewertung ihrer Veränderung braucht, die von den Methoden zur Bewertung der Ähnlichkeit abgeleitet sind?

Außerdem habe ich davon gesprochen, die gesamte Stichprobe nach bestimmten vergleichbaren Tendenzmerkmalen in Gruppen einzuteilen und innerhalb dieser Gruppen eine Rangfolge zu erstellen. Und eine solche Einteilung kann wiederum anhand von Kriterien der "Ähnlichkeit" von Stichproben vorgenommen werden.

Ich werde nicht persönlich - ich sehe den Stil der Antwort, und ich bin nur verwundert - was machen die Leute hier - wollen sie ihre Einzigartigkeit zeigen? Ich bin daran interessiert, Wege zur Lösung des Problems zu finden, ich bin daran interessiert, das Wissen anderer Leute zu nutzen und mein eigenes zu teilen.

 
Maxim Dmitrievsky #:
Proben nehmen und mischen, verschiedene Schätzungen erhalten... traurig

* sie untereinander mischen. Da niemand es verbietet, da es sich nicht um ein sequentielles Modell handelt, das trainiert wird, spielt die Reihenfolge der Proben keine Rolle. Es geht nur um den Klassifizierungsfehler, der durch Mischen immer reduziert werden kann.

Um nach etwas zu suchen, muss man sehr genau wissen, wonach man sucht, sonst spielt man so lange mit Proben, bis man verblüfft ist. Nun, niemand weiß, wonach gesucht wird, also wenn es jemand herausfindet, lasst es mich wissen.

Man kann nur innerhalb eines Samples mischen, wenn man zwei Samples mischt, bedeutet das, dass man leugnet, dass sich der Markt verändert.

 
Maxim Dmitrievsky #:
Proben nehmen und mischen, verschiedene Schätzungen erhalten... traurig

* sie untereinander mischen. Da niemand es verbietet, da es sich nicht um ein sequentielles Modell handelt, das trainiert wird, spielt die Reihenfolge der Proben keine Rolle. Es geht nur um den Klassifizierungsfehler, der durch Mischen immer reduziert werden kann.

Um nach etwas zu suchen, muss man sehr genau wissen, wonach man sucht, sonst spielt man so lange mit Proben, bis man verblüfft ist. Nun, niemand weiß, wonach gesucht wird, also wenn es jemand herausfindet, lasst es mich wissen.

Mir gefällt nicht wirklich, was Sie und Alexey in Ihrer Argumentation gemeinsam haben - Sie haben sie im Zusammenhang mit einem bestimmten Modell und der Untersuchung seines Verhaltens, wenn sich die Trainingsstichprobe ändert. Im Idealfall möchte ich bei der Auswahl der Trainingsstichprobe unabhängig von einem bestimmten Modell sein - deshalb habe ich mich vorerst für die Verwendung von Zickzack-Ecken entschieden. Aber wahrscheinlich haben Sie beide Recht, und eine vollständige Unabhängigkeit vom Typ des TC ist kaum möglich.

 
Aleksey Vyazmikin #:

Hatte ich nicht geschrieben, dass die Idee beim Vergleich von Stichproben (Ausbildung und Anwendung) darin besteht, dass, wenn Ihre Theorie richtig ist, die Stichprobe aufhört, ähnlich zu sein, wenn sie größer wird, und dass Sie, um dies zu realisieren, Kriterien für die Bewertung ihrer Veränderung brauchen, die von Methoden zur Bewertung der Ähnlichkeit abgeleitet sind?

Hier sprechen Sie offenbar von multivariaten Stichproben (jedes Element ist eine Zeile einer Tabelle, ein Vektor), während die Homogenitätskriterien in Ihren drei Links sich auf numerische Stichproben beziehen. Multivariate Homogenitätskriterien in Matstat sind ein eigenes Lied und für mich nicht ganz klar.

Aleksey Vyazmikin #:

Außerdem ging es mir darum, die gesamte Stichprobe nach einem vergleichbaren Tendenzmerkmal in Abschnitte zu unterteilen und innerhalb dieser Gruppen ein Ranking zu erstellen. Und ein solches Ranking kann wiederum nach dem Kriterium der "Ähnlichkeit" von Samples vorgenommen werden.

Es ist ähnlich wie bei der Suche nach vielen Änderungspunkten. Auch hier stellt sich heraus, dass wir mit einem mehrdimensionalen (Vektor-)Fall arbeiten müssen, was die Sache sehr verkompliziert.

Nun, und generell gefällt mir die Abhängigkeit von den für die Untersuchung gewählten Attributen nicht. Wenn wir verschiedene Sätze von ihnen nehmen, können die Ergebnisse unterschiedlich ausfallen.