Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3375

 
Maxim Kuznetsov #:

Diskrete Daten, die in Form einer Tabelle dargestellt werden.

Nicht zu ?

Dann bin ich direkt verloren...was sind tabellarische/nicht-tabellarische Daten..... tabellarisch ist eine lineare Metrik und Abhängigkeit von Y allein von X? dann ja, das geht gar nicht, solche Biester gibt es in der Natur nicht.

Tabellarische Daten sind heterogen, wie eine Liste von Mitarbeitern. Dort sind Geschlecht, Alter, Gehalt usw. aufgeführt. Mehrere Zeilen in tabellarischen Daten sind in der Regel nicht miteinander verbunden, zum Beispiel, wenn Sie mehrere Arbeiter zusammenzählen, dann wird Optimus Prime nicht funktionieren. Wenn Sie aber mehrere Pixel zusammenzählen, erhalten Sie Optimus Prime.
 
In unserem Fall handelt es sich bei den Originaldaten um Zeitreihen, nicht um Tabellen. Wenn wir keine Nachrichtenanalyse verwenden; wenn doch, dann verwenden wir Tabellen.

Im ersten Fall sind also sowohl NS als auch Bousting geeignet, vielleicht ist NS besser, das hängt von der Datendarstellung ab. Im zweiten Fall ist Bousting besser.

Wir haben also gelernt, zwischen der ursprünglichen Datendarstellung und ihrer Darstellung nach der Verarbeitung zu unterscheiden.
 
Aleksey Nikolayev #:
Wenn sie in eine Tabelle, aber nicht in eine Matrix geschrieben werden können)
Nun, NSs funktionieren besser bei homogenen Daten. Tabellarische Daten können in eine Matrix geschrieben werden, wenn sie vom gleichen Typ sind.
 
Für tabellarische Daten gibt es eine neuronale TabNet-Architektur

Sie wird als Konkurrent zu Boosts positioniert.
Ich habe es ausprobiert, es funktioniert gut, es gibt keinen Skam...
 
Es gibt solche Netze, ja. Aber unser Thema erfordert Netzwerke für die Arbeit mit Sequenzen und nicht mit Tabellen. Denn sie sind von Anfang an Sequenzen.
 
Maxim Dmitrievsky #:
Es gibt solche Netze, ja. Aber unser Thema erfordert Netzwerke für die Arbeit mit Sequenzen und nicht mit Tabellen. Denn sie sind von Anfang an Sequenzen.

Ich bin in einer gewissen Stimmung.

Können Sie beweisen, dass es Sequenzen sind? Abgesehen davon, dass es Sequenzen sind.

 
Tabellarische Daten, wie ich sie aus diesem Hinweis verstehe

Es handelt sich um so genannte "aufgeräumte Daten", d.h. "tidy data".

Es handelt sich um eine Tabelle, bei der jede Zeile eine Beobachtung und die Spalte ein Merkmal ist.

 
Maxim Dmitrievsky #:
topics brauchen mehr Netzwerke, die mit Sequenzen statt mit Tabellen arbeiten.
Ich verstehe das nicht, können Sequenzen nicht im Tabellenformat sein?
 
Maxim Dmitrievsky #:
Es gibt solche Netze, ja. Aber unser Thema erfordert Netzwerke für die Arbeit mit Sequenzen und nicht mit Tabellen. Denn sie sind von Anfang an Sequenzen.

Die erste Option, Tabellen - Excel-Tabellen, jede Zeile hat eine Zeitmarkierung. Das ist die bekannteste Form von Finanzdaten.

Zweite Möglichkeit: handgeschriebene Briefe. Lernen mit einem Lehrer, mit einem gedruckten Brief als Lehrer und einer Spalte darunter mit handgeschriebenen Varianten dieses Briefes.

Vergleich von Bousting und NS. Was ist besser geeignet und für welchen Fall? Oder ist es gleichwertig?

PS.

Von Rattle, das rpart (einfacher Baum), rf, ada, SVM, glm, nnet (wahrscheinlich der einfachste NS) hat. Das schlechteste Ergebnis hat rpart, das zweitschlechteste ist nnet, die anderen vier sind ungefähr gleich gut, abhängig von den Eingabedaten.

 
Maxim Kuznetsov #:

Ich bin in so einer Stimmung.

Können Sie beweisen, dass es Sequenzen sind? Abgesehen davon, dass es Sequenzen sind.

Zeitserien sind genauer. Ich habe den Eindruck, dass Sie zuerst eine Alternative anbieten müssen. Sonst ist es entweder etwas oder nichts.