Diskussion zum Artikel "MQL5-Assistent-Techniken, die Sie kennen sollten (Teil 16): Hauptkomponentenanalyse mit Eigenvektoren"

 

Neuer Artikel MQL5-Assistent-Techniken, die Sie kennen sollten (Teil 16): Hauptkomponentenanalyse mit Eigenvektoren :

Die Hauptkomponentenanalyse, ein Verfahren zur Verringerung der Dimensionalität in der Datenanalyse, wird in diesem Artikel untersucht, und es wird gezeigt, wie sie mit Eigenwerten und Vektoren umgesetzt werden kann. Wie immer streben wir die Entwicklung eines Prototyps einer Experten-Signal-Klasse an, die im MQL5-Assistenten verwendet werden kann.

SVD kann die Dimensionalität reduzieren, indem ein Matrixdatensatz in drei separate Matrizen aufgeteilt wird, wobei eine dieser drei, die Σ-Matrix, die wichtigsten Varianzrichtungen in den Daten identifiziert. Diese Matrix, die auch als Diagonalmatrix bezeichnet wird, enthält die Singulärwerte, die die Größen der Varianz entlang jeder vorher festgelegten Richtung darstellen (die in einer anderen der 3 Matrizen, die oft als U bezeichnet wird, aufgezeichnet werden). Je größer der Singulärwert ist, desto signifikanter ist die entsprechende Richtung bei der Erklärung der Variabilität der Daten. Dies führt dazu, dass die U-Spalte mit dem höchsten Singulärwert als repräsentativ für die gesamte Matrix ausgewählt wird, was zu einer Reduzierung der Dimensionen führt. Von einer Matrix zu einem einzelnen Vektor.

Umgekehrt verfeinert die Potenzmethode iterativ eine Vektorschätzung, um gegen den dominanten Eigenvektor zu konvergieren. Dieser Eigenvektor erfasst die Richtung mit der größten Variation in den Daten und entspricht einer reduzierten Dimension der ursprünglichen Matrix.

Mit Eigenvektoren und -werten, auf die wir uns in diesem Artikel konzentrieren, können wir jedoch eine n x n-Matrix in n mögliche n große Vektoren zerlegen, wobei jedem dieser Vektoren ein Eigenwert zugewiesen wird. Dieser Eigenwert dient dann als Grundlage für die Auswahl des einen Eigenvektors, der die Matrix am besten repräsentiert, wobei wiederum ein höherer Wert eine höhere positive Korrelation bei der Erklärung der Datenvariabilität anzeigt.

Autor: Stephen Njuki