Diskussion zum Artikel "MQL5-Assistenten-Techniken, die Sie kennen sollten (Teil 13): DBSCAN für eine Klasse für Expertensignale"

 

Neuer Artikel MQL5-Assistenten-Techniken, die Sie kennen sollten (Teil 13): DBSCAN für eine Klasse für Expertensignale :

Density Based Spatial Clustering for Applications with Noise (DBSCAN) ist eine unüberwachte Form der Datengruppierung, die kaum Eingabeparameter benötigt, außer 2, was im Vergleich zu anderen Ansätzen wie K-Means ein Segen ist. Wir gehen der Frage nach, wie dies für das Testen und schließlich den Handel mit den von Wizard zusammengestellten Expert Advisers konstruktiv sein kann.

Diese Artikelserie über den MQL5-Assistenten zeigt, wie oft abstrakte Ideen in der Mathematik oder in anderen Bereichen des Lebens als Handelssysteme belebt und getestet oder validiert werden können, bevor man sich ernsthaft auf sie einlässt. Diese Fähigkeit, einfache und noch nicht vollständig umgesetzte oder geplante Ideen aufzugreifen und ihr Potenzial als Handelssysteme zu erforschen, ist eines der Juwelen, die die MQL5-Assistentengruppe für Expertenberater bietet. Die Expertenklassen des Assistenten bieten viele der alltäglichen Funktionen, die von einem Expertenberater benötigt werden, insbesondere in Bezug auf das Eröffnen und Schließen von Handelsgeschäften, aber auch in übersehenen Aspekten wie der Ausführung von Entscheidungen nur bei einer neuen Balkenformation.

Indem diese Bibliothek von Prozessen als separater Aspekt eines Expertenberaters beibehalten wird, kann mit dem MQL5-Assistenten jede Idee nicht nur unabhängig getestet, sondern auch mit allen anderen Ideen (oder Methoden), die in Betracht gezogen werden könnten, auf einer einigermaßen gleichen Basis verglichen werden. In diesen Serien haben wir uns mit alternativen Clustermethoden wie dem agglomerativen Clustering und dem K-Means Clustering beschäftigt.

Bei jedem dieser Ansätze war einer der erforderlichen Eingabeparameter vor der Generierung der jeweiligen Cluster die Anzahl der zu erstellenden Cluster. Dabei wird im Wesentlichen davon ausgegangen, dass der Nutzer mit dem Datensatz gut vertraut ist und keinen unbekannten Datensatz erforscht oder betrachtet. Bei DBSCAN, Based Spatial Clustering for Applications with Noise ist die Anzahl der zu bildenden Cluster eine „respektierte“ Unbekannte. Dies bietet nicht nur mehr Flexibilität bei der Erkundung unbekannter Datensätze und der Entdeckung ihrer wichtigsten Klassifizierungsmerkmale, sondern ermöglicht auch die Überprüfung bestehender „Vorurteile“ oder allgemeiner Ansichten über einen bestimmten Datensatz daraufhin, ob die angenommene Anzahl von Clustern verifiziert werden kann.

Mit nur zwei Parametern, nämlich epsilon, dem maximalen räumlichen Abstand zwischen den Punkten in einem Cluster, und der Anzahl der Mindestpunkte, die zur Bildung eines Clusters erforderlich sind, ist DBSCAN in der Lage, aus den gesampelten Daten nicht nur Cluster zu erzeugen, sondern auch die angemessene Anzahl dieser Cluster zu bestimmen. Um seine bemerkenswerten Leistungen zu würdigen, kann es hilfreich sein, sich einige Clusterungen anzusehen, die es im Gegensatz zu alternativen Ansätzen durchführen kann.

Laut diesem Artikel würden DBSCAN und K-Means Clustering ihrer Definition nach diese unterschiedlichen Clustering-Ergebnisse liefern. 

Für K-Means Clustering würde dies ermitteln:


während DBSCAN dies ergeben würde:

Autor: Stephen Njuki