Discusión sobre el artículo "Características del Wizard MQL5 que debe conocer (Parte 13): DBSCAN para la clase experta de señales"

 

Artículo publicado Características del Wizard MQL5 que debe conocer (Parte 13): DBSCAN para la clase experta de señales:

El agrupamiento basado en densidad para aplicaciones con ruido (DBSCAN) es una forma no supervisada de agrupar datos que apenas requiere parámetros de entrada, salvo solo 2, lo cual, en comparación con otros enfoques como k-means, es una ventaja. Profundizamos en cómo esto podría ser constructivo para probar y eventualmente operar con Asesores Expertos montados por Wizard MQL5.

Esta serie de artículos sobre el Wizard MQL5 es una introducción a cómo las ideas abstractas en matemáticas u otros campos de la vida pueden cobrar vida como sistemas de trading y ser probadas o validadas antes de realizar cualquier compromiso serio basado en ellas. Esta capacidad de tomar ideas simples y no del todo implementadas o previstas y explorar su potencial como sistemas de trading es una de las joyas que presenta el conjunto de asistentes Wizard MQL5 para asesores expertos. Las clases expertas del asistente proporcionan muchas de las características mundanas requeridas por cualquier asesor experto, especialmente en lo que se refiere a la apertura y cierre de operaciones, pero también en aspectos pasados por alto como la ejecución de decisiones sólo en una nueva formación de barras.

Así pues, al mantener esta librería de procesos como un aspecto independiente de un asesor experto, con Wizard MQL5 cualquier idea no sólo puede probarse de forma independiente, sino que también puede compararse en cierto modo en pie de igualdad con cualquier otra idea (o método) que pudiera estar considerándose. En esta serie, hemos examinado métodos alternativos de agrupamiento, como el agrupamiento aglomerativo y el agrupamiento k-means.

En cada uno de estos enfoques, antes de generar los conglomerados respectivos, uno de los parámetros de entrada requeridos era el número de conglomerados que debían crearse. Esto supone, en esencia, que el usuario conoce bien el conjunto de datos y no está explorando o mirando un conjunto de datos desconocido. Con Density Based Spatial Clustering for Applications with Noise (DBSCAN) el número de clusters a formar es una incógnita «respetada». Esto ofrece más flexibilidad no sólo para explorar conjuntos de datos desconocidos y descubrir sus principales rasgos de clasificación, sino que también puede permitir comprobar los «sesgos» existentes o las opiniones más extendidas sobre cualquier conjunto de datos para saber si el número de conglomerados asumido puede verificarse.

Tomando sólo dos parámetros, a saber, épsilon, que es la distancia espacial máxima entre los puntos de un conglomerado, y el número de puntos mínimos necesarios para constituir un conglomerado, DBSCAN es capaz no sólo de generar conglomerados a partir de los datos muestreados, sino también de determinar el número adecuado de estos conglomerados. Para apreciar sus notables proezas, puede resultar útil examinar algunos agrupamientos que puede realizar frente a enfoques alternativos.

Según este artículo público en Medium, DBSCAN y k-means clustering darían, por su definición, estos resultados de clustering separados. 

Para la agrupación k-means tendríamos:


Mientras que DBSCAN daría:

Autor: Stephen Njuki