Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3107

 
Maxim Dmitrievsky #:

Un regalo con la esperanza de una revisión

 
Aleksey Vyazmikin #:

¿Qué método de agrupación es el más adecuado para agrupar estos objetos?

Básicamente hay una matriz, y es importante evaluar su similitud en conjunto. Y por alguna razón, K-means, creo, promediará todo mucho.

Chat-GPT:

"

Si las matrices son descripciones de un objeto tridimensional, entonces se pueden utilizar métodos de agrupación que tengan en cuenta la estructura de los datos tridimensionales para agruparlas. He aquí algunos enfoques que pueden resultar útiles:

  1. Método de clustering basado en la densidad: DBSCAN (Density-Based Spatial Clustering of Applications with Noise) es una buena opción porque tiene en cuenta la densidad de los datos. Puede aplicar DBSCAN a matrices tridimensionales utilizando medidas de proximidad o distancias entre puntos en el espacio tridimensional. Este método puede ayudarle a identificar los clusters que forman regiones compactas y densas en el espacio tridimensional.

  2. Agrupación espectral: El método de agrupación espectral puede ser útil para agrupar matrices tridimensionales. Puede aplicar una transformación espectral a los datos tridimensionales y, a continuación, utilizar métodos de clustering (por ejemplo, k-means) para separarlos en clusters. Este enfoque permite tener en cuenta la estructura de los datos e identificar grupos similares en el espacio tridimensional.

  3. Clustering jerárquico: El clustering jerárquico puede aplicarse a matrices tridimensionales para construir una estructura jerárquica de clusters. Puede utilizar medidas de similitud o distancia entre matrices y fusionar o separar clusters basándose en estas medidas. Este enfoque le ayudará a explorar las relaciones jerárquicas entre grupos de matrices tridimensionales.

También es importante tener en cuenta las características de su conjunto de datos en particular y elegir el método de agrupación que mejor se adapte a sus objetivos y requisitos. Experimente con diferentes métodos y parámetros para encontrar el enfoque más adecuado para su tarea.

"

 
Aleksey Vyazmikin #:

Chat-GPT:

Yo mismo pensé en hacer una convolución de la matriz sobre 5 puntos, mediante el promedio de puntos vecinos, y sobre ellos ya buscar la similitud por algún método.

 
Aleksey Vyazmikin #:

Y por alguna razón, K-means va a promediar mucho las cosas.

Aleksey Vyazmikin #:

Yo estaba pensando en la convolución de la matriz por 5 puntos, a través del promedio de los puntos vecinos, y su uso para buscar la similitud por algún método.

...

la petaca silba ))

 
mytarmailS #:

...

la petaca silba).

Fuerte - un centroide. y yo estaba pensando en realidad varios con coordenadas fijas..... Sin embargo, ¿con quién estoy hablando - un amante de las soluciones off-the-shelf.....

 
СанСаныч Фоменко #:

Un regalo con la esperanza de una revisión

Excelente, gracias. El contenido es más o menos el mismo que el de los otros libros. Mira las secciones 9-10, y luego ese primer artículo-trabajo sobre crossfit, entenderás qué y por qué se enseña crossfit.
Lo leeré completo más tarde.

 
Aleksey Vyazmikin #:

¿Qué método de agrupación es el más adecuado para agrupar estos objetos?

Básicamente hay una matriz, y es importante evaluar su similitud en conjunto. Y por alguna razón, K-means parece que promediaría mucho las cosas.

https://habr.com/ru/companies/jetinfosystems/articles/467745/
 
Maxim Dmitrievsky #:
h ttps:// habr.com/ru/companies/jetinfosystems/articles/467745/

No he visto la respuesta a la pregunta en el enlace.

 
Aleksey Vyazmikin #:

No he visto ninguna pregunta respondida en el enlace.

Una pregunta bien formulada suele tener respuesta. Al parecer, aún no se ha formulado una pregunta de este tipo.

Quizá deberías preguntarte qué es la similitud en su conjunto y qué tiene que ver la agrupación con ella.

Si necesitas estimar la densidad de probabilidad de una distribución (estoy tratando de adivinar a partir de la pregunta inarticulada), entonces se trata de la estimación de la densidad del núcleo.
 
Maxim Dmitrievsky #:
Una pregunta correctamente formulada suele contener ya una respuesta. Al parecer, aún no se ha formulado una pregunta de este tipo.

Tal vez debería preguntarse qué es la similitud en su conjunto y qué tiene que ver la agrupación con ella.

Si necesitas estimar la densidad de la distribución (estoy tratando de adivinar a partir de la pregunta inexplícita), entonces se trata de la estimación de la densidad del núcleo.

Si sinceramente quieres ayudar, te cargaré con los detalles del problema.

Entonces, tenemos una fórmula condicional

P=A/(A+B)*100-x.

Donde, A y B son números enteros, digamos de 1 a 1000.

x es algún coeficiente, incluso dejemos que tenga un valor fijo por simplicidad, y se puede quitar en la mente.

Hay una muestra, digamos 500 filas.

Para cada fila calculamos el valor de P. Dividimos los resultados en rangos por uno u otro método, y como resultado tenemos una distribución empírica.

Sin embargo, la propia fórmula da valores comparables a diferentes valores de A y B, lo cual es lógico, porque en esencia contamos el porcentaje de la población, por lo que es importante que haga una corrección para el número A, y para ello se hace otro espacio, donde se especifica el valor de A en la fórmula, y también se construye el diagrama empírico.

Esto produce un diagrama 3d, que se puede escribir como una matriz.

Tengo unas 10 mil matrices de este tipo, y quiero agruparlas por similitud.

Así que necesito un método de agrupación que las reúna en grupos. Por supuesto, me gustaría que fueran similares no sólo por puntos individuales, sino también por distribuciones.

Por ejemplo, podemos comparar las distribuciones de cada capa (partición por el número A) y luego calcular el porcentaje de distribuciones similares. Pero, tal vez haya una buena solución preparada.

¿He descrito claramente la esencia del problema?