Algoritmo para combinar rangos de un segmento - ayuda para crear - página 5

 


)

 
Dmitry Fedoseev:

1. Completamente incomprensible y ya algo completamente diferente.

¿Cuál es la tarea en general? ¿Cuál es el objetivo práctico? Tal vez se resuelva de forma totalmente diferente.

Si te interesa, déjame que te lo cuente con más detalle. En el algoritmo de aprendizaje automático CatBoost, la enumeración de los valores del conjunto de una variable (predictor) obtenidos a partir de las observaciones (matriz) para establecer la división se resuelve mediante la construcción de una rejilla previa (cuantificación), de modo que los números se dividen en intervalos (períodos/rangos) y la enumeración de los valores no se produce en todos los números, sino sólo en estos intervalos. Existen diferentes métodos incorporados para la construcción de rejillas, incluyendo aquellas con diferente número de límites deseados. Visualmente, una variante de la rejilla tiene el aspecto de la figura siguiente, en la que cada 100 valores de la matriz se incrementa el valor en la escala y en uno, lo que muestra la repetibilidad de los valores.

La tarea consiste en construir una cuadrícula más favorable para el aprendizaje, es decir, una cuadrícula en la que la información entre los intervalos (en el segmento) pertenezca más a uno de los objetivos (0/1), manteniendo la coherencia de la dependencia y la suficiencia de las observaciones.

Ahora obtengo diferentes mallas, selecciono sus intervalos según unos criterios dados (que escribí antes), y necesito combinar los intervalos seleccionados entre sí para combinarlos en una sola malla.

 
Aleksey Nikolayev:


)

Si puedo ayudar, ayudo, y si no, no dudo en pedir ayuda.

Además, los problemas han sido raros por aquí últimamente, y pensé que la gente estaría interesada en participar en su solución.

 
Aleksey Vyazmikin:

///

Ahora obtengo diferentes mallas, selecciono sus segmentos según unos criterios dados (que escribí antes), y necesito combinar los segmentos seleccionados entre sí para combinarlos en una malla.

A eso se refería la pregunta. ¿Cómo quieres hacerlo?

 
Dmitry Fedoseev:

A eso se refería la pregunta. ¿Cómo quieres hacerlo?

Hmmm... así que el script que escribiste puede hacer casi todo el trabajo. ¿Alguna otra opción? Sugerí la opción de reducir el número de combinaciones.


Todavía estoy considerando esta opción :)

Почему амеба справилась с вычислениями лучше современного компьютера
Почему амеба справилась с вычислениями лучше современного компьютера
  • www.popmech.ru
В 2018 году группа исследователей из токийского университета Кейо решила использовать амебу для решения так называемой «задачи коммивояжера», известной в области компьютерных наук проблемы. Суть ее такова: представьте, что вы – путешествующий от города к городу...
 
Aleksey Vyazmikin:

Hmmm... así que el script que escribiste puede hacer casi todo el trabajo. ¿Hay otras opciones? Sugerí la opción de reducir el número de combinaciones.


Todavía estoy considerando esta opción :)

Tal vez cuando hay pocos segmentos. Y cuando hay muchos, ¿cómo debe ser?

¿En qué sentido sugirió la opción de reducir el número de combinaciones? No todas las combinaciones son suficientes, ¿o hay un criterio?

 
Dmitry Fedoseev:

Tal vez cuando hay pocas secciones. Y cuando hay muchos, ¿cómo debe ser?

¿En qué sentido ha sugerido la opción de reducir el número de combinaciones? No todas las combinaciones son suficientes, ¿o hay un criterio?

Cuando hay muchos, hay que pensar...

Como opción propongo empezar con cada segmento de la misma manera, pero limitando el número de combinaciones desde cada punto.

Aquí la figura muestra los segmentos en forma de círculo y su evaluación en forma de longitud de flecha, en la figura sólo se seleccionan las dos flechas más cortas, los restantes "caminos" se cortan (se excluyen). En la forma de estas flechas (gráficos en esencia) puede haber un coeficiente de evaluación (indicador).


De esta manera, supongo, no seleccionaremos las peores opciones, a la vez que reducimos el coste del cálculo.
 
Aleksey Vyazmikin:

Cuando hay muchos, hay que pensar...

Como opción propongo empezar con cada segmento de la misma manera, pero limitando el número de combinaciones desde cada punto.

La figura muestra los segmentos en forma de círculo y su evaluación en forma de longitud de flecha, sólo las dos flechas más cortas se seleccionan en la figura, los otros "caminos" se cortan (se excluyen). En la forma de estas flechas (gráficos en esencia) puede haber un coeficiente de evaluación (indicador).


De este modo, supongo que no seleccionaremos las peores opciones, al tiempo que reducimos el coste computacional.
Esto es para la situación en la que hay proporciones aproximadamente iguales de cortos largos y no hay áreas con sólo segmentos largos o cortos.
 
Valeriy Yastremskiy:
Esto es para la situación en la que hay proporciones aproximadamente iguales de trayectorias largas y cortas que salen del punto y no hay áreas con sólo trayectorias largas o cortas.

¿Qué diferencia hay entre que los caminos sean largos o cortos, o es una cuestión de estimación (la longitud de la flecha en la analogía de la figura)?

Tenemos el deseo de pisar los dos mejores caminos en el ejemplo, si hay menos entonces hay un camino.

Por favor, explique por qué esto puede ser un problema.

 

También es posible reducir el número de combinaciones dividiendo los segmentos en segmentos (grupos) por rangos.

En las figuras 4 grupos con límites de rango, hacer una enumeración sólo dentro de los grupos, y luego combinar las mejores opciones dentro del grupo entre los otros grupos.

Es difícil dividir uniformemente, por lo que se pueden separar los segmentos por límites de grupo y utilizarlos al combinar los resultados entre grupos.