Densité des séries numériques - page 24

 
Eh bien, encore une fois, pourquoi la méthode que j'ai montrée n'est-elle pas appelée v2 convenable ? Le delta qui a le plus de clusters est celui où il faut s'arrêter.
 
Vyacheslav Kornev:
Nous avons 50 cellules et 11 dés avec des chiffres.
1, 3, 6, 8, 10, 11, 15, 16, 30, 40,50
V1. Les clusters les plus denses sont : 10,11 и 15,16.

V2. Les moins denses sont : 1,3 et 6,8,10,11 et 15,16

V3. Encore moins dense sont 1,3,6,8,10,11 et 15,6

V4. Puis 1,3,6,8,10,11,15,16.

Le résultat final est le suivant. Nous avons récupéré le delta. C'est-à-dire que nous calculons v2 parce que dans cette variante il y a le plus de clusters

L'agrégation 1,3 prend 3 cellules sur 50, soit 1,5 cellule par cube.

La grappe 6, 8, 10, 11 occupe 6 cellules. Et ici, 1,5 cellule par cube. Je n'irai pas plus loin.

Vous ne vouliez pas mettre 10 et 11 dans un groupe séparé.










Voyez si le delta 2 est le plus courant. Et le centre de masse parmi les deltas ici ?

 
Tant que vous n'aurez pas défini une formule de densité claire et une formule de comparaison des deux partitions dans ces clusters, vous pourrez casser autant de copies que vous le souhaitez. Autrement dit, il doit exister un critère numérique permettant de comparer les performances des deux algorithmes.
 
Vyacheslav Kornev:
Puisque vous avez compris que plus le delta est grand, plus le cluster est large. Pourquoi dites-vous qu'ils sont gauchers ? Dans un grand groupe, il y a beaucoup de petits groupes.

Vous avez raison - il y a beaucoup de petits - peut-être y a-t-il une erreur logique dans mon algorithme - je dois réfléchir.

Vyacheslav Kornev:
Ah, jusqu'à quel delta compter,
Eh bien, heh, de tous les deltas.
Les plus courantes.

Trop, cependant, peut être une autre estimation sur d'autres données.

Vyacheslav Kornev:
Et généralement par la méthode de recherche du centre de masse. C'est-à-dire compter les deltas parmi les deltas).

Hum, comment l'envisagez-vous - énoncez l'algorithme.

 
Vyacheslav Kornev:
Voyez si le delta 2 est le plus courant. Et le centre de masse parmi les deltas ici ?

La poursuite de la recherche théorique est compliquée par l'absence d'un nombre suffisant de tests et d'évaluation de leurs résultats.

Sans le code, je n'ai pas vraiment envie de tuer le temps à travailler dans Excel en ce moment - pas productif.

En résumé, l'algorithme doit être testé sur les données afin de vérifier son efficacité.

 
Avals:
Tant que vous n'aurez pas défini une formule de densité claire et une formule de comparaison des deux partitions dans ces clusters, vous pourrez casser autant de copies que vous le souhaitez. Autrement dit, il doit exister un critère numérique permettant de comparer les performances des deux algorithmes.

Proposez vos options pour l'estimation numérique - j'ai mentionné deux options précédemment.

 

J'ai modifié le code du script, maintenant vous pouvez voir les résultats directement sur le graphique - la densité maximale est mise en évidence dans une couleur distincte, la période des barres peut être sélectionnée par date ou par barres à partir de zéro - par défaut.

Dossiers :
 

Ajout d'une logique de filtre modifiée - il semble y avoir moins de bruit - modifié par le paramètre Variant - 0 est l'ancien, et 1 est le nouveau (par défaut).

Dossiers :
 

Ajout d'un filtre basé sur le nombre d'éléments dans le groupe - 5 - peut être modifié. Plus il y a de chiffres dans la ligne numérique, plus la valeur du filtre doit être élevée - il peut être intéressant de faire un pourcentage du nombre maximum de chiffres dans le groupe le plus important.

Renvoie l'algorithme de pré-filtrage par défaut précédent pour la ligne numérique - 0.

Dossiers :
 

Corrigé le calcul en décalant les données pour le calcul.

Dossiers :