Densità della serie numerica - pagina 24

 
Bene, di nuovo, perché il metodo che ho mostrato non si chiama v2 adatto? Quale delta ha più cluster è quello in cui fermarsi.
 
Vyacheslav Kornev:
Abbiamo 50 celle e 11 dadi con numeri
1, 3, 6, 8, 10, 11, 15, 16, 30, 40,50
V1. I cluster più densi sono: 10,11 и 15,16.

V2. Meno densi sono: 1,3 e 6,8,10,11 e 15,16

V3. Ancora meno densi sono 1,3,6,8,10,11 e 15,6

V4. Poi 1,3,6,8,10,11,15,16.

La linea di fondo è questa. Abbiamo raccolto il delta. Cioè, calcoliamo v2 perché in questa variante ci sono più cluster

L'aggregazione 1,3 prende 3 celle su 50, cioè 1,5 celle per cubo.

Il cluster 6,8,10,11 occupa 6 celle. E qui 1,5 celle per cubo. Non andrò oltre.

Non volevi mettere il 10 e l'11 in un cluster separato.










Vedi se il delta 2 è il più comune. E il centro di massa tra i delta qui?

 
Finché non si definisce una formula di densità chiara e una formula per confrontare le due partizioni in questi cluster, si possono rompere tutte le copie che si vuole. Cioè, ci deve essere un criterio numerico per confrontare le prestazioni dei due algoritmi.
 
Vyacheslav Kornev:
Dal momento che avete capito che più grande è il delta più ampio è il cluster. Perché dite che sono mancini? All'interno di un grande cluster ce ne sono molti piccoli

Hai ragione - ci sono molti piccoli - forse c'è un errore logico nel mio algoritmo - ho bisogno di pensare.

Vyacheslav Kornev:
Ah, fino a quale delta contare,
Beh, heh, di tutti i delta.
Il più comune.

Troppo, però può essere un'altra stima su altri dati.

Vyacheslav Kornev:
E in generale con il metodo della ricerca del centro di massa. Cioè, contare i delta tra i delta).

Ehm, come lo immaginate - dichiarate l'algoritmo.

 
Vyacheslav Kornev:
Vedi se il delta 2 è il più comune. E il centro di massa tra i delta qui?

Ulteriori ricerche teoriche sono complicate a causa della mancanza di un numero sufficiente di test e della valutazione dei loro risultati.

Senza il codice, non voglio davvero ammazzare il tempo lavorando in Excel in questo momento - non è produttivo.

In conclusione, l'algoritmo deve essere testato sui dati per verificarne l'efficacia.

 
Avals:
Finché non si definisce una formula di densità chiara e una formula per confrontare le due partizioni in questi cluster, si possono rompere tutte le copie che si vuole. Cioè, ci deve essere un criterio numerico per confrontare le prestazioni dei due algoritmi.

Suggerisci le tue opzioni per la stima numerica - ho menzionato due opzioni prima.

 

Cambiato il codice dello script, ora puoi vedere i risultati direttamente sul grafico - la densità massima è evidenziata in un colore separato, il periodo delle barre può essere selezionato per data o per barre da zero - di default.

 

Aggiunta la logica del filtro modificato - sembra esserci meno rumore - cambiato dal parametro Variant - 0 è vecchio, e 1 è nuovo (default).

 

Aggiunto un filtro basato sul numero di elementi nel gruppo - 5 - può essere cambiato. Più cifre ci sono nella riga numerica, più alto dovrebbe essere il valore del filtro - può valere la pena fare una percentuale del numero massimo di cifre nel gruppo più grande.

Restituisce il precedente algoritmo di pre-filtraggio predefinito per la riga numerica - 0.

 

Corretto il calcolo spostando i dati per il calcolo.