Densidade de séries numéricas - página 24

 
Bem, novamente, por que o método que mostrei não é adequado, chamado v2? Qual delta tem o maior número de aglomerados é aquele em que se deve parar.
 
Vyacheslav Kornev:
Temos 50 células e 11 dados com números
1, 3, 6, 8, 10, 11, 15, 16, 30, 40,50
V1. Os aglomerados mais densos são: 10,11 и 15,16.

V2. Menos densos são: 1,3 e 6,8,10,11 e 15,16

V3. Ainda menos densos são 1,3,6,8,10,11 e 15,6

V4. Depois 1,3,6,8,10,11,15,16.

O resultado final é este. Pegamos o delta. Ou seja, calculamos a v2 porque nesta variante há o maior número de clusters

A agregação 1,3 tira 3 células de 50, ou seja, 1,5 células por cubo.

O aglomerado 6,8,10,11 ocupa 6 células. E aqui 1,5 células por cubo. Eu não irei mais longe.

Você não queria colocar 10 e 11 em um grupo separado.










Veja se o delta 2 é o mais comum. E o centro da massa entre os deltas aqui?

 
Até que você defina uma fórmula clara de densidade e uma fórmula para comparar as duas partições nestes grupos, você pode quebrar tantas cópias quantas quiser. Ou seja, deve haver um critério numérico para comparar o desempenho dos dois algoritmos.
 
Vyacheslav Kornev:
Já que você entendeu que quanto maior o delta, maior o aglomerado. Por que você diz que eles são canhotos? Dentro de um grande aglomerado há muitos pequenos

Você está certo - há muitos pequenos - talvez haja um erro lógico em meu algoritmo - eu preciso pensar.

Vyacheslav Kornev:
Ah, até que delta contar,
Bem, heh, de todos os deltas.
O mais comum.

Demasiado, embora possa ser outra estimativa sobre outros dados.

Vyacheslav Kornev:
E geralmente pelo método de encontrar o centro da massa. Ou seja, contar deltas entre deltas).

Um, como você prevê isso - declare o algoritmo.

 
Vyacheslav Kornev:
Veja se o delta 2 é o mais comum. E o centro da massa entre os deltas aqui?

Outras pesquisas teóricas são complicadas devido à falta de um número suficiente de testes e avaliação de seus resultados.

Sem o código, eu não quero realmente matar o tempo trabalhando em Excel agora - não produtivo.

Conclusão - o algoritmo deve ser testado nos dados a fim de testar sua eficácia.

 
Avals:
Até que você defina uma fórmula clara de densidade e uma fórmula para comparar as duas partições nestes grupos, você pode quebrar tantas cópias quantas quiser. Ou seja, deve haver um critério numérico para comparar o desempenho dos dois algoritmos.

Sugira suas opções para estimativa numérica - mencionei duas opções antes.

 

Alterado o código do script, agora você pode ver os resultados diretamente no gráfico - a densidade máxima é destacada em uma cor separada, o período de barras pode ser selecionado por data ou por barras de zero - por padrão.

Arquivos anexados:
 

Adicionada lógica de filtro modificada - parece ser menos ruído - alterada pelo parâmetro Variante - 0 é antigo , e 1 é novo (padrão).

Arquivos anexados:
 

Adicionado um filtro com base no número de itens do grupo - 5 - pode ser trocado. Quanto mais dígitos na linha numérica, maior deve ser o valor do filtro - pode valer a pena fazer uma porcentagem do número máximo de dígitos no grupo maior.

Retornou o algoritmo de pré-filtragem padrão anterior para a linha numérica - 0.

Arquivos anexados:
 

Corrigido o cálculo, deslocando os dados para o cálculo.

Arquivos anexados: