数列密度 - 页 24

 
好吧,再说一遍,为什么我展示的方法不叫V2适合?哪个三角洲有最多的集群,就应该在哪个三角洲停下来。
 
Vyacheslav Kornev:
我们有50个单元格和11个数字的骰子
1, 3, 6, 8, 10, 11, 15, 16, 30, 40,50
V1.最密集的群组是。10,11 и 15,16.

V2.密度较低的是:1、3和6、8、10、11和15、16

V3.密度更低的是1、3、6、8、10、11和15、6

V4.然后是1,3,6,8,10,11,15,16。

底线是这样的。我们已经接上了三角洲。也就是说,我们计算v2,因为在这个变体中,有最多的群组

聚合1,3从50个单元中抽取3个,即每个立方体1.5个单元。

第6、8、10、11组占6个单元。而这里每立方体有1.5个细胞。我不会再往下说了。

你不想把10号和11号放在一个单独的集群中。










看看delta 2是否是最常见的。这里的三角洲中的质量中心呢?

 
在你定义一个明确的密度公式和比较两个分区进入这些集群的公式之前,你可以随心所欲地打破许多副本。也就是说,必须有一个数字标准来比较两种算法的性能。
 
Vyacheslav Kornev:
既然你已经明白,三角洲越大,集群越广。为什么你说他们是左撇子?在一个大集群中,有许多小集群

你是对的--有很多小的--也许在我的算法中存在一个逻辑错误--我需要思考。

维亚切斯拉夫-科尔涅夫
啊,要算到什么德尔塔。
嗯,呵呵,所有的三角洲。
最常见的是。

太多了,虽然可能是对其他数据的另一种估计。

维亚切斯拉夫-科尔涅夫
而一般是通过寻找质量中心的方法。就是说,在三角洲中计算三角洲)。

嗯,你是如何设想的呢--说出算法。

 
Vyacheslav Kornev:
看看delta 2是否是最常见的。这里的三角洲中的质量中心呢?

由于缺乏足够数量的测试和对其结果的评估,进一步的理论研究很复杂。

没有代码,我现在真的不想在Excel中消磨时间--没有生产力。

一句话--算法要在数据上进行测试,以检验其有效性。

 
Avals:
在你定义一个明确的密度公式和比较两个分区进入这些集群的公式之前,你可以随心所欲地打破许多副本。也就是说,必须有一个数字标准来比较两种算法的性能。

提出你对数字估计的选择--我前面提到了两个选择。

 

修改了脚本代码,现在你可以直接在图表上看到结果--最大密度以单独的颜色突出显示,柱状周期可以按日期或按从零开始的柱状选择--默认情况下。

附加的文件:
 

增加了修改后的过滤器逻辑--似乎噪音更少了--由Variant参数改变--0是旧的,1是新的(默认)。

附加的文件:
 

增加了一个基于组内项目数量的过滤器--5--可以改变。数字行中的数字越多,过滤器的值就应该越高--可能值得以最大组中的最大数字的百分比来计算。

返回之前默认的数字行的预过滤算法--0。

附加的文件:
 

纠正了计算方法,转移了计算的数据。

附加的文件: