数列密度 - 页 21

 
Vyacheslav Kornev:
我们有50个单元格和11个带数字的骰子。
1, 3, 6, 8, 10, 11, 15, 16, 30, 40,50
V1.最密集的群组是。10,11 и 15,16.

V2.密度较低的是:1、3和6、8、10、11和15、16

V3.密度更低的是1、3、6、8、10、11和15、6

V4.然后是1,3,6,8,10,11,15,16。

底线是这样的。我们已经接上了三角洲。也就是说,我们计算v2,因为在这个变体中,有最多的群组

聚合1,3从50个单元中抽取3个,即每个立方体1.5个单元。

第6、8、10、11组占6个单元。而这里每立方体有1.5个细胞。我不会再往下说了。

你不想让10和11成为一个单独的集群。




事实上,你应该知道,我们已经计算了数列中的质心。这就是最高的密度。

而它们周围的数字都在所有数字的中位数三角洲之内,并形成了群组。
这对你来说不起作用吗?
 
Vyacheslav Kornev:
这个选项对你不起作用吗?

我告诉过你,如何使用这个选项并不清楚,因为划分组别取决于delta的数量或最小delta步长。

你上次运行了我的脚本吗?

它处理数字并找到密度--下面的可视化--数字--从2015年2月1日至2016年12月25日英镑兑美元的周线收盘价--100位数

你能为你的算法做同样的计算吗?

 
-Aleks-:

所以你问的问题和我找的答案一样 :)

这就是为什么我想知道用什么标准来筛出集群--以及筛出它们是否会正确。

我可以筛选出更多--按相对于所有数字的剩余三角洲的百分比来调节--现在是50%,但我也可以按10%来做--你的算法现在不允许自动完成这个过程。

现在根据你的算法,有132个不同的deltas--如何选择必要的deltas是一个问题--很明显,从最小的,但不清楚什么是最大的。

只是快速看了一下算法:

1.Deltas的计算(相邻点之间的距离)

2.逐渐增加和减少的点的分组(实际上找到了局部极值,我们得到了一个拉人字形,其中凹陷处指向紧密的组,峰值指向它们之间的空隙)

3.与第1、2小段类似,实施2个有顶点和谷底的独立程序。这是从一个之字形获得的2。一个之字形是由一组顶点组成的,而波谷位于最大的稀疏区域。而在另一个中,谷底的密度达到了最大。理论上,这两个人字形应该或多或少是反相的。
 
Maxim Kuznetsov:
一目了然的算法:

1.Deltas的计算(相邻点之间的距离)

2.逐渐增加和减少的点的分组(实际上找到了局部极值,我们得到了一个人字形的模式,其中凹陷的地方指向紧密的组,峰值指向它们之间的间隙。)

3.与第1、2小段类似,实施2个有顶点和谷底的独立程序。这是从一个之字形获得的2。一个之字形是由一组顶点组成的,而波谷位于最大的稀疏区域。而在另一个中,谷底的密度达到了最大。理论上,这两个人字形应该或多或少是反相的。

一个深刻的思考,但只有你能从中找出一个例子来!也许你可以给我看看你对上述20个数字的思考过程,使之更加清晰?

 

在图表中,我加入了30%的过滤器的结果

我在脚本中加入了选择delta过滤数字百分比的功能。

附加的文件:
 
-Aleks-:

一个深刻的思考,但只有你能从中找出一个例子来!也许你可以给我看看你对上述20个数字的思考过程--使之更加清晰?

相当大的阵列的算法(在1-2步上,即使是一个随机集也会放电约3次,然后再放电两次,重复......控制集变成了约300点。)
原理很简单,我们沿着一个数字序列走,点的频率越高,其密度就越高(仅从密度的定义来看)。我们找到极值,将表明 "密集化 "的群体。
对 "组 "重复,并找到组密度和稀疏度。

1.如果我们用你的20个数字来说明:



即通过箭头,我们只是标记--三角洲在减少(右箭头)或增加(左箭头)。 在左边,我们得到圆圈--局部组。右边的圆圈是局部区间。(此图正好是一个之字形,如果有必要,可以用同样的方法处理)

接下来,计算左边小圆圈之间的三角洲,并重复同样的程序,以获得密度/稀释的差距。

而对于右边的圆圈,以同样的方式,我们得到了群体的密度/密度。
 
顺便说一下,这很有趣--你可以测量 "不可测量 "的东西--市场的紧张程度、加速/减速,甚至通过刻度来测量 :-)
 
Maxim Kuznetsov:
顺便说一句,这很有趣--这种方式你可以衡量 "无法衡量的" --市场波动,加速/减速,甚至通过刻度来衡量 :-)

让我们来处理一个简单的问题--下面是一个表格--德尔塔计数的两种变体

NO.P./P.数量三角洲++ V1-- V1++ V2-- V2
1 10
2 13 3 3 3
3 15 2 2 2
4 21 6 6
5 31 10 10 10
6 40 9 9
7 42 2 2 2
8 46 4 4
9 51 5 5
10 56 5 5
11 65 9 9 9
12 71 6 6 6
13 78 7 7 7
14 81 3 3 3
15 190 109 109 109
16 223 33 33
17 232 9 9 9
18 250 18 18 18
19 260 10 10 10
20 545 285 285 285
共计。 461 74 441 32

或者我应该从V2的++和--之间的delta?


 
-Aleks-:

现在让我们保持简单 - 以下是一个表格 - 两个选项,用于计算哪些三角洲的数量

NO.P./P.数量三角洲++ V1-- V1++ V2-- V2
1 10
2 13 3 3 3
3 15 2 2 2
4 21 6 6
5 31 10 10 10
6 40 9 9
7 42 2 2 2
8 46 4 4
9 51 5 5
10 56 5 5
11 65 9 9 9
12 71 6 6 6
13 78 7 7 7
14 81 3 3 3
15 190 109 109 109
16 223 33 33
17 232 9 9 9
18 250 18 18 18
19 260 10 10 10
20 545 285 285 285
共计。 461 74 441 32

或者说,从V2开始的三角值应该在++和--之间?


你在V1,V2中用++和用--的随机数是什么样的?:-)
在你的表格中,我用紫色 标记了局部三角洲的最大值,用绿色 标记了局部的最小值(我在某个地方犯了一个错误--在网站上看表格不方便,我遮挡了错误的地方)。定义了点的群组。
此外,对紫色也要遵循同样的程序(计算三角洲=31-13,46-13,65-46......),并确定其极值。
 
Maxim Kuznetsov:
你在V1,V2中用++和用--的随机数是什么样的?:-)
在你的表格中,我特别标注了紫色--三角洲的局部最大值和绿色的 局部最小值(我在某个地方犯了一个错误--使用有表格的网站不方便,我遮挡了错误的地方)。定义了点的群组。
此外,对紫色也要遵循同样的程序(计算三角洲=31-13,46-13,65-46......),并确定其极值。

这些数字不是随机的,它们正是你所强调的++--增长中的最大值,以及--下降中的最小值。所以我还没有想好要改什么--你的大部分颜色标记与V2吻合,其余的,我可能有错误--这是你报告的。请澄清一下。