结合段的范围的算法--帮助创建 - 页 6

 
Aleksey Vyazmikin:

路径是长是短有什么区别,还是估计的问题(图中类比的箭头的长度)?

我们有愿望踩在例子中的两条最佳路径上,如果数量少,那么就有一条路径。

请解释为什么这可能是一个问题。

如果集合中有长路径和短路径,如果你进入只有长路径的区域,那么路径就比进入有短路径的区域要长。例如,在开始时就像你的图片一样,然后有两个相互平行的区域,在第一个区域,线段比第二个区域短3倍,占据了75%的路径。

 
Valeriy Yastremskiy:

如果这组数据中有短段和长段的区域,那么如果你到了只有长段的区域,路径将比你到短段的区域长。例如,在开始的时候,就像你画的那样,然后有两个相互平行的区域,在第一个区域,线段比第二个区域短3倍,占据了75%的路径。

运动将从每段开始,所以你也必须通过这些区域。

 
Aleksey Vyazmikin:

运动将从每段开始,所以也必须经过这些区域。

运动可以从任何段开始,但显然不需要长段点。在你的算法中,你只与最近的线段有关系,而不是与任何线段都有关系,如果你碰到一个有长线段的点,而附近的点只有长线段,这不是一个好结果。

 
Valeriy Yastremskiy:

一个运动可以从任何段开始,但显然不需要长段点。在你的算法中,你只与最近的线段有关系,而不是与任何线段有关系,如果你到了一个有长线段的点,而旁边的点只有长线段,这不是最好的结果。

"长度 "在这里是相对的,直到你到了一个点,你就无法测量它。

另一件事是估计成复合类似物,当一个片段由两个表示时,那么是的,我们可以放弃一个片段。

 
Aleksey Vyazmikin:

这里的 "长度 "是相对的,直到我们到达一个点,我们无法测量它。

另一件事是对复合类似物的估计,当一个段由两个段代表时,那么是的,我们可以放弃一个段。

我不明白。如果长度/价格只能通过打点来看,那就更难了。而如果没有一个足够完整的价格/长度估计,就无法可靠地估计出结果。

复合类似物的情况并不清楚。

 
Valeriy Yastremskiy:

我不明白。如果长度/价格只能通过打点来查看,那就更难了。而如果没有足够完整的价格/长度估计,就无法可靠地评估结果。

是的,它是。

瓦列里-亚斯特雷姆斯基

对复合类似物不清楚。

在下图中,我们有两个大段,下面有5个小段,但你可以看到它们在同一范围内,因此基本上描述了一个类似的区域。

唯一的问题是哪一个更好--较小的条形图给了他们每个人找到相关预测因素的可能性并有一个更准确的截止点,还是较大的条形图中更大的概括能力。我认为浅层的截止日期更好,他们的最低限度在选择上是有限的。

 

另一个想法出现了,为什么不实际采取最好的X%的片段,并在第一步中使用它们来填补空间,在第二步中确定片段之间的差距,并寻找片段来嵌入这些差距中。

该图显示了常规的两个阶段。


 
Aleksey Vyazmikin:

另一个想法出现了,为什么不实际采取最好的X%的片段,并在第一步中使用它们来填补空间,在第二步中确定片段之间的差距,并寻找片段来嵌入这些差距中。

在图中,我有条件地显示了这两个阶段。


好吧,这就是我想说的,首先从点上估计长度/价值,确定多个有价值和有毒的段,然后根据段的价值和最完整地填补路径的能力,建立一个路径,不留空隙。

最起码,解决方案不会是最好的,但会比平均水平好。

 

这个问题偏离了主题,颇具哲学意味。是否意识到通过将属性划分为段的分类方法意味着输出对输入的不连续依赖?也就是说,可能会出现这样的情况:交易会在一组属性处开盘,而在另一个非常非常接近第一组属性的地方不会开盘(它们接近边界,但在边界的两侧)。我并不是说这是错误的方法。我只想问--这背后是否有某种交易员的直觉,或者是一种任意的选择?

作为一种可能的选择,人们可以建议通过逻辑 回归或最近的邻居方法进行分类。输出可包含对属于某一类别的概率的估计,例如,可用于确定交易量。我不坚持任何特定的算法,只是对选择特定MO算法的交易员方面感兴趣。

 
Valeriy Yastremskiy:

这就是我想说的,首先从点上估计长度/价值,确定许多有价值的和有毒的段,然后根据段的价值和能够最好地填补路径而不出现缺口的能力,建立一条路径。

至少,解决方案不会是最好的,但会比平均水平好。

这里的问题是如何识别 "许多有价值的细分市场和有毒"--即你需要识别它们的互换性,或者像我之前建议的那样,分两次进行。或者你有其他选择吗?