交易中的机器学习:理论、模型、实践和算法交易 - 页 3150

 
Maxim Dmitrievsky #:
如果你仔细想想

如果你已经投了五根蜡烛,当然可以。

如果你仔细想想,试图涵盖所有可能影响价格的因素,你就会意识到,有数十亿种迹象,你必须考虑到不变性,而不变性是数十亿乘以数十亿。

这就是我写这篇文章的原因。

mytarmailS#

如果你认为 Forest 或 Boost 可以完成这样的工作,那我就要让你失望了,他们还没有学会将 100 亿个特征输入表格模型呢....。

所以所有现成的模型都是不可能的。

 
mytarmailS #:

如果是最后五根蜡烛,当然可以。

如果你仔细想想,并试图涵盖所有可能影响价格的因素,你就会意识到有数十亿种迹象,你必须考虑到不变性,而不变性是数十亿乘以数十亿。

这就是我写这篇文章的原因。

所以,所有现成的模型都是不可能的。

总的来说,我同意 Max 的观点。在价格范围内生成规则或条件仅限于比较、逻辑和日历绑定。因此,一般肯定有))))。

 
mytarmailS #:

如果是最后五根蜡烛,当然可以。

如果你仔细想想,并试图涵盖所有可能影响价格的因素,你就会意识到有数十亿种迹象,你必须考虑到不变性,而不变性是数十亿乘以数十亿。

这就是我写这篇文章的原因。

所以,所有现成的模型都是不可能的。

胡说八道。

数学的意义就在于用计算这种多样性的最基本公式来取代我们周围世界的多样性。

你已经描述或试图描述万物和每个人坠落地球的过程,牛顿推导出了任何物体坠落地球的地球引力公式。

在射频树中,我从一些非稳态 cotir 的推导中,在 80% 或更多的情况下正确地预测了未来。当将窗口移动到 15,000 条时,这样的树不超过 150 棵(我没有尝试过更多),分类误差没有变化。你可以冒险使用最少 70 棵树:误差会增大几个百分点。 这就是你所有的数十亿数十亿。

 
СанСаныч Фоменко #:

我有一棵射频树,从某种非稳态商数的推导中,有 80% 或更多的时间能正确预测未来。



我每小时能赚 100 万,我有 50 厘米,总的来说,我是这个星球的总统。

但我不会向任何人展示和证明任何东西,就像这里的其他大嘴巴.....。

 
mytarmailS #:

如果是最后五根蜡烛,当然可以。

如果你仔细想想,并试图涵盖所有可能影响价格的因素,你就会意识到有数十亿种迹象,你必须考虑到不变性,而不变性是数十亿乘以数十亿。

这就是我写这篇文章的原因。

所以,所有现成的模型都是不可能的。

是时候为量子计算申请配额了 ) 它们似乎能快速解决矩阵运算问题

 
Maxim Dmitrievsky #:

是时候为量子计算申请配额了)它们似乎能很快解决矩阵运算。

我在通过联立规则算法寻找规则,矩阵运算帮不上忙。

我需要 TB 级的内存,也许还需要 CPU。

 
mytarmailS 降低维度。 (本质上是改编了一种著名的压缩算法)

开始使用搜索规则的算法(这是目前最有效的 算法,它不理解,挂了))。

我不得不将维度降低 100 倍。


这时,它才开始找到一些东西......


这就是我的语言中的模式或规则...

只有一条规则,先生们

如果你认为 Forest 或 Boost 可以完成这样的工作,那我会让你失望的,它们还没有学会将 100 亿个特征输入表模型....。

就一条规则

这种事情需要超级计算机。

如果需要多次训练呢?例如,优化某些元参数。那就需要一个由超级计算机组成的超级网络)。

 
Aleksey Nikolayev #:

如果需要多次训练怎么办?例如,为了优化某些元参数。那么,我们就需要一个由超级计算机组成的超级网络)。

首先,这不是学习,而是寻找规则。
如果已经找到了规则,那么再在相同的数据中寻找相同的规则又有什么意义呢?

其次,你总是可以做以前做过的事,但希望得到不同的结果
 
mytarmailS #:
首先,这不是学习,而是寻找规则。
如果已经找到了规则,那么再从相同的数据中寻找相同的规则又有什么意义呢?

其次,你总是可以做以前做过的事,但希望得到不同的结果

总有一些元参数会影响结果。比如历史窗口的大小,以及其他任何参数。对于元参数,最糟糕的做法就是无视它们的存在,只从上限中获取它们的值。

我记得 fxsaber 曾说过,有时将 TS 算法中的任何常数都视为优化参数是非常有用的。

 
Aleksey Nikolayev #:

总有一些元参数会影响结果。例如历史窗口的大小,以及其他任何参数。对于元参数,最糟糕的做法就是忽略它们的存在,只从上限中获取它们的值。

我记得 fxsaber 曾说过,有时将 TS 算法中的任何常数都视为优化参数是非常有用的。

历史窗口的大小对于使用表格数据的经典 MO 来说是一个很大的限制。

而 AC(asoc.规则)则不会有这样的问题,它们可以 完美地消化 非结构化数据,而且每个观测值的大小可以是任意的

而且,"视野窗口"(历史窗口)只能受到演绎能力或常识的限制。


所以,你关于 "历史窗口 "大小的 例子不过是支持 AC、反对 MO 的一票而已。



请再给我一些论据,我很感兴趣,也许我真的没有考虑到某些东西。 还有一个问题,您对 AC 的话题了解多少?


==========================================================================

让我们用五个观测数据创建一个小型模拟数据(模型)。

[[1]]
 [1] "A"    "B"    "."    "."    "."    "."    "C"    "."    "."    "."    "."    "."    "SELL"

[[2]]
 [1] "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "A"    "."    "."    "B"    "."    "."    "."    "C"    "."    "."   
[21] "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "SELL"

[[3]]
 [1] "."    "."    "."    "."    "."    "."    "."    "."    "."    "A"    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."   
[21] "B"    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."   
[41] "."    "SELL"

[[4]]
 [1] "."    "."    "."    "."    "A"    "."    "."    "."    "B"    "."    "."    "."    "."    "."    "C"    "SELL"

[[5]]
 [1] "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."   
[21] "."    "."    "."    "."    "A"    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "."    "B"    "."    "."    "."   
[41] "C"    "."    "."    "."    "."    "SELL"

观测值--让一个观测值代表 m5 个报价中的一天。

让我们用". " 表示观测值中的一些噪声(我们不感兴趣的一些事件)。

"A" " B ""C" ---> "卖出" 这就是 导致 "卖出 "目标的一系列事件。


您只需输入 MO 和目标中的最后 5 根蜡烛。

就像这样

所有数据都是整齐的表格形式。

AMO 如何从示例中找到模式?



扬声器将所有观察结果作为输入,观察结果可以大小不一(如示例所示)。

它通过选择规则来剔除噪音,并以规则 ="A" "B" "C" 的形式给出通向 "细胞"的模式。

它将非结构化的垃圾转化为模式。