交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2022.04.06 08:02 #26221

JeeyCi #:

而这个答案并不是为你准备的--你还是不识字...

如果你推荐一篇含有废话的文章，你狼吞虎咽（这显示了你的能力），你也推荐别人狼吞虎咽......。

问题：如果这个答案不是针对我的，是不是就不再是妄想了？这个问题不是反问句。

Maxim Dmitrievsky 2022.04.06 09:38 #26222

JeeyCi #:

你在这里甚至不需要第二个模型，对吗？- 交叉验证和网格搜索的模型选择...

但也许只是混乱矩阵会回答你的第二个问题（你的想法的第二个模型的目的）...

... 或

...我只是怀疑你是否需要第二种模式......印象中

这正是使用第二个模型时声称的混淆矩阵的改进，如果你读过普拉多的文章，就会发现。但它也为第一个模型使用了超量取样的例子，以增加 "真阳性 "的数量或其他东西。我已经忘记了，很遗憾。

使用一个模型，你可以在牺牲另一个模型的情况下改进一个东西，而使用两个模型，你可以改进一切，据说。寻找混乱矩阵普拉多或梅塔莱贝林普拉多。我在用手机。

而交叉估值在这种操作之后会显示出 "好"，你只要看一下TC的股权平衡的新数据，就能一眼看出一切 )

JeeyCi 2022.04.06 13:16 #26223

Maxim Dmitrievsky #:
这里只是声称第二个模型的混淆矩阵的改进，如果你读了普拉多，例如。但它也为第一个模型使用了超量取样 的例子，以增加真阳性或其他东西的数量。不幸的是，已经忘记了。

使用一个模型，你可以在牺牲另一个模型的情况下改进一个东西，而使用2个模型，你可以改进一切，据说。查阅《混乱矩阵普拉多》或《梅塔莱贝林普拉多》。我在用手机。

上采样和下采样是针对不平衡的数据集和小的训练集--如果你是这个意思的话--即给小的类以较高的权重，反之亦然......是的，可能是为了增加它们（真实的积极因素）...

***

关于2个模型--嗯，可能有可能进行2次过滤--首先是设置权重的信号，然后根据这些权重进行交易（在第二次权重中由输入启动）......尽管看起来有可能在交易中学习上下文-- 并为早期时间序列保留梯度--好主意......但是，在处理上下文时，通常还是有点不同的--任务是使用 "交易及其上下文 "编码，第二个RNN接受第一个的处理结果，在输出中进行解码--但这与在两个不同的任务（例如，上下文和交易）上使用两个网络没有什么关系，因为事实上它是通过两个网络 "交易和上下文"（作为一对！！！）进行处理--传递的...。- 它只解决了速度问题，但没有解决（或在较小程度上）输出的有效性问题...我认为...

但如果你真的想把上下文和事务处理分开（上下文分开，事务分开）--到目前为止，这样的结构让我想起了一个三明治（或油和黄油，润滑现象之间的相互关系和依赖关系--分两层）...我并不假装解释你的TechSuite，但我已经表达了我的担忧和建议，它可能仍然值得在建模过程中保留--即关系！......。我祝愿你有一个美丽的（反映现实的！而不是奶油色的）网络架构！"。

p.s.）作为一个永恒的问题的 "上下文广告" - "主要的是不要脱离现实" （只有他们的规模设置有时是歪的 - 我不会指着谁- 或与小样本在错误的方向工作）

Maxim Dmitrievsky 2022.04.06 15:43 #26224

JeeyCi #:

上采样和下采样是针对不平衡的数据集和小的训练集--如果你是这个意思的话--即给小的类更多的权重......是的，可能是为了增加它们（真实的积极因素）...

***

关于2个模型--嗯，可能有可能进行2次过滤--首先是设置权重的信号，然后根据这些权重进行交易（在第二次称重时由输入启动）......尽管看起来有可能根据背景学习交易-- 并为早期时间序列保留梯度--好主意......但是，在处理上下文时，通常还是有点不同的--任务是使用 "交易及其上下文 "编码，第二个RNN接受第一个的处理结果，在输出中进行解码--但这与在两个不同的任务（例如，上下文和交易）上使用两个网络没有什么关系，因为事实上它是通过两个网络 "交易和上下文"（作为一对！！！）进行处理--传递的...。- 它只解决了速度问题，但没有解决（或在较小程度上）输出的有效性问题...我认为...

但如果你真的想把上下文和事务的处理分开（上下文分开，事务分开）--到目前为止，这样的结构让我想起了一个三明治（或油和黄油，润滑现象之间的相互关系和依赖关系--分两层）...我并不假装解释你的TechSuite，但我已经表达了我的担忧和建议，它可能仍然值得在建模过程中保留--即关系！......。我祝愿你有一个美丽的（反映现实的！而不是奶油色的）网络架构！"。

p.s.）作为一个永恒的问题的 "上下文广告" - "主要的是不要脱离现实" （只有他们的规模设置有时是歪的 - 我不会指责谁- 或与小样本在错误的方向工作）

在时间序列的情况下，背景的概念也许不是很有用。那里没有明确的划分，两种模式都参与了预测。一个是方向，另一个是时机。我想说它们是等同的。问题是如何在分析模型误差的基础上优化搜索最佳交易情况，以及是否有可能。我可以按顺序重新训练一个或另一个。在每一对重新训练之后，结果必须在新的数据上有所改进。这意味着它必须能够从训练样本中提取模式，并逐渐改进它未曾见过的新数据。这是一项非同小可的任务。

我已经把第一个模型预测不佳的例子抛出，纳入第二个模型的 "不交易 "类别。扔掉了第一个模型的吊环样品。第一个人的错误相应地降到了几乎为零。第二个也有一个小的。但这并不意味着它在新的数据上会有好的表现。

这是某种组合问题：在正确的时间找到正确的买入和卖出。

也许在这里不可能找到解决办法

mytarmailS 2022.04.06 18:47 #26225

Maxim Dmitrievsky #:

规律性的概念意味着可重复性，这很重要!

如果一个聚类能够以90%的概率预测某事，并且至少重复200次，我们就可以认为这是一个模式。

或者说它不是一个集群，是一个日志。

当你处理一个复杂的模型时（复杂来自于 "复杂 "这个词），你失去了固定内部模式的重复性的能力，换句话说，你失去了区分模式和拟合的能力...

理解了这一点，你就可以马上明白，神经网络是要进垃圾桶的，但木质模型可以分解成规则，而规则已经可以统计了

Maxim Dmitrievsky 2022.04.06 22:01 #26226

mytarmailS #:
规律性的概念意味着可重复性，这很重要!

如果一个聚类能够以90%的概率预测某事，并且至少重复200次，我们就可以认为这是一个模式。

或者说它不是一个集群，是一个日志。

当你处理一个复杂的模型时（复杂来自于 "复杂 "这个词），你失去了固定内部模式的重复性的能力，换句话说，你失去了区分模式和拟合的能力...

理解了这一点，你可以立即意识到，神经网络会被扔进垃圾桶，但木质模型可以被分解成规则，而规则已经可以统计了

但是，如果没有简单的依赖关系，很多功能可以被塞进ns，尽管没有分析的可能性。否则，我们将抛弃所有的机器学习，回到简单的TS编写方式 :)然后我们就可以写一些简单的算法，观察它们在测试器中是如何（不）工作的，调整，再观察，等等。

JeeyCi 2022.04.07 06:47 #26227

无论你怎么看，统计都是线性的......神经网络是哑巴（或聪明--取决于开发者）加权......使用2层或更多层的Dense ns进行加权，可以得到非线性的依赖关系（从传统意义上讲，因为依赖关系是OR哑巴的关联性仍然是一个非常大的问题）......但是，只要即使是一个愚蠢的关联工作 - 你可以尝试在上面赚钱...- 必须及时发现它停止工作的时刻（你需要注意到某种异常情况--随机的或系统的--这是另一个问题--然后，像往常一样，决定你的风险/盈利性问题）

ns的方便之处在于它的灵活性--你可以获得/提供相当不同的 "命名 "给输出。它很灵活--你可以从输入中获得/提供相当不同的 "命名法"--也就是说，你可以在网络本身做我们需要的转换......并在多线程模式下进行（取决于库的情况）...不仅仅是统计数字...

你是否需要统计学来寻找输入是另一个问题...

知识和经验比统计处理更有帮助--因为前者关注的是具体细节，后者关注的是还原到一个共同的分母......。

一切都有它的位置--统计也是如此...

***

问题是，对于机器人来说--没有其他方式可以解释（它也不会用其他方式解释你），除了通过数字得出的概率......--这就是经济学如何为世界服务--用数字0和1......所以我们必须将输入数字化以获得输出概率，并设定置信区间的条件（我们相信它，不一定是统计数据）。我们可以相信任何东西（这是主观的）--要么是二进制逻辑，要么是这个二进制逻辑的加权结果（也就是整个潜在解决方案的百分比概率）......-- 这只是一个品味和习惯的问题，而不是一个关于寻找圣杯的争论主题......

(而进入森林或进入神经网络已经是一个细节)

没有人禁止在同一个项目中联合使用树木/森林和神经网络......- 问题是在哪里和什么时候应用什么（速度和内存很重要），而不是哪个更好......- 最好不要失去时间--相当于 "离开交易的时间就是失去的时间，就像离开时间的交易就是未知的交易"

Maxim Dmitrievsky 2022.04.07 10:06 #26228

这么长的咆哮，这么弱的结论 :)即使我们从时间中抽象出来，一个模型（正则化，不拟合）也不能教出一个好的盈利和不盈利的交易比例，或者排除不盈利的交易。你无法摆脱分类误差，即使在追踪样本上，也会被认为是TS交易结果的人为恶化。

JeeyCi 2022.04.07 10:44 #26229

任何模型都不能得到超过概率的东西（这是任何数字化的优势和劣势），即使这些概率没有经过加权...我不会用三明治毒害自己，也不会建议任何人--没有人取消贝叶斯（即使你不把它放在代码中，特别是--如果你把它放在代码中）...

p.s. 而你一定是麦当劳的粉丝...- 假设，我不会检查它...

算法比你的结论更重要

Maxim Dmitrievsky 2022.04.07 10:54 #26230

JeeyCi #:

任何模型都不能得到超过概率的东西（这是任何数字化的优势和劣势），即使这些概率没有经过加权...我不会用三明治毒害自己，也不会建议任何人--没有人取消贝叶斯（即使你不把它放在代码中，特别是--如果你把它放在代码中）...

p.s. 而你一定是麦当劳的粉丝...- 假设，我不会检查它...

算法比你的结论更重要。

三明治被广泛使用，任何深网。不同的任务有不同的窍门。但如果你狭隘地想，任何复印机都是复印机，任何汉堡都是麦当劳。

你可以成为你自己定型观念的人质，而不去尝试任何东西。而定型观念并不是来自于分层😀。

在我的回答中，我隐含地使用了第二个澄清模式，从一般化的知识中挑出了具体的、更适合的情况

交易中的机器学习：理论、模型、实践和算法交易 - 页 2623