交易中的机器学习:理论、模型、实践和算法交易 - 页 2623

 
JeeyCi #:

而这个答案并不是为你准备的--你还是不识字...

如果你推荐一篇含有废话的文章,你狼吞虎咽(这显示了你的能力),你也推荐别人狼吞虎咽......。

问题:如果这个答案不是针对我的,是不是就不再是妄想了?这个问题不是反问句。
 
JeeyCi #:

你在这里甚至不需要第二个模型,对吗?- 交叉 验证 和网格搜索的模型选择...

但也许只是混乱矩阵会回答你的第二个问题(你的想法的第二个模型的目的)...

...

...我只是怀疑你是否需要第二种模式......印象中

这正是使用第二个模型时声称的混淆矩阵的改进,如果你读过普拉多的文章,就会发现。但它也为第一个模型使用了超量取样的例子,以增加 "真阳性 "的数量或其他东西。我已经忘记了,很遗憾。
使用一个模型,你可以在牺牲另一个模型的情况下改进一个东西,而使用两个模型,你可以改进一切,据说。寻找混乱矩阵普拉多或梅塔莱贝林普拉多。我在用手机。
而交叉估值在这种操作之后会显示出 "好",你只要看一下TC的股权平衡的新数据,就能一眼看出一切 )
 
Maxim Dmitrievsky #:
这里只是声称第二个模型的混淆矩阵的改进,如果你读了普拉多,例如。但它也为第一个模型使用了超量取样 的例子,以增加真阳性或其他东西的数量。不幸的是,已经忘记了。
使用一个模型,你可以在牺牲另一个模型的情况下改进一个东西,而使用2个模型,你可以改进一切,据说。查阅《混乱矩阵普拉多》或《梅塔莱贝林普拉多》。我在用手机。

上采样和下采样是针对不平衡的数据集和小的训练集--如果你是这个意思的话--即给小的类以较高的权重,反之亦然......是的,可能是为了增加它们(真实的积极因素)...

***

关于2个模型--嗯,可能有可能进行2次过滤--首先是设置权重的信号,然后根据这些权重进行交易(在第二次权重中由输入启动)......尽管看起来有可能在交易中学习上下文-- 并为早期时间序列保留梯度--好主意......但是,在处理上下文时,通常还是有点不同的--任务是使用 "交易及其上下文 "编码,第二个RNN接受第一个的处理结果,在输出中进行解码--但这与在两个不同的任务(例如,上下文和交易)上使用两个网络没有什么关系,因为事实上它是通过两个网络 "交易和上下文"(作为一对!!!)进行处理--传递的...。- 它只解决了速度问题 ,但没有解决(或在较小程度上)输出的有效性问题...我认为...

但如果你真的想把上下文和事务处理分开(上下文分开,事务分开)--到目前为止,这样的结构让我想起了一个三明治(或油和黄油,润滑现象之间的相互关系和依赖关系--分两层)...我并不假装解释你的TechSuite,但我已经表达了我的担忧和建议,它可能仍然值得在建模过程中保留--即关系!......。我祝愿你有一个美丽的(反映现实的!而不是奶油色的)网络架构!"。

p.s.)作为一个永恒的问题的 "上下文广告" - "主要的是不要脱离现实" (只有他们的规模设置有时是歪的 - 我不会指着谁- 或与小样本在错误的方向工作)

 
JeeyCi #:

上采样和下采样是针对不平衡的数据集和小的训练集--如果你是这个意思的话--即给小的类更多的权重......是的,可能是为了增加它们(真实的积极因素)...

***

关于2个模型--嗯,可能有可能进行2次过滤--首先是设置权重的信号,然后根据这些权重进行交易(在第二次称重时由输入启动)......尽管看起来有可能根据背景 学习交易-- 并为早期时间序列保留梯度--好主意......但是,在处理上下文时,通常还是有点不同的--任务是使用 "交易及其上下文 "编码,第二个RNN接受第一个的处理结果,在输出中进行解码--但这与在两个不同的任务(例如,上下文和交易)上使用两个网络没有什么关系,因为事实上它是通过两个网络 "交易和上下文"(作为一对!!!)进行处理--传递的...。- 它只解决了速度问题 ,但没有解决(或在较小程度上)输出的有效性问题...我认为...

但如果你真的想把上下文和事务的处理分开(上下文分开,事务分开)--到目前为止,这样的结构让我想起了一个三明治(或油和黄油,润滑现象之间的相互关系和依赖关系--分两层)...我并不假装解释你的TechSuite,但我已经表达了我的担忧和建议,它可能仍然值得在建模过程中保留--即关系!......。我祝愿你有一个美丽的(反映现实的!而不是奶油色的)网络架构!"。

p.s.)作为一个永恒的问题的 "上下文广告" - "主要的是不要脱离现实" (只有他们的规模设置有时是歪的 - 我不会指责谁- 或与小样本在错误的方向工作)

在时间序列的情况下,背景的概念也许不是很有用。那里没有明确的划分,两种模式都参与了预测。一个是方向,另一个是时机。我想说它们是等同的。问题是如何在分析模型误差的基础上优化搜索最佳交易情况,以及是否有可能。我可以按顺序重新训练一个或另一个。在每一对重新训练之后,结果必须在新的数据上有所改进。这意味着它必须能够从训练样本中提取模式,并逐渐改进它未曾见过的新数据。这是一项非同小可的任务。

我已经把第一个模型预测不佳的例子抛出,纳入第二个模型的 "不交易 "类别。扔掉了第一个模型的吊环样品。第一个人的错误相应地降到了几乎为零。第二个也有一个小的。但这并不意味着它在新的数据上会有好的表现。

这是某种组合问题:在正确的时间找到正确的买入和卖出。

也许在这里不可能找到解决办法
 
Maxim Dmitrievsky #:
规律性的概念意味着可重复性,这很重要!

如果一个聚类能够以90%的概率预测某事,并且至少重复200次,我们就可以认为这是一个模式。
或者说它不是一个集群,是一个日志。

当你处理一个复杂的模型时(复杂来自于 "复杂 "这个词),你失去了固定内部模式的重复性的能力,换句话说,你失去了区分模式和拟合的能力...

理解了这一点,你就可以马上明白,神经网络是要进垃圾桶的,但木质模型可以分解成规则,而规则已经可以统计了
 
mytarmailS #:
规律性的概念意味着可重复性,这很重要!

如果一个聚类能够以90%的概率预测某事,并且至少重复200次,我们就可以认为这是一个模式。
或者说它不是一个集群,是一个日志。

当你处理一个复杂的模型时(复杂来自于 "复杂 "这个词),你失去了固定内部模式的重复性的能力,换句话说,你失去了区分模式和拟合的能力...

理解了这一点,你可以立即意识到,神经网络会被扔进垃圾桶,但木质模型可以被分解成规则,而规则已经可以统计了
但是,如果没有简单的依赖关系,很多功能可以被塞进ns,尽管没有分析的可能性。否则,我们将抛弃所有的机器学习,回到简单的TS编写方式 :)然后我们就可以写一些简单的算法,观察它们在测试器中是如何(不)工作的,调整,再观察,等等。
 

无论你怎么看,统计都是线性的......神经网络是哑巴(或聪明--取决于开发者)加权......使用2层或更多层的Dense ns进行加权,可以得到非线性 的依赖关系(从传统意义上讲,因为依赖关系是OR哑巴的关联性仍然是一个非常大的问题)......但是,只要即使是一个愚蠢的关联工作 - 你可以尝试在上面赚钱...- 必须及时发现它停止工作的时刻(你需要注意到某种异常情况--随机的或系统的--这是另一个问题--然后,像往常一样,决定你的风险/盈利性问题)

ns的方便之处在于它的灵活性--你可以获得/提供相当不同的 "命名 "给输出。它很灵活--你可以从输入中获得/提供相当不同的 "命名法"--也就是说,你可以在网络本身做我们需要的转换......并在多线程模式下进行(取决于库的情况)...不仅仅是统计数字...

你是否需要统计学来寻找输入是另一个问题...

知识和经验比统计处理更有帮助--因为前者关注的是具体细节,后者关注的是还原到一个共同的分母......。

一切都有它的位置--统计也是如此...

***

问题是,对于机器人来说--没有其他方式可以解释(它也不会用其他方式解释你),除了通过数字得出的概率......--这就是经济学如何为世界服务--用数字0和1......所以我们必须将输入数字化以获得输出概率,并设定置信区间的 条件(我们相信它,不一定是统计数据)。我们可以相信任何东西(这是主观的)--要么是二进制逻辑,要么是这个二进制逻辑的加权结果(也就是整个潜在解决方案的百分比概率)......-- 这只是一个品味和习惯的问题,而不是一个关于寻找圣杯的争论主题......

(而进入森林或进入神经网络已经是一个细节)

没有人禁止在同一个项目中联合使用树木/森林和神经网络......- 问题是在哪里和什么时候应用什么(速度和内存很重要),而不是哪个更好......- 最好不要失去时间--相当于 "离开交易的时间就是失去的时间,就像离开时间的交易就是未知的交易"

 
这么长的咆哮,这么弱的结论 :)即使我们从时间中抽象出来,一个模型(正则化,不拟合)也不能教出一个好的盈利和不盈利的交易比例,或者排除不盈利的交易。你无法摆脱分类误差,即使在追踪样本上,也会被认为是TS交易结果 的人为恶化。
 

任何模型都不能得到超过概率的东西(这是任何数字化的优势和劣势),即使这些概率没有经过加权...我不会用三明治毒害自己,也不会建议任何人--没有人取消贝叶斯(即使你不把它放在代码中,特别是--如果你把它放在代码中)...

p.s. 而你一定是麦当劳的粉丝...- 假设,我不会检查它...

算法比你的结论更重要

 
JeeyCi #:

任何模型都不能得到超过概率的东西(这是任何数字化的优势和劣势),即使这些概率没有经过加权...我不会用三明治毒害自己,也不会建议任何人--没有人取消贝叶斯(即使你不把它放在代码中,特别是--如果你把它放在代码中)...

p.s. 而你一定是麦当劳的粉丝...- 假设,我不会检查它...

算法比你的结论更重要。

三明治被广泛使用,任何深网。不同的任务有不同的窍门。但如果你狭隘地想,任何复印机都是复印机,任何汉堡都是麦当劳。
你可以成为你自己定型观念的人质,而不去尝试任何东西。而定型观念并不是来自于分层😀。
在我的回答中,我隐含地使用了第二个澄清模式,从一般化的知识中挑出了具体的、更适合的情况