交易中的机器学习:理论、模型、实践和算法交易 - 页 1248

 

我认为,如果过度训练是由于噪音导致的记忆市场的后果,那么记忆市场需要一定量的记忆,其形式是决策树和提升的森林,而单树和神经元数量少的神经网络等模型应该是较少过度训练。然后,事实证明,有一个关键的数据量不能被描述,比如说,一张--这个1%或10%的量是什么--整个样本(训练、测试、对照)的问题。那么,也许我们应该根据记忆这些数据所需的内存量来评估数据,并尝试使模型的数量级小于这个临界量?如何做到这一点--我不知道,也许归档应该有类似的东西--如果归档器将一个10mb的样本压缩成1mb,那么模型必须不超过102.4kb。然后,知道模型不只是记住了样本,而是发现了其中的规律性,我们就可以对独立样本的测试不那么挑剔,得出的结论不是过度训练,而是缺乏用于训练的样本数据,因为没有描述当前市场状态的情况,所以根本不可能用现有的预测器找到这种模式。

 
现在根据收到的床单做一个手工模型,结果发现,从2014年到2018年,每年大约有20张床单要买,5张床单作为过滤器可以产生,这里我想,不可能是过度训练,也不可能有足够的床单用于拟合,不知为何...那么,这是一个将在2019年失去效力的模式吗?
 
马克西姆-德米特里耶夫斯基

一个模式必须有一些基本的前提条件,例如,市场上的一些周期是基本的,或者对新闻的反应,日内波动......诸如此类的东西。

而如果规律性的东西不清楚从何而来,那么就不清楚接下来会发生什么。

关于树的模型和处理识别模式的问题,一个预测器讲述一个事件,一组特定的事件给出一个模式。只是这是一个不是来自物理现象领域的规律性,它不可能是恒定的,因为它可能受到未知因素的影响(现有预测器无法描述的现象)。

总的来说,重点是统计学上经常发生的事件是通过MO的分类方法检测出来的,这比仅仅用优化器指标来拟合市场要好一些,还是不行?
 
马克西姆-德米特里耶夫斯基

夏天的短裙数量与公民的财务状况之间的相关性可能是90%,但这并不意味着有关联,更不意味着有模式

好吧,让我们把 "模式 "这个词换成 "预兆",作为一个不可知的事件的关联。

马克西姆-德米特里耶夫斯基

优化器也是一个MO。

所以你把这两种方法等同起来?

 
马克西姆-德米特里耶夫斯基

不是我,是这样的......优化器最小化任何F函数,神经网络优化器优化权重F函数。

如果我们只讨论TC滤波器的优化,那么我们可以部分同意相同的行动,但如果输入/输出点也被优化,那么情况就与通常的MO略有不同。

 
马克西姆-德米特里耶夫斯基

在这种情况下,有必要研究数据挖掘和应用于市场,如果有可能的话,因为数据挖掘1的曲线也是那种最笨的,但可以提取一些信息 )

学习是为了在另一个领域应用?

 
马克西姆-德米特里耶夫斯基

了解如何从数据中提取有用的东西

所以我早些时候指出,我提取了一些有用的东西--也许是一粒金子,也许是一种侥幸......谁知道呢......没有办法确切地知道。

 
假设市场都是一样的,价格行为也有类似的模式,为什么不把十几种工具合并到一个样本中,在所有市场中寻找共同的 "迹象 "呢?
 
Vizard_

这就是它的做法--它是泛化的。"模式 "是指从不同的样本中发现的模式...所以你刚刚在趋势样本中进行了匹配,现在你给我们一个头疼的)))))。但你仍然需要仔细准备数据,因为这个想法...虽然你可能是万无一失,但不太可能...

我有2016-2017年的培训,然后只是检查了2014-2018年的单子,并选择了那些每年都盈利并符合其他一些标准(整体增长/没有重大缩水)的。所以我在想,这样的模式是否可以使用。

至于结合不同的工具,这里的许多预测器是在不同的时间间隔内的点数收益,它不会对不同的工具起作用......。

 
马克西姆-德米特里耶夫斯基

当然,所有的市场都是不同的,模式也是不同的,对一个人有效的东西,对另一个人来说就是一种损失。

要假设什么,就需要假设什么,作为这种粗略假设的基础

因此,我假设任何地方的主体都是一样的--一个交易员,那么他为什么要根据工具的不同而改变自己的行为呢?如果他使用技术分析或任何其他方法,但他在任何地方都使用这种方法,这是不一样的,他可以在不同的时间使用一套方法,在一个工具上适合一种方法比较容易,当交易员(集体形象)切换到另一种方法时,模型就会被打破。