交易中的机器学习:理论、模型、实践和算法交易 - 页 3005

 
Maxim Dmitrievsky #:
这是在呼吁大家在把初始数列转化为图形、量子、水平、正弦或其他你发明的东西之前先思考一下。
问题设置不正确,我在这里已经说了很久,上一次是在 10-20 页之前,所以没什么好教的,我自己完全明白一切......

要转换任务,就必须转换数据...

所以,当你让我考虑的时候,我已经考虑过了,我正在考虑我的选择。
 
mytarmailS #:
事实上,任务的设置并不正确,这一点我在这里已经说了很久,上一次是在 10-20 页之前,所以好像没有什么可以教我的,我完全明白一切.....。

要转换任务,就必须转换数据...

所以,当你让我思考的时候,我已经想好了,我正在浏览选项。
同样,你会得到记忆,而不是概括。
 
Maxim Dmitrievsky #:
如果数据中存在恒定的信号,则几乎立即意味着泛化,而噪声则会导致错误。如果没有信号,就会出现记忆化,即分类错误仅仅是重叠了具有不同标签和相同特征值的样本。第二个模型没有预测价值。这就是我提出的问题的答案。

在有模式(小波、小形状等)但没有信号的情况下,只有分为训练有素和未经训练两种模式才能起作用。可训练的被分类,不可训练的被过滤。在这里,良好的记忆可以起到过滤的作用,而泛化则是模式的泛化。

当没有明显的持续模式(如市场),但存在低效率时,方法必须更加精细,因为低效率不一定能用模式来描述。在这种情况下,你必须从中找出一个:哪些需要记住,哪些需要归纳。算法。

对数据进行转换会改变其表现形式,但本身并不能解决问题,因为最终要交易的是原始数据序列。

规律具有浮动概率,可能是周期性的,也可能完全消失。我工作的时间范围很大,也观察到了这些现象。

我想说的是,有可能训练出一个 2008-2017 年(10 年)的模型,它可以一直运行到今天。这样一个模型的信号会很少--召回率最多不超过 30%,但这也说明,10 年中能在未来几年(测试样本)发挥作用的模式很少。

但究竟是哪种模式--周期性的还是一次性的(也许周期为数十 年)--目前还无法确定,因此也就不可能选择一种持续有效的模式。

理想情况下,有必要找到至少每 3 个月出现一次的周期性模式,这样我们就可以期望模型能够摆脱缩减。

根据不同的周期模式训练出的一揽子此类模型将减少缩减。

因此,重要的是初始信号 + 目标 + 相对于目标具有周期性正规律的预测因子。


你的方法--摇晃和筛选--类似于探矿者的工作--当然,你可以找到很多有趣的和没有学到的东西,但你怎么能确定这些东西会是稳定的呢?

我喜欢自己破解日期,我有这方面的想法,但现在我想朝着提高模型稳定性概率的方向挖掘。

 
Aleksey Vyazmikin #:

你的方法--摇晃和筛选--就像一个探矿者的工作--当然你可以找到很多有趣的和没有学到的东西,但如何确保它的稳定性呢?

我自己喜欢 "摇枣",也有这方面的想法,但现在我想朝着提高模型稳定性概率的方向挖掘。

我写了一个基本的理解,如果没有这个理解,就根本不值得做任何事情。如果只是为了确认每一点的话(如果你第一次没有理解的话 🙂 )

要验证稳定性,就必须进行测试、测试和更多的测试,除此之外别无他法。MO 最适合做这个。

因为理论界的抱怨者们显然连 MO 的基本原理都不懂,就大谈特谈 tsos 和其他废话。这种娱乐不适合精神和道德上的弱者,发牢骚更容易:)。
 
Maxim Dmitrievsky #:
我写了一个基本的理解,没有它就根本不值得做任何事情。如果只是为了确认每一点的话(如果你第一次没有理解的话 🙂)

要验证稳定性,就必须进行测试、测试和更多的测试,除此之外别无他法。MO 最适合做这个。

我对您的描述和方法总体上没有异议--我自己也在很久以前对其进行了本质上的描述,尽管实现方式不同。

我的人工实验表明,通常情况下,只要抽取出具有 10 个简单规律性的行(在我的案例中,就是预测值下降的量子段),整个样本的概率就会向 1 的方向移动 15-20%,而样本则会减少 35%。机器学习方法无法实现这一点。从本质上讲,这是对无用/矛盾数据的剔除。但我们想在更接近当前日期的情况下做到这一点,即不是通过统计了解历史,而是通过一些方法只选择虚假/矛盾的模式。

如果我们设定一个任务,根据这个任务,模型应该在任何仪器上都能工作,那么测试是可能的,但这样稳定的模式就更少了。而只是在历史中狂奔,或者更糟糕的是,进行合成--我不认为这是有效的。顶多是可以通过洗日的方式从每日增量中提取合成数据,但我还没有这种能力。您尝试过吗?

 
mytarmailS #:
我完全不懂,但我想知道价格是否可以用图表来表示,与通常的二维表示法相比是否有任何优势。
谁知道这方面的情况?

您可以将曼德尔布罗特(Mandelbrot)的价格表示法视为三元树森林,其中每一步棋都分为三步(同方向的两步棋和两步棋之间的修正)。

这样做的好处是可以收集有关价格分形结构的统计数据。缺点是算法复杂,难以避免瞻前顾后。

 
Stanislav Korotky #:

这与我上面举的 "并行 "平台的矩阵和例子有什么关系?

例如,我从 keras 的链接中获取矩阵,并调用它们:

并得到零。

对照示例不适合。

分类交叉熵用于有两个以上类别的分类模型。而在 softmax 之后。Softmax 将一组值转换为一组概率,其总和为 1。

试试这样一个控制示例

pred: 0.1, 0.1, 0.2, 0.5, 0.1

true: 0, 0, 1, 0, 0, 0

 
Aleksey Vyazmikin #:

最多,我们可以通过调整天数,从每日增量中提取合成数据--但我还无法做到这一点。你尝试过吗?

我不明白这样的假设是基于什么,而且这又是在利用特质,而不是改进学习方法。所以这是次要的。

这就像学校一样。你可以用一本教科书来教,也可以用另一本教科书来教。信息在本质上不会改变,就像变换一样。但它会飞进一个脑袋,又从另一个脑袋飞出来:)

在最终目标不明确的情况下,很难使用综合法。最好的办法是用它来测试序列的某些属性,将其混合到不同的部分,看看结果会如何变化。比如如果?对齐数据中的偏移。
一般来说,通过减少对原始数据的记忆来提高通用性是很有用的,但就创建现成的 TS 而言,它仍然是不完整的。在原始数据上训练不同的模型集合(包括简单到线性模型),也能得到类似的结果。

好了,你知道大概的答案了吧,通过它仍然不可能得到极好的东西,但改进它是可能的。

 
Aleksey Nikolayev #:

我们可以将曼德尔布罗特的价格表示法视为三元树的森林,其中每一次移动都被分解为三次(两次同方向移动和中间的修正)。

这样做的好处是可以收集价格分形结构的统计数据。缺点是算法复杂,难以避免瞻前顾后。

能否以关联规则的形式呈现?
 
mytarmailS #:
可以用关联规则来表示吗?

我没有想过这个问题,但我认为不太可能,因为运动的顺序对价格很重要。

为了以防万一,我想用一幅图来说明曼德布罗特的想法。如果可能的话,每个价格变动都会被分成三个变动(通过选择其中的最大修正),然后成为树的一个节点。如果运动中没有修正(或修正小于给定值),则成为树的叶子。