文章 "神经网络变得轻松（第五十二部分）：研究乐观情绪和分布校正"

MetaQuotes 2024.04.08 14:15

由于模型是基于经验复现缓冲区进行训练，故当前的扮演者政策会越来越远离存储的样本，这会降低整个模型的训练效率。在本文中，我们将查看一些能在强化学习算法中提升样本使用效率的算法。

如常，我们对模型在新数据上的绩效更感兴趣。依据 2023 年 6 月的历史数据在策略测试器中测试了模型对陌生数据的普适能力和绩效。正如我们所见，测试区间紧随训练集之后。这确保了训练和测试样本的最大同质性。测试结果呈现如下。

测试结果

所呈现的图表展示出月度前十天有一段回撤区域。但之后是一段盈利期，一直持续到月底。因此，EA 在本月收获了 7.7% 的盈利1，最大净值回撤为 5.46%。就余额而言，回撤幅度更小，不超过 4.87%。

测试结果

测试结果表格显示，在测试期间，EA 在两个方向上均执行了交易。共有 48 笔开仓。其中 54.17% 盈利了结。最大盈利交易比最大亏损交易高出 3 倍以上。平均盈利交易是平均亏损交易的一半。就量化值来说，平均每 3 笔盈利交易就有 2 笔无盈交易。所有这些都给出了 1.74 的盈利因子，和 1.41 的恢复因子。

作者：Dmitriy Gizlyk

新评论