文章 "神经网络变得轻松（第三十二部分）：分布式 Q-学习"

MetaQuotes 2023.02.28 08:49

新文章神经网络变得轻松（第三十二部分）：分布式 Q-学习已发布：

我们在本系列的早期文章中领略了 Q-学习方法。此方法均化每次操作的奖励。 2017 年出现了两篇论文，在研究奖励分配函数时展现出了极大的成功。我们来研究运用这种技术解决我们问题的可能性。

当测试 EA 在 MetaTrader 5 策略测试器中取两周区间数据运行时，基于模型信号进行交易，它产生了约 20 美元的利润。所有操作都是最低手数。下图展示出余额值有明显上升趋势。

策略测试器中的模型测试

分布式 Q-学习模型的测试

交易操作统计数据显示，近 56% 的操作是盈利的。然而，请注意，EA 仅在策略测试器中测试了模型，尚不适合金融市场的真实交易。

作者：Dmitriy Gizlyk