文章 "神经网络变得轻松(第三十二部分):分布式 Q-学习"

 

新文章 神经网络变得轻松(第三十二部分):分布式 Q-学习已发布:

我们在本系列的早期文章中领略了 Q-学习方法。 此方法均化每次操作的奖励。 2017 年出现了两篇论文,在研究奖励分配函数时展现出了极大的成功。 我们来研究运用这种技术解决我们问题的可能性。

当测试 EA 在 MetaTrader 5 策略测试器中取两周区间数据运行时,基于模型信号进行交易,它产生了约 20 美元的利润。 所有操作都是最低手数。 下图展示出余额值有明显上升趋势。

策略测试器中的模型测试

分布式 Q-学习模型的测试

交易操作统计数据显示,近 56% 的操作是盈利的。 然而,请注意,EA 仅在策略测试器中测试了模型,尚不适合金融市场的真实交易。

作者:Dmitriy Gizlyk