MQL5 开发的自动交易示例的文章

EA 是编程的 '巅峰'，并且是每一个自动交易开发者的渴望目标。请阅读本部分中的文章，创建您自己的交易机器人。通过下面介绍的步骤，您将了解到如何创建，调试和测试自动交易系统。

这些文章不仅教导 MQL5 编程，而且也演示了如何实现交易思想和技巧。您将了解如何编写跟踪止损，如何运用资金管理，如何获取指标值，等等。

在上一篇文章中，我们概述了 DDPG 方法，它允许在连续动作空间中训练模型。然而，与其它 Q-学习方法一样，DDPG 容易高估 Q-函数的数值。这个问题往往会造成训练代理者时选择次优策略。在本文中，我们将研究一些克服上述问题的方式。

最近两篇文章专门介绍了决策转换器方法，其在期望奖励的自回归模型境况下针对动作序列进行建模。在本文中，我们将研究该方法的另一种优化算法。

在本文中，我们将继续讨论收集数据至训练集之中的方法。显然，学习过程需要与环境不断互动。不过，状况可能会有所不同。

本文是范畴论系列文章之以 MQL5 实现图论的部分，深入研讨秩序（Orders）。我们通过研究两种主要的秩序类型，实测秩序论的概念如何支持幺半群集合，从而为交易决策提供信息。

最后两篇文章研究了软性扮演者-评论者算法，该算法将熵正则化整合到奖励函数当中。这种方式在环境探索和模型开发之间取得平衡，但它仅适用于随机模型。本文提出了一种替代方式，能适用于随机模型和确定性模型两者。

我们继续讨论解决连续动作空间问题的强化学习算法。在本文中，我将讲演软性扮演者-评论者（SAC）算法。SAC 的主要优点是拥有查找最佳策略的能力，不仅令预期回报最大化，而且拥有最大化的动作熵（多样性）。

在本文中，我们将见识到如何制定一个品质得分，并由您的智能系统从策略测试器返回。我们将查看两种著名的计算方法 — Van Tharp 和 Sunny Harris。

对比训练是一种无监督训练方法表象。它的目标是训练一个模型，突显数据集中的相似性和差异性。在本文中，我们将谈论使用对比训练方式来探索不同的扮演者技能。

强化学习中的环境研究是一个紧迫的问题。我们之前已视察过一些方式。在本文中，我们将讲述另一种基于最大化核范数的方法。它允许智能体识别拥有高度新颖性和多样性的环境状态。

本文中的多币种 EA 是一款智能交易系统或交易机器人，可以仅从一个品种图表中交易（开单、平单和管理订单，例如：尾随止损和止盈）多个品种（对）。在本文中，我们将用到来自两个指标的信号，在本例中为凯尔特纳（Keltner）通道上的布林带®。

在上一篇文章中，我们领略了决策变换器。但是，外汇市场复杂的随机环境不允许我们充分发挥所提议方法的潜能。在本文中，我将讲述一种算法，旨在提高在随机环境中的性能。

本文是以 MQL5 实现范畴论系列的续篇。于此，我们验证在开发交易系统的平仓策略时，图论如何与幺半群和其它数据结构集成。

在此，我将研究相当新颖的随机边际扮演者-评论者（SMAC）算法，该算法允许在熵值最大化的框架内构建潜在变量政策。

使用准备好的训练数据集中的数据对模型进行离线训练，这种方法虽然有一定的优势，但其不利的一面是，环境信息被大大压缩到训练数据集的大小。这反过来又限制了探索的可能性。在本文中，我们将探讨一种方法，这种方法可以用尽可能多样化的数据来填充训练数据集。

本文中的多币种 EA 是智能交易系统或交易机器人，能从一个品种的图表里交易（开单、平单、及管理订单，例如：尾随止损和止盈）多个品种（货币对）。这次我们只会用到 1 个指标，即多时间帧或单一时间帧中的三角移动平均线。

若干交易员同事发送电子邮件或评论了如何基于经纪商提供的名称里带有前缀和/或后缀的品种使用此多币种 EA，以及如何在该多币种 EA 上实现交易时区或交易时段。

我们将继续讨论决策转换器方法系列。从上一篇文章中，我们已经注意到，训练这些方法架构下的转换器是一项相当复杂的任务，需要一个大型标记数据集进行训练。在本文中，我们将观看到一种使用未标记轨迹进行初步模型训练的算法。

在本文中，我们将领略一个有趣的算法，它是在监督和强化学习方法的交叉点上构建的。

1 2 3 4 5 6 7 8 9