文章 "神经网络变得简单(第 59 部分):控制二分法(DoC)"

 

新文章 神经网络变得简单(第 59 部分):控制二分法(DoC)已发布:

在上一篇文章中,我们领略了决策变换器。但是,外汇市场复杂的随机环境不允许我们充分发挥所提议方法的潜能。在本文中,我将讲述一种算法,旨在提高在随机环境中的性能。

控制二分法是斯多葛学派(Stoicism)的逻辑基础。它意味着一种思辨,即我们周围的一切存在都可以分为两部分。第一个受制于我们,完全在我们的控制之下。我们无法全面控制第二个,无论我们采取什么动作,事件都会发生。

我们正在操控第一个领域,同时认为第二个是理所当然的。


“控制二分法”方法的作者在他们的算法中实现了类似的假设。DoC 允许我们区分策略控制下的内容(动作政策),以及超出其控制的内容(环境随机性)。

作者:Dmitriy Gizlyk