文章 "神经网络变得简单(第 63 部分):决策转换器无监督预训练(PDT)"

 

新文章 神经网络变得简单(第 63 部分):决策转换器无监督预训练(PDT)已发布:

我们将继续讨论决策转换器方法系列。从上一篇文章中,我们已经注意到,训练这些方法架构下的转换器是一项相当复杂的任务,需要一个大型标记数据集进行训练。在本文中,我们将观看到一种使用未标记轨迹进行初步模型训练的算法。

至于优调期间,我需要连续数十次下游训练和测试迭代,这也需要时间和精力。

然而,学习结果并不那么乐观。作为训练的结果,我得到了一个模型,其按最小手数交易,并取得了不同的成功率。在历史的某些部分,余额曲线展示出明显的上升趋势。在另一些部分,则明显下降。泛泛来说,依据训练数据和新集合,模型的结果都接近于 0。

积极的方面包括模型将获得的经验转移到新数据的能力,这可以通过训练集的历史数据集,和后续历史间隔上的测试结果的可比性得到证实。此外,您可以看到盈利交易的规模远大于亏损交易的规模。在两个历史数据段中,我们观察到平均获胜交易的规模超过了最大亏损。然而,所有积极方面都被盈利交易的低占比所抵消,在两个历史区间中,盈利交易的份额都恰恰低于 40%。

Результаты тестирования на новых данных Результаты тестирования на новых данных

作者:Dmitriy Gizlyk