交易中的机器学习:理论、模型、实践和算法交易 - 页 3070

 
Maxim Dmitrievsky #:

我不是在讨价还价。你让我教--把标志给我,我来教和测试。如果结果不错,我就把源代码给你。

如果有正常的标志,就不可能有很多。我不需要有 6k 个符号的数据集,我没时间做这个

否则我会做其他事情。

我不需要一行一行的体征--用 python 重现这些体征要花费更多时间。在我的数据上测试该方法的有效性,然后再决定是否实现预测计算代码,这更符合逻辑。

如果我有比别人更 "好 "的预测器,我也不会急于公开它们:)您可以这样做--给我一个结果可以接受的模型,然后从模型中 按重要性(根据其定义方法之一)找出 20 个预测因子。

此外,我还想了解所提方法在二元预测因子上的有效性--二元预测因子是预测因子的量子段,而这种技术的复制速度并不快,因此最好使用数组--但在这里,我感兴趣的是大量预测因子的结果。

如果有些东西会很有趣,那么我们就可以花时间和精力去研究预测器的计算逻辑及其实现。

 
Aleksey Vyazmikin #:

我没有一行的功能--你会花费更多时间在 python 中重现这些功能。在我的数据上测试该方法的有效性,然后再决定是否实施计算预测因子的代码,这样更符合逻辑。

如果我有比别人更 "好 "的预测器,我也不会急于公开它们:)您可以这样做--给我一个结果可以接受的模型,然后从模型中 按重要性(根据其中一种定义方法)找出 20 个预测因子。

此外,我还对所提方法在二进制预测因子上的有效性感兴趣--二进制预测因子是从预测因子中提取的量子段,这种技术的复制速度并不快,因此最好使用数组--但在这里,我对大量预测因子的结果感兴趣。

如果有些东西会很有趣,那么我们就可以花时间和精力去研究预测器的计算逻辑及其实现。

非常闷。举 10-20 个你自己的特质计算例子。你可以有一个不同时期的例子。关于计算符号的输入公式。

大量的二元性状将不被计算在内。


从这 3K 个模型中找出几个最重要的结果:

即使对标签进行不同的取样,也能发现相同的 "模式"。所有图形都很相似。那么在其他芯片上会有其他图片。



 
Aleksey Vyazmikin #:

此外,我还对所提出的方法在二进制预测器上的有效性感兴趣--二进制预测器是来自预测器的量子段、

是不是把芯片分成 16 个量子(例如),然后用 16 个芯片除以 0 和 1?
其中,如果主芯片的值在所需的量子中,则为 1,如果在任何其他量子中,则为 0?

 
Forester #:

这是否是将一个片段分为 16 个量子(例如),然后再将其分为 16 个带 0 和 1 的片段?
如果主要特征的值在所需的量子中,则为 1,如果在任何其他量子中,则为 0?

这样做的目的是从 16 个片段中选出几个有潜力的片段。关于编码,是的,就是这样。

 

Maxim Dmitrievsky #:

虚线左边的观测系统

OOS 本身(原始数据)是如何形成的?
 
Maxim Dmitrievsky #:

非常闷。举出 10-20 个自己的特质计算例子。你可以有一个不同时期的例子。输入是计算性状的公式。

我不会考虑大量的二进制符号。


从这些 3K 模型中得出的一些最重要的结果:

即使标签取样不同,也能找到相同的 "模式"。所有图表都很相似。那么在其他芯片上会有其他图片。



试试指标 - Python 有一个ta 库。

GitHub - bukosabino/ta: Technical Analysis Library using Pandas and Numpy
GitHub - bukosabino/ta: Technical Analysis Library using Pandas and Numpy
  • bukosabino
  • github.com
It is a Technical Analysis library useful to do feature engineering from financial time series datasets (Open, Close, High, Low, Volume). It is built on Pandas and Numpy. The library has implemented 42 indicators: Volume Money Flow Index (MFI) Accumulation/Distribution Index (ADI) On-Balance Volume (OBV) Chaikin Money Flow (CMF) Force Index...
 
fxsaber #:
OOS(输入数据)是如何形成的?

按照传统方法,一组收盘价的属性数据

 
Aleksey Vyazmikin #:

试试指标 - python 有一个ta 库。

哪些是你的?)

 
Aleksey Vyazmikin #:

我们的想法是从 16 个片段中挑选出几个有潜力的片段。关于编码,是的,没错。

然后,您可以将 1 个特征分为 16 个量子,对它们进行编号并标记为分类。树同样会对每个类别/量子进行检查(==0 或 ==1 或 ==2 ....)。您也可以将不感兴趣的量子归为一类。

结果将是 1 中 1。或者几乎是 1 中 1,以牺牲无趣的量子为代价,结果可能是树会选择它作为最好的量子。

好的一面是,只有 1 个芯片,计算速度更快。文件大小和内存消耗也会大大减少。

 

15 年的 OOS

结果发现,这种方法很奇特,但对特质却很敏感。只是这种方法对回归者不起作用。