交易中的机器学习:理论、模型、实践和算法交易 - 页 2374

 

普拉达交易标记

4 simple ways to label financial data for Machine Learning ⋆ Quantdare
4 simple ways to label financial data for Machine Learning ⋆ Quantdare
  • quantdare.com
We have seen in previous posts what is machine learning and even how to create our own framework. Combining machine learning and finance always leads to interesting results. Nevertheless, in supervised learning, it is crucial to find a set of appropriate labels to train your model . In today’s post, we are going to see 3 ways to transform our...
 
Maxim Dmitrievsky:

普拉达交易标记

这个东西 更有趣。我只是不明白,它只在命令行中工作吗?有人看了吗?

SigCWGAN, a new generation GAN architecture for Time Series Generation. ⋆ Quantdare
SigCWGAN, a new generation GAN architecture for Time Series Generation. ⋆ Quantdare
  • quantdare.com
As a continuation to our last post on Time Series Signatures and our running list of posts regarding GANs and synthetic data we now want to present the Signature Conditional Wasserstein GAN, shortened as SigCWGAN, a new GAN architecture presented in [1] that is specifically designed to generate time series of arbitrary length and dimensions. 2...
 
Vladimir Perervenko:

这个材料 更有趣。

这是另一个话题,并不限于GANs。

 
Maxim Dmitrievsky:

普拉达交易标记

晦涩的语言和不熟悉的功能...而作者是在误导。

在fixed_time_horizon()中,有这样一行。

idx_lower = data[data[name] < - threshold].index

他在上面写道

阈值: int
用于计算标签的预定义常数阈值。

而下面的图片不是int (即0,1,2,3...),而是0.05,0.01...。

它变得更加清晰,有了双倍--这和我用TP=SL=价格变化的某个值做的事情一样。

但不清楚我为什么要调用方法和函数fixed_time_horizon();固定时间在哪里?这是一个固定的价格变化,而不是时间。

---------

至于quantized_labelling()方法--我没有从代码中得到什么。我想这不是一个固定的值,例如0.05,而是使用随价格波动而变化的四分法。

 
elibrarius:

晦涩的语言和不熟悉的功能...而作者是在误导。

在fixed_time_horizon()中,有这样一行。

idx_lower = data[data[name] < - threshold].index

他在上面写道

阈值: int
用于计算标签的预定义常数阈值。

而下面的图片不是int (即0,1,2,3...),而是0.05,0.01...。

有了双倍 - 变得更清楚了 - 这和我用TP=SL=价格变化的某个值做的事情一样。

但不清楚我为什么要调用方法和函数fixed_time_horizon();固定时间在哪里?这是一个固定的价格变化,而不是时间。

---------

至于quantized_labelling()方法--我没有从代码中得到什么。我想这不是一个固定的值,比如说0.05,而是随着价格波动不断变化的量化值。

我还没有研究过这些代码。最主要的是标价不是按图表而是按增量。这导致了一些有趣的功能,例如,将标记应用于一个挤压的图表或一些特定的BP组件上

肯定有一个错字,这不是普拉多写的,是类型。

固定范围指的是选定的增量滞后,可能是

 
Maxim Dmitrievsky:

我还没有读过代码。主要的不是按图表分区,而是按增量分区。这导致了一些有趣的功能,如将分区应用于压制的图表,或应用于特定的BP组件。

肯定有一个错误的信息,不是普拉多写的,是类型。

固定水平线指的是选定的增量滞后,我想。

外面的人不是普拉多就是他的类型。

 

通过quantized_labelling()方法

我认为教它没什么意义。毕竟,你可以在低波动性时很好地学习分类,而在高波动性时则更糟。而后在低波动率下40%的错误+高波动率下51%的错误将使系统盈利能力恢复到0左右,因为许多小的收益可能会被几个大的损失所超越。
 
elibrarius:

外面有人很愚蠢,或者普拉多或他的类型。

所有的东西都是zshibizzy,我们应该试试,但我会用不同的方式来做。

他的书有点不同,我想。我懒得去看。
 
Maxim Dmitrievsky:

这很好,我可以试试,但我会用不同的方式来做

他的书中有不同的描述,我想。我懒得去找了。
TP=SL=固定值 我试过了。在新的交叉验证数据上,其结果是50%。
关于定量,我看不出有什么意义,见上面的帖子
 
elibrarius:
TP=SL 我试过。在新的交叉验证数据上,其结果是50%。
关于定量,我看不出有什么意义,见上面的帖子

以下是增量,不包括sl和tp

我是通过集群做的,标出来的。总的来说,标记过的数据的曲线不是很好,但在新的数据上比较稳健。