交易中的机器学习:理论、模型、实践和算法交易 - 页 1068

 
FxTrader562:
顺便说一下,我正在尝试使用1000个功能,现在培训已经进行了1个小时。

你可以只设置一个代理CRLAgents *ag1=new CRLAgents("RlExp1iter",1,100,50,regularize,learn)。


并在库中设置 #define _models 1

所以它将是快速的

 
Maxim Dmitrievsky:

当然,你可以为每个预测器使用不同的值,这只是一个简单的例子,每个接近的值=1个分歧的预测器值

所以数字100或1000或500等在代码copyclose 和声明中都必须是相同的,对吗?

 
FxTrader562:

所以数字100或1000或500等在代码copyclose和声明中都必须是相同的,对吗?

 
马克西姆-德米特里耶夫斯基

好的,但在你目前的示例代码和实现中,我不确定在训练期间到底发生了什么,以及代理和模型之间的区别是什么:)

我希望你在发表文章时能解释这一点。我的意思是一个代理在做什么,一个模型在做什么,使用内核...

 
FxTrader562:

好的,但在你目前的示例代码和实现中,我不确定在训练期间到底发生了什么,以及代理和模型之间的区别是什么:)

我希望你在发表文章时能解释这一点。我的意思是一个代理在做什么,一个模型在做什么,使用内核...

每个RL代理可以有唯一的预测器,那么我们对所有代理的结果进行平均。

现在忘了吧,因为我们做的是gdmh

 
Maxim Dmitrievsky:

每个RL代理可以有唯一的预测器,那么我们对所有代理的结果进行平均。

现在,我们正在考虑这个问题,因为我们正在制作Gdmh。

是的,没错......你可以尝试使用GDMH,并让我知道,如果你在实施过程中取得进展或陷入困境,因为无论如何,在看到LIVE结果后,我们可以对算法做出一些结论。

顺便说一下,在优化和训练公式的情况下,尽量使用自然对数。根据我的经验,使用Mathpow() 的指数似乎可以相当快地收敛一个解决方案。

 
FxTrader562:

是的,没错......你可以尝试使用GDMH,并让我知道,如果你在实施过程中取得进展或陷入困境,因为无论如何,在看到LIVE结果后,我们可以对算法做出一些结论。

顺便说一下,在优化和训练公式的情况下,尽量使用自然对数。根据我的经验,使用指数的Mathpow()似乎可以相当快地转换一个解决方案。

你也可以使用三角多项式。这将是类似 "递归特征消除 "的东西,实际上不是gdmh...中等的东西 )

因为gdmh它的线性二次元算法,但我们使用RDF
 
马克西姆-德米特里耶夫斯基

也可以使用三角多项式。这将是类似于 "递归特征消除 "的东西,实际上不是gdmh...中等的东西 )

我不知道......我必须阅读才能理解:))......事实上,我对GDMH一无所知,你昨天才告诉我,我刚刚学会并写了代码......我想我学得很快:)))))

我指的是,当你对一个随机函数 进行近似求解时,通过使用自然对数或指数一般会迅速收敛......为什么? 因为这就是自然对数或ln或指数()或e的定义和目的

下面是我所指的一个示例代码。

double x=MathRandomUniform(0,1,unierr)。

double likelyhood = 1/(1+exp(MathPow(x,3)))。

我对GDMH有些了解......但RDF仍然不是100%清楚。我只是想实现蒙特卡洛而不是RDF,但是如果我们可以通过RDF来实现,那么我就不觉得蒙特卡洛有什么用。你认为蒙特卡洛和RDF哪个更好?

但我将在此总结一下我对这个算法的期望。

1.它将把指标或收盘价分解成m个小块,并在训练中创建多项式或近似函数。

2.当我们在交易中运行它时,对于每一个蜡烛,它将检查过去的训练数据,并找到与我们当前价格相匹配的多项式,并预测接下来会发生什么,它应该进行迭代。

 
FxTrader562:

我不知道......我必须阅读才能理解:))。

我指的是,当你对一个随机函数 进行近似求解时,通过使用自然对数或指数一般会迅速收敛......为什么? 因为这就是自然对数或ln或指数()或e的定义和目的

下面是我所指的一个示例代码。

double x=MathRandomUniform(0,1,unierr)。

double likelyhood = 1/(1+exp(MathPow(x,3)))。

我对GDMH有些了解......但RDF仍然不是100%清楚。我只是想实现蒙特卡洛而不是RDF,但是如果我们可以通过RDF来实现,那么我就不认为蒙特卡洛有什么用。你认为蒙特卡洛和RDF哪个更好?

但我将在此总结一下我对这个算法的期望。

1.它将把指标或收盘价分解成m个小块,并在训练中创建多项式或近似函数。

2.当我们在交易中运行它时,对于每一个蜡烛,它将检查过去的训练数据,并找到与我们当前价格相匹配的多项式,并预测接下来会发生什么,它应该进行迭代。

RDF直接近似代理的polisy,另一方面,用Monte Carlo或TD和Markov链的q-learning做了太多的迭代,所以它可能需要更长的时间。

1,2是的,完全正确

 
马克西姆-德米特里耶夫斯基

RDF直接逼近代理的多义性,另一方面,用蒙特卡洛或TD的q-learning做了太多的迭代,所以它可能需要更长的时间。

1,2是的,完全正确。

所以你的意思是RDF比Monte Carlo更好更快,而Monte Carlo绝对需要在蜡烛收盘时做出即时交易决定....,所以我们在创建外汇版本的道路上是正确的。

的 "ALPHA ZERO"...让我们看看:)))))))))