交易中的机器学习:理论、模型、实践和算法交易 - 页 1620 1...161316141615161616171618161916201621162216231624162516261627...3399 新评论 mytarmailS 2020.03.18 21:06 #16191 阿列克谢-维亚兹米 金。 聚类的输入是什么--所有的样本预测因子还是什么? 嗯,是的......但我们也可以进行实验。 Aleksey Vyazmikin 2020.03.18 21:09 #16192 阿列克谢-尼古拉耶夫。 我将把这个想法带到某种逻辑上的结论。假设我们在同一资产上有一组系统。每个系统在入市时,持有固定数量的头寸,但方向可以改变。策略的回报和波动率是已知的。 让我们用公式(t1-t2)/sqrt(T1*T2)来定义策略之间的相关性,其中T1和T2是它们在市场上的时间长度,t1和t2是这些策略同时在市场上并分别指向相同和相反方向的时间长度。这是在价格接近SB的假设下得出的一个简化公式。现在有了所有的数据,可以应用马科维茨理论来寻找最佳投资组合。 显然,用这种方式我们不会得到任何有意义的投资组合(至少因为只使用了一种资产)。我们需要进行一些修改。 1)改变优化算法(参数限制、惩罚)。澄清战略之间的关联性的定义。 2)在创建战略的时候就已经对投资组合进行优化。也就是说,要根据投资组合的最优条件来寻找对它们的策略。目前还不太清楚如何以一种实际适用的方式将其正式化,但这种方法在总体上似乎更符合逻辑。虽然,正如你已经写的那样,这将需要重写算法,等等。不知道这是否值得麻烦。 你说的都是真的。但我不会只考虑入市时间--我们需要对这段时间的表现进行一些衡量,因为仅仅入市是不够的,我们还必须及时退出,这里有条件地考虑两个类似的策略,但一个有固定的取舍,另一个没有取舍,会有很高的时间相关性,但财务结果不同。两个类似的策略可能是有用的,例如,其中一个将在平坦的条件下获得利润,另一个将在趋势条件下获得更多的利润,这两个策略一起将平滑平衡曲线。 如果没有太多的策略,它们的直接搜索和联合估计是可能的。 Aleksey Vyazmikin 2020.03.18 21:11 #16193 mytarmailS: 我想是的......但我们也可以进行实验。 而我应该选择什么样的算法,才能在没有随机化的情况下,在合理的计算时间内得到一个可接受的结果?我不太擅长聚类。 Forester 2020.03.18 21:36 #16194 Aleksey Vyazmikin: 我研究过CatBoost,所以我将谈谈它。树的深度建议为4-6个劈头。这是我在总体上尝试的深度。预测器的拆分是由三种不同的算法来完成的,可供选择。一个所谓的网格被创建。拆分的结果很有意思,可以自己拉出来看看。AlgLib在为森林构建树时,将预测因子平均分配给什么? AlgLib将传入的棋子除以中位数(校正--不是除以中间,而是除以中位数。 )。例如,如果有100个例子,它将对这些值进行排序,并除以第50个例子的值。代码中有一个量化选项,但没有被使用。 我记得关于XGBoost,它有随机除法的变种。这似乎在catbust中也是如此。 总的来说,他们推荐这么浅的树是很奇怪的。 正如我以前写过的,对于这样一棵浅薄的树,不太可能选择像20%到30%的价值的部门。最多只有1或2次会按中位数或按Boosts中的随机值来划分。 如果深度是100,很可能通过一些预测器达到20-30%的部门。 我想在Boosts中,这可以通过大量的细化树来弥补,这些细化树可能会使用主树中没有使用的其他预测因子,但它们也只会相隔1-2倍。 mytarmailS 2020.03.18 21:40 #16195 阿列克谢-维亚兹米 金。 而我应该选择什么样的算法,才能在没有随机性的情况下,在合理的计算时间内得到一个可接受的结果?我不太擅长聚类。 是的,在一个拖车的任何(knn,som,dtwclust...),最好的变体肯定会显示实验... 不要误会,我不是在用我写的东西,我只是读了你的想法,从实施的一个稍微不同的方面来看,所以我说出了......我不保证任何结果 Aleksey Vyazmikin 2020.03.18 21:48 #16196 elibrarius: Algib将传入的片断除以中位数。例如,如果有100个例子,它将对数值进行排序,并除以第50个例子的数值。在代码中,有一个由量值组成的变体,但它没有被使用。 我想起了XGBoost,它有一个随机划分的选项。这似乎在catbust中也是如此。 总的来说,他们推荐这么浅的树是很奇怪的。 正如我以前写过的,对于这样一棵浅薄的树,不太可能选择像20%到30%的价值的部门。最多只有1或2次会按中位数或按Boosts中的随机值来划分。 如果深度是100,很可能通过一些预测器达到20-30%的部门。 我想,在Boosts中,这一点可以通过大量的细化树来弥补,这些细化树可以使用主树中没有使用的其他预测因子。 现实可能不是我们想象的那样--我们应该尝试重现CatBoost 的分离算法,看看那里到底发生了什么,以及它的正确性如何。 关于随机性--在预测器网格分区的选择上有一个随机性,比如不是最好的一个,而是随机的,如果我理解正确的话。而且,有一些算法使堆栈按范围不均匀地划分。 Aleksey Vyazmikin 2020.03.18 21:50 #16197 mytarmailS: 是的,在拖车中,你可以使用任何(knn,som,dtwclust...),当然,最好的选择将通过实验来显示。 不要误会,我不是在用我写的东西,我只是读了你的想法,从实施的一个稍微不同的方面来看,所以我说出了......我不保证任何结果。 我说的是担保吗--只是想了解你的想法。 Evgeny Dyuka 2020.03.18 22:15 #16198 神经指标几乎已经准备好了 ))这是一个EA,纯粹是我缺乏技能的一个指标。 Evgeny Dyuka 2020.03.18 22:16 #16199 顶部的橙色区域--预测下行,底部的绿色--预测上行,神经网络的信心水平的厚度。只在BTCUSD M1上工作(目前...)。 它很酷吗?)) mytarmailS 2020.03.18 22:48 #16200 叶夫根尼-迪尤卡。 上面的橙色区域预示着向下的运动,下面的绿色区域--向上的运动。它只适用于BTCUSD M1(目前)。 它很酷吗?)) 我想说还不错,但很令人沮丧。 基本上像普通的超买/超卖指标一样工作。 有时是对的,有时是错的,不应该是... 你有没有测试过这个网的交易情况?我的经验告诉我,这是不可能赚钱的...... 除非你在网的 "信心 "上加一个过滤器。 1...161316141615161616171618161916201621162216231624162516261627...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
聚类的输入是什么--所有的样本预测因子还是什么?
嗯,是的......但我们也可以进行实验。
我将把这个想法带到某种逻辑上的结论。假设我们在同一资产上有一组系统。每个系统在入市时,持有固定数量的头寸,但方向可以改变。策略的回报和波动率是已知的。 让我们用公式(t1-t2)/sqrt(T1*T2)来定义策略之间的相关性,其中T1和T2是它们在市场上的时间长度,t1和t2是这些策略同时在市场上并分别指向相同和相反方向的时间长度。这是在价格接近SB的假设下得出的一个简化公式。现在有了所有的数据,可以应用马科维茨理论来寻找最佳投资组合。
显然,用这种方式我们不会得到任何有意义的投资组合(至少因为只使用了一种资产)。我们需要进行一些修改。
1)改变优化算法(参数限制、惩罚)。澄清战略之间的关联性的定义。
2)在创建战略的时候就已经对投资组合进行优化。也就是说,要根据投资组合的最优条件来寻找对它们的策略。目前还不太清楚如何以一种实际适用的方式将其正式化,但这种方法在总体上似乎更符合逻辑。虽然,正如你已经写的那样,这将需要重写算法,等等。不知道这是否值得麻烦。
你说的都是真的。但我不会只考虑入市时间--我们需要对这段时间的表现进行一些衡量,因为仅仅入市是不够的,我们还必须及时退出,这里有条件地考虑两个类似的策略,但一个有固定的取舍,另一个没有取舍,会有很高的时间相关性,但财务结果不同。两个类似的策略可能是有用的,例如,其中一个将在平坦的条件下获得利润,另一个将在趋势条件下获得更多的利润,这两个策略一起将平滑平衡曲线。
如果没有太多的策略,它们的直接搜索和联合估计是可能的。
我想是的......但我们也可以进行实验。
而我应该选择什么样的算法,才能在没有随机化的情况下,在合理的计算时间内得到一个可接受的结果?我不太擅长聚类。
我研究过CatBoost,所以我将谈谈它。
树的深度建议为4-6个劈头。这是我在总体上尝试的深度。
预测器的拆分是由三种不同的算法来完成的,可供选择。一个所谓的网格被创建。
拆分的结果很有意思,可以自己拉出来看看。AlgLib在为森林构建树时,将预测因子平均分配给什么?
AlgLib将传入的棋子除以中位数(校正--不是除以中间,而是除以中位数。 )。例如,如果有100个例子,它将对这些值进行排序,并除以第50个例子的值。代码中有一个量化选项,但没有被使用。
我记得关于XGBoost,它有随机除法的变种。这似乎在catbust中也是如此。
总的来说,他们推荐这么浅的树是很奇怪的。
正如我以前写过的,对于这样一棵浅薄的树,不太可能选择像20%到30%的价值的部门。最多只有1或2次会按中位数或按Boosts中的随机值来划分。
如果深度是100,很可能通过一些预测器达到20-30%的部门。
我想在Boosts中,这可以通过大量的细化树来弥补,这些细化树可能会使用主树中没有使用的其他预测因子,但它们也只会相隔1-2倍。
而我应该选择什么样的算法,才能在没有随机性的情况下,在合理的计算时间内得到一个可接受的结果?我不太擅长聚类。
是的,在一个拖车的任何(knn,som,dtwclust...),最好的变体肯定会显示实验...
不要误会,我不是在用我写的东西,我只是读了你的想法,从实施的一个稍微不同的方面来看,所以我说出了......我不保证任何结果
Algib将传入的片断除以中位数。例如,如果有100个例子,它将对数值进行排序,并除以第50个例子的数值。在代码中,有一个由量值组成的变体,但它没有被使用。
我想起了XGBoost,它有一个随机划分的选项。这似乎在catbust中也是如此。
总的来说,他们推荐这么浅的树是很奇怪的。
正如我以前写过的,对于这样一棵浅薄的树,不太可能选择像20%到30%的价值的部门。最多只有1或2次会按中位数或按Boosts中的随机值来划分。
如果深度是100,很可能通过一些预测器达到20-30%的部门。
我想,在Boosts中,这一点可以通过大量的细化树来弥补,这些细化树可以使用主树中没有使用的其他预测因子。
现实可能不是我们想象的那样--我们应该尝试重现CatBoost 的分离算法,看看那里到底发生了什么,以及它的正确性如何。
关于随机性--在预测器网格分区的选择上有一个随机性,比如不是最好的一个,而是随机的,如果我理解正确的话。而且,有一些算法使堆栈按范围不均匀地划分。
是的,在拖车中,你可以使用任何(knn,som,dtwclust...),当然,最好的选择将通过实验来显示。
不要误会,我不是在用我写的东西,我只是读了你的想法,从实施的一个稍微不同的方面来看,所以我说出了......我不保证任何结果。
我说的是担保吗--只是想了解你的想法。
神经指标几乎已经准备好了 ))这是一个EA,纯粹是我缺乏技能的一个指标。
它很酷吗?))
上面的橙色区域预示着向下的运动,下面的绿色区域--向上的运动。它只适用于BTCUSD M1(目前)。
它很酷吗?))
我想说还不错,但很令人沮丧。
基本上像普通的超买/超卖指标一样工作。
有时是对的,有时是错的,不应该是...
你有没有测试过这个网的交易情况?我的经验告诉我,这是不可能赚钱的......
除非你在网的 "信心 "上加一个过滤器。