交易中的机器学习:理论、模型、实践和算法交易 - 页 1120 1...111311141115111611171118111911201121112211231124112511261127...3399 新评论 [删除] 2018.10.19 07:57 #11191 不是 的。 这种情况下,并与你的数据集...对不起,但很多人已经告诉你很多次了,你至少需要几千个样本,考虑到市场数据的噪声,最好是几十万点,但当你学习Java并使用XGB为例,你会嘲笑你过去的坚持))这是个不正确的说法 [删除] 2018.10.19 08:05 #11192 Mihail Marchukajtes:所以我为马修斯的系数想出了一个改进的衡量标准,但如果你在这里吹吹风就走,我还能说什么。:-( 我被困在从一个类到另一个类的数组传递中,而地狱...无人问津 :-(例如,你可以衡量样品的利润因素,仅此而已。 和内部模型的估计是次要的,因为最小的误差并不意味着在新数据下的最大稳定性只需通过新数据上的交易表现挑选一个外部标准进行评估 你没有一个大的样品来测试,你会舔着螺丝......小的样品对于一个托盘来说并不重要,一切都很好。 [删除] 2018.10.19 10:09 #11193 只是,该模型将重达千兆字节。 你可以争论,但在市场上,这根本不是保真度/不保真度的问题,更重要的是让它发挥作用,对我来说,通常样本越多,效果越好))。就拿TIMBER或XGB来说--他们不在乎有多少样本需要重新学习:)只是这个模型会重达几十公斤。 但用外部指标对特征进行递归列举,即使在小的子样本上也开始有了结果,甚至没有外部的 itslek 2018.10.19 10:31 #11194 Vizard_。趋势=100k线。在剩下的8K+(测试)中,你要应用这个模型。数据被洗牌了。 该指标为对数损失。结果,发布。趋势 =......测试 =......。当然,这不是用时间序列做的。但为了兴趣,我把它放到几乎默认的LightGBM中,根本没有触及数据。火车:0.6879388421499111测试:0.6915181677127092测试来源,用CatBoost进行奖励。https://yadi.sk/d/55DDn-hViNWP6Q你的结果是什么? test_xz.ipynb disk.yandex.ru Посмотреть и скачать с Яндекс.Диска Ivan Negreshniy 2018.10.19 10:32 #11195 马克西姆-德米特里耶夫斯基。例如,衡量样品的利润系数,就可以了。 模型的内部估计是次要的,因为最小的误差并不意味着新数据的最大稳定性。只需通过新数据上的交易表现挑选一个外部标准进行评估 你没有一个大的样品来测试,你会去舔螺丝......而一个小的样品对于一个托盘来说并不重要,一切都很好。一般来说,应该有无限的空间用于测试。 如果有人想检查他们的数据质量,他们不应该把它放在一些晦涩的CSV文件中,而是放在指标中。 你可以使用一个模板,虽然目标可能不必放置,但很明显,它们必须是盈利的。 然后我们可以教授任何模型,创建一个专家顾问,并与初始指标一起客观地进行测试。 好吧,这是在你想做什么的情况下,但如果你只是想谈谈......。 Ivan Negreshniy 2018.10.19 12:28 #11196 这有点复杂,但可能会给你带来很多 麻烦。噪声越大,样本越多,在初级统计学的水平上应该是很清楚的,而市场数据的噪声很大,再培训是另一个问题,如果你教的是正确建立的特征和正确的目标定位,那么在有几万或几十万样本的测试上,再培训真的很难实现。这就是大数据集的好处,它们很难重新训练,除非数据科学家或算法师是马扎师或接近市场的人,把目标和特征混在一起。担心的理由很明显--芯片与目标的关联度超过3-5%,所以它一定会偷看,最好是构建小说,这样原则上就没有这种可能性了,这将使算法有点复杂,但可能会摆脱 初学者Algotraders犯的主要错误。你们都在骂近市场交易者,我也是,但你似乎很冷静,市场algotrader,从你的帖子来看,你知道什么时期要教,什么要交易。 但我不知道,当我看到昨天的讨论时,我没有参与,只是决定尝试一下,所以我从10月8日至18日在欧元兑美元M1上进行了模拟训练,只要我的经纪人有,我就实时运行专家顾问。 因此,到目前为止他的交易是盈利的,但作为专家,你的问题是:他什么时候会开始亏损,登录 - 2096584180,密码 - na3tbvr,Tradeise-Demo,但具体来说,不是关于在广阔的大剧院中游荡的宇宙飞船(c)。 Ivan Negreshniy 2018.10.19 12:50 #11197 我 有一个实时交易测试器МТ4,neuronet。学习样本微乎其微,测试人员和优化人员的逻辑不透明(黑箱)...... 结论 - 99.99999999999%这个EA是随机的,股权是一个随机的几何游走,由于交易成本的原因,斜率是向下的。 根据交易的频率,我只能在这一年里 保证负SR<-0.5。1.有实时交易,MT4测试器,神经网络。 2.答案是100%错误的--专家顾问不是随机的。 3.在8天的交易数据中进行训练,但预测一年......?:) ZS: 我特别问了,例如 - 交易期和训练期的比例为30%,顾问将在后天开始损失,或10% - 今天,但由于科学是沉默的... Igor Makanu 2018.10.19 12:51 #11198 我不 知道。结论 - 99.99999999999%这个EA是随机的,股权是随机的几何徘徊,由于交易成本,有一个向下的坡度。嗯,那是我的照片,你在那里能看到什么? ;) Yuriy Asaulenko 2018.10.19 13:09 #11199 不是 的。随机我告诉你我还想说,这不可能,因为它永远不可能。(c) 而对50个交易进行训练是不现实的,但我们需要再看30-40个交易(也就是3-4天)才能得出结论。当然,如果我们看到他们。 但是,一般来说,这已经很奇怪了。 Ivan Negreshniy 2018.10.19 13:14 #11200 我 告诉你这是他在测试器中的运行情况--这是随机的?随机的,我告诉你。这是他的测试器运行情况--你说这是随机的? 附加的文件: StrategyTester.zip 23 kb 1...111311141115111611171118111911201121112211231124112511261127...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
这种情况下,并与你的数据集...对不起,但很多人已经告诉你很多次了,你至少需要几千个样本,考虑到市场数据的噪声,最好是几十万点,但当你学习Java并使用XGB为例,你会嘲笑你过去的坚持))
这是个不正确的说法
所以我为马修斯的系数想出了一个改进的衡量标准,但如果你在这里吹吹风就走,我还能说什么。:-(
我被困在从一个类到另一个类的数组传递中,而地狱...无人问津 :-(
例如,你可以衡量样品的利润因素,仅此而已。
和内部模型的估计是次要的,因为最小的误差并不意味着在新数据下的最大稳定性
只需通过新数据上的交易表现挑选一个外部标准进行评估
你没有一个大的样品来测试,你会舔着螺丝......小的样品对于一个托盘来说并不重要,一切都很好。
你可以争论,但在市场上,这根本不是保真度/不保真度的问题,更重要的是让它发挥作用,对我来说,通常样本越多,效果越好))。
就拿TIMBER或XGB来说--他们不在乎有多少样本需要重新学习:)只是这个模型会重达几十公斤。
但用外部指标对特征进行递归列举,即使在小的子样本上也开始有了结果,甚至没有外部的趋势=100k线。在剩下的8K+(测试)中,你要应用这个模型。数据被洗牌了。
该指标为对数损失。结果,发布。趋势 =......测试 =......。
当然,这不是用时间序列做的。但为了兴趣,我把它放到几乎默认的LightGBM中,根本没有触及数据。
火车:0.6879388421499111
测试:0.6915181677127092
测试来源,用CatBoost进行奖励。
https://yadi.sk/d/55DDn-hViNWP6Q
你的结果是什么?
例如,衡量样品的利润系数,就可以了。
模型的内部估计是次要的,因为最小的误差并不意味着新数据的最大稳定性。
只需通过新数据上的交易表现挑选一个外部标准进行评估
你没有一个大的样品来测试,你会去舔螺丝......而一个小的样品对于一个托盘来说并不重要,一切都很好。
一般来说,应该有无限的空间用于测试。
如果有人想检查他们的数据质量,他们不应该把它放在一些晦涩的CSV文件中,而是放在指标中。
你可以使用一个模板,虽然目标可能不必放置,但很明显,它们必须是盈利的。
然后我们可以教授任何模型,创建一个专家顾问,并与初始指标一起客观地进行测试。
好吧,这是在你想做什么的情况下,但如果你只是想谈谈......。
噪声越大,样本越多,在初级统计学的水平上应该是很清楚的,而市场数据的噪声很大,再培训是另一个问题,如果你教的是正确建立的特征和正确的目标定位,那么在有几万或几十万样本的测试上,再培训真的很难实现。这就是大数据集的好处,它们很难重新训练,除非数据科学家或算法师是马扎师或接近市场的人,把目标和特征混在一起。担心的理由很明显--芯片与目标的关联度超过3-5%,所以它一定会偷看,最好是构建小说,这样原则上就没有这种可能性了,这将使算法有点复杂,但可能会摆脱 初学者Algotraders犯的主要错误。
你们都在骂近市场交易者,我也是,但你似乎很冷静,市场algotrader,从你的帖子来看,你知道什么时期要教,什么要交易。
但我不知道,当我看到昨天的讨论时,我没有参与,只是决定尝试一下,所以我从10月8日至18日在欧元兑美元M1上进行了模拟训练,只要我的经纪人有,我就实时运行专家顾问。
因此,到目前为止他的交易是盈利的,但作为专家,你的问题是:他什么时候会开始亏损,登录 - 2096584180,密码 - na3tbvr,Tradeise-Demo,但具体来说,不是关于在广阔的大剧院中游荡的宇宙飞船(c)。
学习样本微乎其微,测试人员和优化人员的逻辑不透明(黑箱)......
结论 - 99.99999999999%这个EA是随机的,股权是一个随机的几何游走,由于交易成本的原因,斜率是向下的。
根据交易的频率,我只能在这一年里 保证负SR<-0.5。
1.有实时交易,MT4测试器,神经网络。
2.答案是100%错误的--专家顾问不是随机的。
3.在8天的交易数据中进行训练,但预测一年......?:)
ZS: 我特别问了,例如 - 交易期和训练期的比例为30%,顾问将在后天开始损失,或10% - 今天,但由于科学是沉默的...
结论 - 99.99999999999%这个EA是随机的,股权是随机的几何徘徊,由于交易成本,有一个向下的坡度。
嗯,那是我的照片,你在那里能看到什么?
;)
随机我告诉你
我还想说,这不可能,因为它永远不可能。(c) 而对50个交易进行训练是不现实的,但我们需要再看30-40个交易(也就是3-4天)才能得出结论。当然,如果我们看到他们。
但是,一般来说,这已经很奇怪了。
随机的,我告诉你。
这是他的测试器运行情况--你说这是随机的?