交易中的机器学习:理论、模型、实践和算法交易 - 页 3061 1...305430553056305730583059306030613062306330643065306630673068...3399 新评论 Maxim Dmitrievsky 2023.05.07 18:33 #30601 Aleksey Vyazmikin #:也许我真的没有理解这一切的目的....。但在我看来,目的是检测一个新因素的影响,或者可以认为是预测因子过去的值对指标(价格或其他--回归主要是在例子中)的离群值。那么,我们的任务就是在事件时序保持不变的情况下检测这些异常值(时间序列的样本线不能随机化)。而且,事实证明这是一个罕见的事件,或者是一次性的变化。那么,只需查看预测指数在固定时间窗口内的分布变化即可。如果这些变化在测试的不同部分更经常地导致 "模型不工作 "的效果,那么我们就需要更仔细地利用这些预测指标使模型工作....。 预测因子和因果关系是两码事。因果分析是针对结果的,如果不涉及特质,则确定 ATE(平均治疗效果);如果涉及协变量(特质),则确定 CATE(条件......),同时考虑到一些外部影响(如广告活动,即三要素)。这是为了确定对照组是否受到影响。然后,考虑到这种影响,您就可以分析并改进您的模型或某些指标。 ...你才是那个试图找出如何应用你不知道如何应用的东西的人。 免费参加短期入门课程 Aleksey Vyazmikin 2023.05.07 19:30 #30602 Maxim Dmitrievsky #:预测因子和特质是不同的。因果分析是对结果进行分析,如果不涉及特质,则确定 ATE(平均治疗效果);如果涉及协变量(特质),则确定 CATE(条件......),同时考虑一些外部影响(如广告活动,即三要素)。这是为了确定对照组是否受到影响。然后,鉴于这种影响,您可以分析并改进您的模型或某些指标。...你才是那个试图找出如何应用你不知道如何应用的东西的人。参加一个免费的小入门课程。 我读过其中的两篇文章--正是他们结合视频给了我灵感。 https://habr.com/ru/companies/ru_mts/articles/485980/ https://habr.com/ru/companies/ru_mts/articles/485976/ ; 我也在做类似的工作,所以我对细微差别有自己的看法。不过,新术语确实让人困惑。 减去模型预测的概率--我不认为这有什么好处,尤其是如果你知道这些概率在 CB 中是如何分布的。 如果您想在专门研究这些问题的图书馆进行试验,请分享您的结果和您对情况的看法。 只要他们的方法的主要思想能渗透进去,最重要的是分析师对分析对象的经验和知识:) Maxim Dmitrievsky 2023.05.07 19:49 #30603 Aleksey Vyazmikin #:我读过他们写的两篇文章--它们是结合视频提出想法的基础。https://habr.com/ru/companies/ru_mts/articles/485980/https://habr.com/ru/companies/ru_mts/articles/485976/ ;我也在做类似的工作,所以我对其中的细微差别有自己的看法。不过,新术语确实令人困惑。减去模型预测的概率--我认为这不是个好主意,尤其是如果你知道这些概率在 CB 中是如何分布的。如果你想在专门研究这些问题的图书馆进行试验,请分享你的结果和对情况的看法。只要他们的方法的主要思想能渗透进来--最重要的是分析师对分析对象的经验和知识:) 提供了工具包,就去解决它。 如果您想得太抽象,那么每个人都在从事 "类似的任务"(只是他们无法确定是哪一项)。 Aleksey Vyazmikin 2023.05.07 21:15 #30604 Maxim Dmitrievsky #:提供的工具包,自己想办法。如果你想得太抽象,那么每个人都在执行 "类似的任务"(只是他们无法确定是哪一项)。 我在论坛上有一个单独的主题 来解决这个问题。目标只是确定是否会出现影响预测因子(量子片段)概率分布的新因素。 虽然我已经很久没有研究过这个问题了。更确切地说,我需要把想法从纸面转移到代码中。 没有 Python 或 er 的基础知识,我很难处理这样的事情。我根本没有空闲时间,而且很快就会感到疲倦。虽然吃药有一点帮助--但我是在想吃的时候吃的....。 Автоматический расчет описательных статистик выборки на MQL5 - Определите, похожи ли в целом средние значения событий? 2023.03.24www.mql5.com Код использует два callback-объекта в обучении модели LearningRateScheduler - позволяет динамически изменять скорость обучения модели в зависимости от номера эпохи. За весь период наблюдения поворот направо был осуществлен в 65 Maxim Dmitrievsky 2023.05.08 03:45 #30605 Aleksey Vyazmikin #:我在论坛上有一个单独的主题来 解决这个问题。目标是确定是否会出现影响预测因子(量子段)概率分布的新因素。虽然我已经很久没有研究过这个问题了。更确切地说,我需要把想法从纸面转移到代码中。没有 Python 或 er 的基础知识,我很难处理这样的事情。我根本没有空闲时间,而且很快就会感到疲倦。虽然吃药有一点帮助--但我是在想吃的时候吃的....。 我必须设定我能完成的任务。根本看不懂上面写什么。频率有时间轴......太明目张胆了。 然后我的手指条件反射地戳了戳十字架❌。 Aleksey Vyazmikin 2023.05.08 07:47 #30606 Maxim Dmitrievsky #: 你必须设定自己的目标。根本看不懂上面写什么。频率有时间刻度......太明目张胆了。 然后我的手指条件反射地戳了戳十字架❌。 是的,我拿的就是时间刻度,只有这样才能将该样本中的独立测量标准化,应用价值才不会丢失。 我同意,这个问题很难,我可能找不到解决办法。不过,我认为这是模型停止工作的主要原因--预测范围内的概率移动分布会随着时间的推移而发生很大变化。在这里,我们既可以寻找发生这种情况的原因--检测新因素出现的时刻,也可以从 "生命 "的历史中寻找变化的先决条件--这是一种生存任务。 如果我们通过这一知识来看待你的方法,那么你就会间接地在训练期中寻找对当时具有重要意义的预测因子来说分布稳定的区域,并根据某些标准筛选出分布不同的其他区域。然而,由于样本中的这些区域对于不同的预测因子是不同的,因此会导致截取一个非常大的抽样期。尽量减少每次迭代的预测因子数量--这将减少预测因子之间的概率偏差冲突,从而提高召回率。 Maxim Dmitrievsky 2023.05.08 08:09 #30607 频率没有时间表。我只是在处理模型错误:)这种方法很久以前就有了,但我不知道上浮技术。结果发现做了同样的事情。看这些分布图有什么意义?把已经很清楚的东西可视化。 Aleksey Vyazmikin 2023.05.08 08:27 #30608 Maxim Dmitrievsky #: 频率没有时间表。我只是在处理模型错误:)这种方法很久以前就有了,但我不知道上浮技术。结果发现做了同样的事情。看这些分布图有什么意义?把已经很清楚的东西视觉化。 也许我对这个词的理解有误,那你还能把一个事件在指定时间内的发生频率叫什么呢? 我说的不是可视化......我说的是如何更有效地处理这个问题。 Maxim Dmitrievsky 2023.05.08 08:36 #30609 Aleksey Vyazmikin #:也许是我用词不当,不然你怎么称呼在规定时间内发生事件的频率?我说的不是可视化......我说的是如何更有效地解决这个问题。 这些都在主题里,剩下的你可以用谷歌搜索。我扔了一本关于因果关系的书。没错,因为有很多术语不在主题中,所以发生的事情的意义就会消失。尽管任务本身可能非常简单。 Vladimir Perervenko 2023.05.08 08:42 #30610 我不知道是什么吸引你关注这个话题。对于 R 用户来说,这里有很多关于这个主题的软件包。或许有助于理解或使用。R 4.2.3/4.3.0 other attached packages: [1] regmedint_1.0.0 PSweight_1.1.8 MatchIt_4.5.3 [4] InvariantCausalPrediction_0.8 mboost_2.9-7 stabs_0.6-4 [7] glmnet_4.1-7 Matrix_1.5-4 grangers_0.1.0 [10] dagitty_0.3-1 CompareCausalNetworks_0.2.6.2 CERFIT_0.1.0 [13] causalweight_1.0.4 ranger_0.15.1 causalsens_0.1.2 [16] CausalQueries_0.1.0 Rcpp_1.0.10 dplyr_1.1.2 [19] causalPAF_1.2.5 causaloptim_0.9.7 igraph_1.4.2 [22] CausalMBSTS_0.1.1 KFAS_1.5.0 CausalKinetiX_0.2.1 [25] CausalImpact_1.3.0 bsts_0.9.9 xts_0.13.1 [28] zoo_1.8-12 BoomSpikeSlab_1.2.5 Boom_0.9.11 [31] CausalGAM_0.1-4 gam_1.22-2 foreach_1.5.2 [34] causaleffect_1.3.15 causaldrf_0.4.2 causaldata_0.1.3 [37] causalCmprsk_1.1.0 causal.decomp_0.1.0 目前只应用了 "sr"。 祝你好运 1...305430553056305730583059306030613062306330643065306630673068...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
也许我真的没有理解这一切的目的....。但在我看来,目的是检测一个新因素的影响,或者可以认为是预测因子过去的值对指标(价格或其他--回归主要是在例子中)的离群值。那么,我们的任务就是在事件时序保持不变的情况下检测这些异常值(时间序列的样本线不能随机化)。而且,事实证明这是一个罕见的事件,或者是一次性的变化。那么,只需查看预测指数在固定时间窗口内的分布变化即可。如果这些变化在测试的不同部分更经常地导致 "模型不工作 "的效果,那么我们就需要更仔细地利用这些预测指标使模型工作....。
预测因子和因果关系是两码事。因果分析是针对结果的,如果不涉及特质,则确定 ATE(平均治疗效果);如果涉及协变量(特质),则确定 CATE(条件......),同时考虑到一些外部影响(如广告活动,即三要素)。这是为了确定对照组是否受到影响。然后,考虑到这种影响,您就可以分析并改进您的模型或某些指标。
...你才是那个试图找出如何应用你不知道如何应用的东西的人。
免费参加短期入门课程
预测因子和特质是不同的。因果分析是对结果进行分析,如果不涉及特质,则确定 ATE(平均治疗效果);如果涉及协变量(特质),则确定 CATE(条件......),同时考虑一些外部影响(如广告活动,即三要素)。这是为了确定对照组是否受到影响。然后,鉴于这种影响,您可以分析并改进您的模型或某些指标。
...你才是那个试图找出如何应用你不知道如何应用的东西的人。
参加一个免费的小入门课程。
我读过其中的两篇文章--正是他们结合视频给了我灵感。
https://habr.com/ru/companies/ru_mts/articles/485980/
https://habr.com/ru/companies/ru_mts/articles/485976/ ;
我也在做类似的工作,所以我对细微差别有自己的看法。不过,新术语确实让人困惑。
减去模型预测的概率--我不认为这有什么好处,尤其是如果你知道这些概率在 CB 中是如何分布的。
如果您想在专门研究这些问题的图书馆进行试验,请分享您的结果和您对情况的看法。
只要他们的方法的主要思想能渗透进去,最重要的是分析师对分析对象的经验和知识:)
我读过他们写的两篇文章--它们是结合视频提出想法的基础。
https://habr.com/ru/companies/ru_mts/articles/485980/
https://habr.com/ru/companies/ru_mts/articles/485976/ ;
我也在做类似的工作,所以我对其中的细微差别有自己的看法。不过,新术语确实令人困惑。
减去模型预测的概率--我认为这不是个好主意,尤其是如果你知道这些概率在 CB 中是如何分布的。
如果你想在专门研究这些问题的图书馆进行试验,请分享你的结果和对情况的看法。
只要他们的方法的主要思想能渗透进来--最重要的是分析师对分析对象的经验和知识:)
提供了工具包,就去解决它。
如果您想得太抽象,那么每个人都在从事 "类似的任务"(只是他们无法确定是哪一项)。
提供的工具包,自己想办法。
如果你想得太抽象,那么每个人都在执行 "类似的任务"(只是他们无法确定是哪一项)。
我在论坛上有一个单独的主题 来解决这个问题。目标只是确定是否会出现影响预测因子(量子片段)概率分布的新因素。
虽然我已经很久没有研究过这个问题了。更确切地说,我需要把想法从纸面转移到代码中。
没有 Python 或 er 的基础知识,我很难处理这样的事情。我根本没有空闲时间,而且很快就会感到疲倦。虽然吃药有一点帮助--但我是在想吃的时候吃的....。
我在论坛上有一个单独的主题来 解决这个问题。目标是确定是否会出现影响预测因子(量子段)概率分布的新因素。
虽然我已经很久没有研究过这个问题了。更确切地说,我需要把想法从纸面转移到代码中。
没有 Python 或 er 的基础知识,我很难处理这样的事情。我根本没有空闲时间,而且很快就会感到疲倦。虽然吃药有一点帮助--但我是在想吃的时候吃的....。
你必须设定自己的目标。根本看不懂上面写什么。频率有时间刻度......太明目张胆了。 然后我的手指条件反射地戳了戳十字架❌。
是的,我拿的就是时间刻度,只有这样才能将该样本中的独立测量标准化,应用价值才不会丢失。
我同意,这个问题很难,我可能找不到解决办法。不过,我认为这是模型停止工作的主要原因--预测范围内的概率移动分布会随着时间的推移而发生很大变化。在这里,我们既可以寻找发生这种情况的原因--检测新因素出现的时刻,也可以从 "生命 "的历史中寻找变化的先决条件--这是一种生存任务。
如果我们通过这一知识来看待你的方法,那么你就会间接地在训练期中寻找对当时具有重要意义的预测因子来说分布稳定的区域,并根据某些标准筛选出分布不同的其他区域。然而,由于样本中的这些区域对于不同的预测因子是不同的,因此会导致截取一个非常大的抽样期。尽量减少每次迭代的预测因子数量--这将减少预测因子之间的概率偏差冲突,从而提高召回率。
频率没有时间表。我只是在处理模型错误:)这种方法很久以前就有了,但我不知道上浮技术。结果发现做了同样的事情。看这些分布图有什么意义?把已经很清楚的东西视觉化。
也许我对这个词的理解有误,那你还能把一个事件在指定时间内的发生频率叫什么呢?
我说的不是可视化......我说的是如何更有效地处理这个问题。
也许是我用词不当,不然你怎么称呼在规定时间内发生事件的频率?
我说的不是可视化......我说的是如何更有效地解决这个问题。
我不知道是什么吸引你关注这个话题。对于 R 用户来说,这里有很多关于这个主题的软件包。或许有助于理解或使用。R 4.2.3/4.3.0
目前只应用了 "sr"。
祝你好运