交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2022.09.10 07:40 #27411

Aleksey Nikolayev #:

我想我看到了一些生存分析应用的提示。

我自己没有做过，但我曾经问过类似的问题。在我看来，这种方法很有前途，但它来自一个完全不同的领域。

JeeyCi 2022.09.10 07:52 #27412

СанСаныч Фоменко #:

上面写着classDist {caret}，也就是说，它指定了一个特定函数，该函数是caret PACKAGE 的一部分

据我所知，你不懂 R。那你为什么还要在这个主题和 MO 上浪费时间呢？

不掌握 R 语言，讨论 MO 就毫无意义。

我对熵保持沉默，只是因为交叉熵是分类模型的标准损失函数....。MO不仅在R语言中实现！（只知道一个库，却不知道它所操作的实体的性质--你不知道你前进的方向）。

还有一个更难的问题--当你宣称"信息论"时，为什么要断然脱离统计学？

该领域是数学、统计学、计算机科学、物理学、神经生物学、信息工程和电子工程的交叉学科。

事实上，讨论是无主题的，如果你在片段和你的自我（甚至是关于某人，而不仅仅是关于你自己），而不是对话的主题...不幸的是，主题并没有改变（答案的具体性和主题并没有增加）

Sergey Golubev 2022.09.11 08:13 #27413

Maxim Dmitrievsky #:
这个愚钝的喉舌再次呼吁大家认清真相，但尚未决定哪个

你已经让版主烦透了，以至于他要拆穿一切。

请勿阅读用户JeeyCi 的挑衅性帖子（他的帖子 #27409 是挑衅并要求 "继续宴会"）。
昨天我删除了几个带有脏话和粗野人身攻击的帖子，在此指导下 - 我删除了 JeeyCi 的帖子。

关于交易、自动交易系统和交易策略测试的论坛。

交易中的机器学习：理论、模型、实践和算法交易

MetaQuotes, 2022.08.31 15:14

持续的个性将导致每周禁言。

我在主题中提出了两次警告，但都被置之不理，然后我删除了几个带有脏话的帖子。
那里唯一有文采的帖子（可读的）就是你的帖子--这篇（昨天的始作俑者）：

关于交易、自动交易系统和交易策略测试的论坛

...

Maxim Dmitrievsky, 2022.09.10 12:15

有基于模型的、与模型无关的和混合特征选择。如果采用不可知论，那就是相关性和互信息（基于熵）。后者与前者的区别在于其捕捉非线性依赖关系的能力，其他方面都是一样的。在这种情况下，很难甚至不可能谈论特征与目标之间的任何关系。这只是一种相关性。但这对剔除无意义的特征是有用的。

您可以在滑动窗口、难以捉摸窗口、滑动窗口或摩擦窗口中进行处理

如果你想具体确定因果关系，那就是因果推断，包括使用 MO，我不知道如何将 MO 应用于时间序列，因为我没有研究过这个主题。

而且之前所有的方法都不能用于寻找因果关系，只能用于算法的优化训练。

所以，市民们又一次无法集中精力，把苍蝇从他们的肉排里赶走。

关于伟大而万能的 R，我们已经听过很多次了。很显然，如果你把一只猴子放在它后面，它也可以认为自己是一个统计学家和分析家，它是如此伟大。

是的，我偶尔会删除脏话，尤其是持续半天、两页文字的脏话（比如昨天）。

----------------

这个主题非常受欢迎（甚至在英语论坛上也有人阅读，被认为是这个主题的关键主题）。
所以请--少说脏话。

Maxim Dmitrievsky 2022.09.11 08:27 #27414

mytarmailS #:

如果您分析一下成功或不成功交易者的 TS，您就会发现他们都在进行水平交易。

我从未见过一个成功的交易者借助指标进行交易。

价位是一个清晰易懂的切入点，有明确的止损....。

如果您能以低风险进行交易，您就不需要其他任何东西了，每次交易的低风险/精确的入场 才是最重要的！

在 MO 的帮助下，您可以寻找 PD/SP 的水平以及准确的入场点，这不是一件小事，也不简单，您不能在有关 MO 的博客中读到，您需要用自己的头脑....。

您还可以在 sb 图表上绘制水平线，它也是一个时间序列。大家都受够你了，我们不再回复你了。你每天都在胡说八道。

Aleksey Vyazmikin 2022.09.14 22:04 #27415

mytarmailS #:

下面是一个随机产生的包含 5 个特征和 1 个二进制目标的样本的例子

福雷斯特和菲切选择器

任务队列已经卸载了一些--可以运行脚本了。我运行后发现了一个错误。

> install.packages("randomForest")
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Installing package into ‘C:/Users/S_V_A/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Warning in install.packages :
  package ‘randomForest’ is not available (for R version 4.0.5)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/bin/windows/contrib/4.0:
  cannot open URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/PACKAGES'

> library(randomForest)
Error in library(randomForest) : нет пакета под названием ‘randomForest’

我的理解是，程序需要 R 4.0 的旧版本？

我搜索了旧版本，但没有找到。可怕的不兼容性当然令人厌恶。

mytarmailS 2022.09.15 06:15 #27416

Aleksey Vyazmikin #:

任务队列已经卸载了一些 - 可以运行脚本了。我运行它时出现了错误。

我的理解是否正确，即程序需要旧版本的 R 4.0？

我使用的是 R-3.6.3。

我在旧版 R-3.6. 3 上写这篇文章是出于我自己的原因，所以这是我的问题...

我无法想象软件包会从 tap.... 中移除。

Aleksey Vyazmikin#：

我的理解是，程序需要旧版本的 R 4.0？

正确

Aleksey Vyazmikin#：

嗯，总的来说，我找过旧版本，但没找到。可怕的不兼容性当然令人厌恶。

听着，也许你不能去做交易，这样的smikalka？))

有了兼容性，一切都好办了，比如 python，只会羡慕这样的兼容性....。

另请参见

https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2

在当前版本上试试

urlPackage <- "https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-12.tar.gz"
install.packages(urlPackage, repos=NULL, type="source")

Maxim Dmitrievsky 2022.09.15 20:16 #27417

我们来总结一下桑尼奇的理论（因为他自己也没有将其正规化并举例说明）：

*他的特征选择方法基于相关性，因为 "关系 "和 "联系 "就是相关性的定义。

*这样我们就能对历史进行隐式拟合，与 LDA（线性判别分析）或 PCA 的意义相似，简化了学习过程，减少了误差。

*甚至没有一种理论认为，训练有素的模型在新数据上（不涉及估计特征和目标之间的联系）应该表现得更好，因为特征已经拟合到了特征或（更糟糕的）现有历史上。

*在滑动窗口中平均 QC 可以在一定程度上改善这种情况，比如你可以估计差值并选择更稳定的差值。至少我们有一些统计数据可以依赖。

*我想的是因果关系或统计意义上的显著关系，但他的方法并非如此。

Maxim Kuznetsov 2022.09.15 20:25 #27418

Maxim Dmitrievsky #:
我总结一下桑尼奇的理论（因为他自己也没有把理论正规化并举例说明）：

*他的特征选择方法基于相关性，因为 "关系 "和 "关系 "是相关性的定义。

*这样我们就能对历史进行隐式拟合，其意义类似于 LDA（线性判别分析）或 PCA，简化了学习过程，减少了误差。

*甚至没有一种理论认为，训练有素的模型应该在新数据（不涉及特征-目标关系的估计）上表现得更好，因为这些特征之前是与性状或（更糟的是）与整个可用历史拟合的。

*我所说的关系是指因果关系或统计意义上的显著关系，但他的方法并非如此。

恕我直言，这不是一篇总结（不是文摘或摘要）。它充满了个人态度和毫无根据的攻击。

你会认为有人会有一个有效的理论，即 "训练有素的模型应该在新数据上有效"：-）并且是经过验证的......是的。

Maxim Dmitrievsky 2022.09.15 20:27 #27419

Maxim Kuznetsov #:

恕我直言，但这不是总结（不是文摘或摘要）。这是一种个人态度和毫无根据的攻击。

你会认为有人会有一个有效的理论，即 "训练有素的模型应该在新数据上有效":-)并得到验证......是的。

如果你仔细阅读，就会发现第 2 点中的伏笔，即故事的初始拟合。这就是为什么会出现学习误差下降的原因。

如果不对所有可用的历史数据进行分析，那么第 4 点就比较乐观了。只有在进行线性抽样时，才应该进行拟合。在新数据上对模型进行充分估计。

我对心理学并不了解，所以从来没听说过。我本人也不认识什么人。

Maxim Dmitrievsky 2022.09.15 21:17 #27420

СанСаныч Фоменко #:

没有足够的能力达到 EA 水平。但模型拟合误差的结果是：从 8%到 22%的拟合误差在拟合部分和样本外差别不大。

这说明在训练之前已经对整个历史进行了拟合。如果不是这样，请指正。特征是在哪个区间估计/选择的，训练又是在哪个区间进行的？

我也有类似的方法，我可以在本周末与大家分享结果。前提是要有实质性的交流，而不是文字游戏。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2742