交易中的机器学习:理论、模型、实践和算法交易 - 页 2742

 
Aleksey Nikolayev #:

我想我看到了一些生存分析应用的提示。

我自己没有做过,但我曾经问过类似的问题。在我看来,这种方法很有前途,但它来自一个完全不同的领域。

 
СанСаныч Фоменко #:

上面写着classDist {caret},也就是说,它指定了一个特定函数,该函数是caret PACKAGE 的一部分

据我所知,你不懂 R。那你为什么还要在这个主题和 MO 上浪费时间呢?

不掌握 R 语言,讨论 MO 就毫无意义。

我对熵保持沉默,只是因为交叉熵是分类模型的标准损失函数....。MO不仅在R语言中实现!(只知道一个库,却不知道它所操作的实体的性质--你不知道你前进的方向)。

还有一个更难的问题--当你宣称"信息论"时,为什么要断然脱离统计学?

该领域是 数学 统计学 计算机科学 物理学 神经生物学 、信息工程和 电子工程 的交叉学科。

事实上,讨论是无主题的,如果你在片段和你的自我(甚至是关于某人,而不仅仅是关于你自己),而不是对话的主题...不幸的是,主题并没有改变(答案的具体性和主题并没有增加)
 
Maxim Dmitrievsky #:
这个愚钝的喉舌再次呼吁大家认清真相,但尚未决定哪个

你已经让版主烦透了,以至于他要拆穿一切。

请勿阅读用户JeeyCi 的挑衅性帖子(他的帖子 是挑衅并要求 "继续宴会")。
昨天我删除了几个带有脏话和粗野人身攻击的帖子,在此指导下 - 我删除了
JeeyCi 帖子

我在主题中提出了两次警告,但都被置之不理,然后我删除了几个带有脏话的帖子。
那里唯一有文采的帖子(可读的)就是你的帖子--这篇(昨天的始作俑者):

关于交易、自动交易系统和交易策略测试的论坛

...

Maxim Dmitrievsky, 2022.09.10 12:15

有基于模型的、与模型无关的和混合特征选择。如果采用不可知论,那就是相关性和互信息(基于熵)。后者与前者的区别在于其捕捉非线性依赖关系的能力,其他方面都是一样的。在这种情况下,很难甚至不可能谈论特征与目标之间的任何关系。这只是一种相关性。但这对剔除无意义的特征是有用的。

您可以在滑动窗口、难以捉摸窗口、滑动窗口或摩擦窗口中进行处理

如果你想具体确定因果关系,那就是因果推断,包括使用 MO,我不知道如何将 MO 应用于时间序列,因为我没有研究过这个主题。

而且之前所有的方法都不能用于寻找因果关系,只能用于算法的优化训练。

所以,市民们又一次无法集中精力,把苍蝇从他们的肉排里赶走。

关于伟大而万能的 R,我们已经听过很多次了。很显然,如果你把一只猴子放在它后面,它也可以认为自己是一个统计学家和分析家,它是如此伟大。

是的,我偶尔会删除脏话,尤其是持续半天、两页文字的脏话(比如昨天)。

----------------

这个主题非常受欢迎(甚至在英语论坛上也有人阅读,被认为是这个主题的关键主题)。
所以请--少说脏话。

 
mytarmailS #:

如果您分析一下成功或不成功交易者的 TS,您就会发现他们都在进行水平交易。

我从未见过一个成功的交易者借助指标进行交易。

价位是一个清晰易懂的切入点,有明确的止损....。

如果您能以低风险进行交易,您就不需要其他任何东西了,每次交易的低风险/精确的入场 才是最重要的!

在 MO 的帮助下,您可以寻找 PD/SP 的水平以及准确的入场点,这不是一件小事,也不简单,您不能在有关 MO 的博客中读到,您需要用自己的头脑....。

您还可以在 sb 图表上绘制水平线,它也是一个时间序列。大家都受够你了,我们不再回复你了。你每天都在胡说八道。
 
mytarmailS #:

下面是一个随机产生的包含 5 个特征和 1 个二进制目标的样本的例子

福雷斯特和菲切选择器

任务队列已经卸载了一些--可以运行脚本了。我运行后发现了一个错误。

> install.packages("randomForest")
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Installing package into ‘C:/Users/S_V_A/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/src/contrib:
  cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'
Warning in install.packages :
  package ‘randomForest’ is not available (for R version 4.0.5)
Warning in install.packages :
  unable to access index for repository https://cran.rstudio.com/bin/windows/contrib/4.0:
  cannot open URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/PACKAGES'

> library(randomForest)
Error in library(randomForest) : нет пакета под названием ‘randomForest’

我的理解是,程序需要 R 4.0 的旧版本?

我搜索了旧版本,但没有找到。可怕的不兼容性当然令人厌恶。

 
Aleksey Vyazmikin #:

任务队列已经卸载了一些 - 可以运行脚本了。我运行它时出现了错误。

我的理解是否正确,即程序需要旧版本的 R 4.0?

我使用的是 R-3.6.3。

我在旧版 R-3.6. 3 上写这篇文章 是出于我自己的原因,所以这是我的问题...

我无法想象软件包会从 tap.... 中移除。

Aleksey Vyazmikin#

我的理解是,程序需要旧版本的 R 4.0?

正确

Aleksey Vyazmikin#

嗯,总的来说,我找过旧版本,但没找到。可怕的不兼容性当然令人厌恶。

听着,也许你不能去做交易,这样的smikalka?))

有了兼容性,一切都好办了,比如 python,只会羡慕这样的兼容性....。


另请参见

https://stackoverflow.com/questions/62541885/package-randomforest-is-not-available-for-r-version-4-0-2

在当前版本上试试

urlPackage <- "https://cran.r-project.org/src/contrib/Archive/randomForest/randomForest_4.6-12.tar.gz"
install.packages(urlPackage, repos=NULL, type="source") 

 
我们来总结一下桑尼奇的理论(因为他自己也没有将其正规化并举例说明):

*他的特征选择方法基于相关性,因为 "关系 "和 "联系 "就是相关性的定义。

*这样我们就能对历史进行隐式拟合,与 LDA(线性判别分析)或 PCA 的意义相似,简化了学习过程,减少了误差。

*甚至没有一种理论认为,训练有素的模型在新数据上(不涉及估计特征和目标之间的联系)应该表现得更好,因为特征已经拟合到了特征或(更糟糕的)现有历史上。

*在滑动窗口中平均 QC 可以在一定程度上改善这种情况,比如你可以估计差值并选择更稳定的差值。至少我们有一些统计数据可以依赖。

*我想的是因果关系或统计意义上的显著关系,但他的方法并非如此。
 
Maxim Dmitrievsky #:
我总结一下桑尼奇的理论(因为他自己也没有把理论正规化并举例说明):

*他的特征选择方法基于相关性,因为 "关系 "和 "关系 "是相关性的定义。

*这样我们就能对历史进行隐式拟合,其意义类似于 LDA(线性判别分析)或 PCA,简化了学习过程,减少了误差。

*甚至没有一种理论认为,训练有素的模型应该在新数据(不涉及特征-目标关系的估计)上表现得更好,因为这些特征之前是与性状或(更糟的是)与整个可用历史拟合的。

*我所说的关系是指因果关系或统计意义上的显著关系,但他的方法并非如此。

恕我直言,这不是一篇总结(不是文摘或摘要)。它充满了个人态度和毫无根据的攻击。

你会认为有人会有一个有效的理论,即 "训练有素的模型应该在新数据上有效":-)并且是经过验证的......是的。

 
Maxim Kuznetsov #:

恕我直言,但这不是总结(不是文摘或摘要)。这是一种个人态度和毫无根据的攻击。

你会认为有人会有一个有效的理论,即 "训练有素的模型应该在新数据上有效":-)并得到验证......是的。

如果你仔细阅读,就会发现第 2 点中的伏笔,即故事的初始拟合。这就是为什么会出现学习误差下降的原因。

如果不对所有可用的历史数据进行分析,那么第 4 点就比较乐观了。只有在进行线性抽样时,才应该进行拟合。在新数据上对模型进行充分估计。

我对心理学并不了解,所以从来没听说过。我本人也不认识什么人。
 
СанСаныч Фоменко #:

没有足够的能力达到 EA 水平。但模型拟合误差的结果是:从 8%到 22%的拟合误差在拟合部分和样本外差别不大。

这说明在训练之前已经对整个历史进行了拟合。如果不是这样,请指正。特征是在哪个区间估计/选择的,训练又是在哪个区间进行的?

我也有类似的方法,我可以在本周末与大家分享结果。前提是要有实质性的交流,而不是文字游戏。