交易中的机器学习:理论、模型、实践和算法交易 - 页 98

 
Dr.Trader:

实验的第二部分是。

我有14个先前选定的预测因子,又增加了14个随机值。现在允许的ForeCA组件的最大数量是28个。

在两种情况下,用所有28个组件对训练数据的预测准确率(有和没有foreCA)为76%,在两种情况下对新数据的预测准确率为57%。

我不认为foreCA应对了预测器中的垃圾,我没有看到预期的奇迹。

那很好啊!

谢谢你减少我的工作量

 
我注意到,在其他数据上,我的ForeCA例子并不奏效,因为预测因子的协方差太高。
这个问题可以用这个代码来解决。
#это  строки кода из примера:
targetName <- colnames(trainData)[ncol(trainData)]
predictorColnames <- colnames(trainData)[-ncol(trainData)]
#...
#это  нужно добавить сразу после них:
while(TRUE){
        covMatrix <- cov(as.matrix(trainData[,predictorColnames]))
        covMatrixRank <- qr(covMatrix)$rank
        if(covMatrixRank == ncol(covMatrix)){
                break
        }else{
                eigenValues <- abs(eigen(covMatrix)$values)
                #  eigenValuesLow <- order(eigenValues, decreasing=FALSE)[1:(ncol(covMatrix)-covMatrixRank)]
                #  predictorColnames <- predictorColnames[-eigenValuesLow]
                eigenValuesHigh <- order(eigenValues, decreasing=TRUE)[1]
                predictorColnames <- predictorColnames[-eigenValuesHigh]
        }
}
只需从协方差矩阵中逐一删除高特征值的预测因子。 也许我们应该反过来删除低特征值的预测因子。但它仍然很长,效率很低,但如何使它更好--我还不知道。
 

为什么这些指标从来没有也永远不会起作用? 我的观点...以及如何尝试修复它....

关于发呆的一点看法...:)

我们都知道,市场不是静止的,但我们大多使用工具进行市场分析,包括我自己。

例如,有成熟的算法用于分析非稳态数据,而这些算法并不多:隐马尔科夫模型 "HMM" 、参数分组核算方法 "MGUA",以及具体用于BP的循环神经网络,为什么我们不使用这些算法?但我们都在使用脚手架、传统的神经元学、与问题无关的最愚蠢的分类器

这是为什么呢?为什么即使我明白这一切,我还是一直在练习射频......我们有什么问题...写下你对它的看法...

现在,关于指标和一点点关于极客的问题......。;)

知道市场是不稳定的,我们试图找到一些能在未来发挥作用的指标,如果市场不断变化,这怎么可能呢? 答案很明显--不可能!!!或者说没有那么简单......?

我认为有一种方法可以更客观地看待市场,使用指标、频谱分析,在这种情况下,小波将有助于说明我们的想法。

w

在图片中,左侧有一个显示周期的标尺,即市场上存在的周期,图表上的红色区域越多,说明越强的周期占优势,最强的周期用黑色轮廓勾勒出来,如图所示...

在你运行代码之前,请不要继续阅读。

代码完成后,在工作室的图片上按下 "向后箭头",查看运行代码后出现的所有图片。

install.packages("dplR")

hankel <- function(data, r=10) {
  do.call(cbind,
          lapply(0:(r-1),function(i) { data[(i+1):(length(data)-(r-1-i))]}))} #hankel  matrx

price <- cumsum(rnorm(200))+1000    ;    plot(price,t="l")
H.price <- hankel(price,100)

library(dplR)
for(i in nrow(H.price):1 ){
  m <- morlet(y1 = H.price[i,] )
  wavelet.plot(m)
}

你看,市场上的周期像天上的云一样不断地浮动,现在很清楚,市场上没有什么固定的周期可做,但你可以适应。如果确定市场上当前的强势期,并不断调整指标,正是为了那个真正的--客观的时期,也就是现在的市场?

链接

https://cran.r-project.org/web/packages/dplR/vignettes/timeseries-dplR.pdf

https://www.r-bloggers.com/wavelet-spectrogram-non-stationary-financial-time-series-analysis-using-r-ttrquantmoddplr-with-usdeur/

 

对于NS的爱好者,这里

深度学习第一部分:符号式深度学习框架的比较

Deep Learning Part 1: Comparison of Symbolic Deep Learning Frameworks
Deep Learning Part 1: Comparison of Symbolic Deep Learning Frameworks
  • Joseph Rickert
  • www.r-bloggers.com
This blog series is based on my upcoming talk on re-usability of Deep Learning Models at the Hadoop+Strata World Conference in Singapore. This blog series will be in several parts – where I describe my experiences and go deep into the reasons behind my choices. Deep learning is an emerging field of research, which has its application across...
 
mytarmailS:

为什么这些指标从来没有也永远不会起作用? 我的观点...我们又该如何努力解决呢....

我们都知道市场不是静止的,但我们用来分析市场 的绝大多数工具都是静止序列,包括我在内,我不知道为什么,原因是什么? 时尚?"固执"?

知道市场是非稳态的,我们试图找到一些对未来有效的指标,如果市场在不断变化,这怎么可能呢?


但分类,正如桑尼奇所写的 那样,不会有效果吗?
 
尤里-叶夫谢恩科夫
而分类,正如桑尼奇所写的 那样,不会做?
让我们说得更具体些,因为我不明白我们在谈论的是什么分类
 
mytarmailS:
让我们更具体一点,因为我完全不明白我们在谈论什么分类问题

我是什么,一个医生?这里是桑尼奇写的。

"这里我们讨论的是基于分类的预测,在预测下一栏时不考虑之前的状态。基于分类的预测(预报)是基于模式的预测。如果过去有新闻导致了不符合以前价值的变化(不是推断出来的),那么分类将抓住这种变化,如果未来有类似的变化(不完全相同,但类似),它将被识别并做出正确的预测。"

这就是我认为值得深究的地方:"分类会抓住这样的变化"。

 
尤里-叶夫谢恩科夫

我是什么,一个医生?这里是桑尼奇写的。

"这里我们讨论的是基于分类的预测,在预测下一栏时不考虑之前的状态。基于分类的预测(预报)是基于模式的预测。如果过去有新闻导致了不符合以前价值的变化(不是推断出来的),那么分类将抓住这种变化,如果未来有类似的变化(不完全相同,但类似),它将被识别并做出正确的预测。"

因此,我认为值得在这个方向上挖掘:"分类将抓住这样的变化"。

实验是真理的标准--不要想,要做

我个人认为,光谱分析更有前途,但这是对我个人 而言...

 
Yuri Evseenkov:


所以我认为值得在这个方向上挖掘:"分类将抓住这样的变化"。

分类不是万能的,也不是制造圣杯的工具。

应用分类的第一件事是将工具应用于工具所适用的问题。例如,将光谱分析应用于金融市场的想法已经讨论过很多次,都是看似很好的工具,但对于其他对象,啊,不,又提供了。

第二。这个分类很适用于金融市场,但也有很多麻烦,正如上面写的那样。但对于分类,我们可以把主要问题--重新训练(过度拟合)TS的问题。还有什么能比这更重要的呢?当然,被剥夺拥有最喜爱的圣杯的幻想并不好,但这里有一个选择:幸福是好的,但真理是更好的?

第三。分类提出了一个相当具体的问题:我们在预测什么。让我们把它与TA进行比较。我们接受指标。它总是一个酒吧[1]。不使用当前栏。这对H1意味着什么?我们用每小时的新鲜度信息来预测市场的进入!这是在最好的情况下。

这在分类中是完全不同的。你将目标变量的当前值与昨天的原始数据相匹配--将目标值移动一个或多个柱子。当你使用一个适合这种数据的模型时,你总是现实地预测下一个条形图到来时的未来。

PS。

如果你要用它来预测突然的市场动向(新闻),如果你能形成一个目标变量,你就会成功,而在更简单的情况下,你的问题就大了。

 
DAFomenko:

例如,将光谱分析应用于金融市场的想法已经讨论过很多次了,都是看似很好的工具,但对于其他对象,啊,不,又被提出来了。

????????????????????????

如果一个研究人员对光谱分析一无所知,最后只看到维基百科上的文章,我同意它不适用于市场 :)