СанСаныч Фоменко 2016.08.10 18:23 #971

Dr.Trader:

实验的第二部分是。

我有14个先前选定的预测因子，又增加了14个随机值。现在允许的ForeCA组件的最大数量是28个。

在两种情况下，用所有28个组件对训练数据的预测准确率（有和没有foreCA）为76%，在两种情况下对新数据的预测准确率为57%。

我不认为foreCA应对了预测器中的垃圾，我没有看到预期的奇迹。

那很好啊!

谢谢你减少我的工作量

Dr. Trader 2016.08.10 19:46 #972

我注意到，在其他数据上，我的ForeCA例子并不奏效，因为预测因子的协方差太高。
这个问题可以用这个代码来解决。

#это  строки кода из примера:
targetName <- colnames(trainData)[ncol(trainData)]
predictorColnames <- colnames(trainData)[-ncol(trainData)]
#...
#это  нужно добавить сразу после них:
while(TRUE){
        covMatrix <- cov(as.matrix(trainData[,predictorColnames]))
        covMatrixRank <- qr(covMatrix)$rank
        if(covMatrixRank == ncol(covMatrix)){
                break
        }else{
                eigenValues <- abs(eigen(covMatrix)$values)
                #  eigenValuesLow <- order(eigenValues, decreasing=FALSE)[1:(ncol(covMatrix)-covMatrixRank)]
                #  predictorColnames <- predictorColnames[-eigenValuesLow]
                eigenValuesHigh <- order(eigenValues, decreasing=TRUE)[1]
                predictorColnames <- predictorColnames[-eigenValuesHigh]
        }
}

只需从协方差矩阵中逐一删除高特征值的预测因子。也许我们应该反过来删除低特征值的预测因子。但它仍然很长，效率很低，但如何使它更好--我还不知道。

mytarmailS 2016.08.11 07:40 #973

为什么这些指标从来没有也永远不会起作用？ 我的观点...以及如何尝试修复它....

关于发呆的一点看法...:)

我们都知道，市场不是静止的，但我们大多使用工具进行市场分析，包括我自己。

例如，有成熟的算法用于分析非稳态数据，而这些算法并不多：隐马尔科夫模型 "HMM" 、参数分组核算方法 "MGUA"，以及具体用于BP的循环神经网络，为什么我们不使用这些算法？但我们都在使用脚手架、传统的神经元学、与问题无关的最愚蠢的分类器

这是为什么呢？为什么即使我明白这一切，我还是一直在练习射频......我们有什么问题...写下你对它的看法...

现在，关于指标和一点点关于极客的问题......。;)

知道市场是不稳定的，我们试图找到一些能在未来发挥作用的指标，如果市场不断变化，这怎么可能呢？答案很明显--不可能！！！或者说没有那么简单......？

我认为有一种方法可以更客观地看待市场，使用指标、频谱分析，在这种情况下，小波将有助于说明我们的想法。

在图片中，左侧有一个显示周期的标尺，即市场上存在的周期，图表上的红色区域越多，说明越强的周期占优势，最强的周期用黑色轮廓勾勒出来，如图所示...

在你运行代码之前，请不要继续阅读。

代码完成后，在工作室的图片上按下 "向后箭头"，查看运行代码后出现的所有图片。

install.packages("dplR")

hankel <- function(data, r=10) {
  do.call(cbind,
          lapply(0:(r-1),function(i) { data[(i+1):(length(data)-(r-1-i))]}))} #hankel  matrx

price <- cumsum(rnorm(200))+1000    ;    plot(price,t="l")
H.price <- hankel(price,100)

library(dplR)
for(i in nrow(H.price):1 ){
  m <- morlet(y1 = H.price[i,] )
  wavelet.plot(m)
}

你看，市场上的周期像天上的云一样不断地浮动，现在很清楚，市场上没有什么固定的周期可做，但你可以适应。如果确定市场上当前的强势期，并不断调整指标，正是为了那个真正的--客观的时期，也就是现在的市场？

链接

https://cran.r-project.org/web/packages/dplR/vignettes/timeseries-dplR.pdf

https://www.r-bloggers.com/wavelet-spectrogram-non-stationary-financial-time-series-analysis-using-r-ttrquantmoddplr-with-usdeur/

СанСаныч Фоменко 2016.08.11 07:40 #974

对于NS的爱好者，这里

深度学习第一部分：符号式深度学习框架的比较

Deep Learning Part 1: Comparison of Symbolic Deep Learning Frameworks

Joseph Rickert
www.r-bloggers.com

This blog series is based on my upcoming talk on re-usability of Deep Learning Models at the Hadoop+Strata World Conference in Singapore. This blog series will be in several parts – where I describe my experiences and go deep into the reasons behind my choices. Deep learning is an emerging field of research, which has its application across...

Yuri Evseenkov 2016.08.11 13:18 #975

mytarmailS:

为什么这些指标从来没有也永远不会起作用？ 我的观点...我们又该如何努力解决呢....

我们都知道市场不是静止的，但我们用来分析市场的绝大多数工具都是静止序列，包括我在内，我不知道为什么，原因是什么？时尚？"固执"？

知道市场是非稳态的，我们试图找到一些对未来有效的指标，如果市场在不断变化，这怎么可能呢？

但分类，正如桑尼奇所写的那样，不会有效果吗？

mytarmailS 2016.08.11 13:22 #976

尤里-叶夫谢恩科夫。
而分类，正如桑尼奇所写的那样，不会做？

让我们说得更具体些，因为我不明白我们在谈论的是什么分类

Yuri Evseenkov 2016.08.11 13:32 #977

mytarmailS:
让我们更具体一点，因为我完全不明白我们在谈论什么分类问题

我是什么，一个医生？这里是桑尼奇写的。

"这里我们讨论的是基于分类的预测，在预测下一栏时不考虑之前的状态。基于分类的预测（预报）是基于模式的预测。如果过去有新闻导致了不符合以前价值的变化（不是推断出来的），那么分类将抓住这种变化，如果未来有类似的变化（不完全相同，但类似），它将被识别并做出正确的预测。"

这就是我认为值得深究的地方："分类会抓住这样的变化"。

mytarmailS 2016.08.11 13:40 #978

尤里-叶夫谢恩科夫。

我是什么，一个医生？这里是桑尼奇写的。

"这里我们讨论的是基于分类的预测，在预测下一栏时不考虑之前的状态。基于分类的预测（预报）是基于模式的预测。如果过去有新闻导致了不符合以前价值的变化（不是推断出来的），那么分类将抓住这种变化，如果未来有类似的变化（不完全相同，但类似），它将被识别并做出正确的预测。"

因此，我认为值得在这个方向上挖掘："分类将抓住这样的变化"。

实验是真理的标准--不要想，要做

我个人认为，光谱分析更有前途，但这是对我个人而言...

DAFomenko 2016.08.11 14:13 #979

Yuri Evseenkov:

所以我认为值得在这个方向上挖掘："分类将抓住这样的变化"。

分类不是万能的，也不是制造圣杯的工具。

应用分类的第一件事是将工具应用于工具所适用的问题。例如，将光谱分析应用于金融市场的想法已经讨论过很多次，都是看似很好的工具，但对于其他对象，啊，不，又提供了。

第二。这个分类很适用于金融市场，但也有很多麻烦，正如上面写的那样。但对于分类，我们可以把主要问题--重新训练（过度拟合）TS的问题。还有什么能比这更重要的呢？当然，被剥夺拥有最喜爱的圣杯的幻想并不好，但这里有一个选择：幸福是好的，但真理是更好的？

第三。分类提出了一个相当具体的问题：我们在预测什么。让我们把它与TA进行比较。我们接受指标。它总是一个酒吧[1]。不使用当前栏。这对H1意味着什么？我们用每小时的新鲜度信息来预测市场的进入!这是在最好的情况下。

这在分类中是完全不同的。你将目标变量的当前值与昨天的原始数据相匹配--将目标值移动一个或多个柱子。当你使用一个适合这种数据的模型时，你总是现实地预测下一个条形图到来时的未来。

PS。

如果你要用它来预测突然的市场动向（新闻），如果你能形成一个目标变量，你就会成功，而在更简单的情况下，你的问题就大了。

mytarmailS 2016.08.11 14:24 #980

DAFomenko:

例如，将光谱分析应用于金融市场的想法已经讨论过很多次了，都是看似很好的工具，但对于其他对象，啊，不，又被提出来了。

????????????????????????

如果一个研究人员对光谱分析一无所知，最后只看到维基百科上的文章，我同意它不适用于市场 :)

交易中的机器学习：理论、模型、实践和算法交易 - 页 98

深度学习第一部分：符号式深度学习框架的比较