交易中的机器学习:理论、模型、实践和算法交易 - 页 92

 
Vizard_
OK)))),但要仔细阅读条件 --
"两个样本的后期结果,以%为单位(成功预测的案例)(训练=xx%,测试=xx%)。不需要指定方法和模型,只需要数字"。
我们正在等待更多的结果。我想知道米哈伊尔-马尔丘卡耶斯会得出什么结论。

我的结果(如果你愿意,我也会给你方法)。

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

56%在培训中。

> table(glm_predict_train[, 2], glm_predict_train[, 1])

      

       down  up

  down  333 181

  up    256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

      

        down    up

  down 0.333 0.181

  up   0.256 0.230

考试成绩为52%。

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

      

       down  up

  down  332 173

  up    309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

      

        down    up

  down 0.332 0.173

  up   0.309 0.186

 
总之,最大的概括程度约为53%,所以.....。偶尔会出现 "垃圾进垃圾出",即garbage....。我无法在测试中检查,因为Excel不支持长公式。我不想在MKUL中写它,如果模型的质量正常,我会试试,但以这样的概括比例,我认为测试结果不会很好......。
 
mytarmailS:
我不明白这种 "可预测性 "是如何计算的,如果不考虑目标,是否有任何意义?

有一些公式可以估算出信号的嘈杂程度,反之亦然。这些公式如何计算,计算什么,只有作者知道,我们只能相信他明白自己在做什么。
底线很简单--如果预测器本身不是 "噪音",那么用它们来预测一些东西就会更容易。而如果你以某种方式处理它们,你可以得到一个更稳定的信号。一个稳定的信号是预测的良好基础。

你甚至可以用这个软件包的Omega()函数自己快速估计预测器,并将某些特定的预测器(来自训练表中的一列)的值应用于此。 结果是0%--噪声和预测器是无用的。100%--一切都很好,可以使用该预测器。
我想,我们不应该把纯指标值送入函数,而应该把它们的增量送入函数,例如对于移动平均线--c(MA[0]-MA[1],MA[1]-MA[2],MA[2]-MA[3],等等)。

关于目标值--是的,它们不在软件包中使用。这个包裹不能预测任何事情。它只是以某种方式确定哪些预测器可以信任,哪些不可以,并在此基础上再创造一些新的预测器。选择目标变量和训练预测模型必须以不同方式处理。符合逻辑的是,有些目标变量可以预测得更好,有些更差。
目标变量对任何包来说都是一个问题。甚至不能确定使用的目标变量是否可以用现有的预测器进行预测。例如,我可以使用 "下一栏的价格上升/下降 "或 "上升/下降之字形 "作为目标变量。我想学习如何创建新的目标变量,使其最适合现有的预测器。谁知道呢,也许我可以用我的预测器完美地预测一个平面,但我永远不会知道,因为我没有试过。

 
阿列克谢-伯纳科夫

SanSanych Fomenko

米哈伊尔-马奇卡耶特

据我所知,没有人阅读条款和条件(任何数据操作都是允许的),所以我不会去折磨。事实上,一切都很简单。
我只需要从A6中提取滞后期,应用一个简单的公式七小于五,在两个样本上得到100%。谢谢大家。好运...
 
Vizard_
据我所知,没有人阅读条款和条件(任何数据操作都是允许的),所以我不会去折磨。事实上,一切都很简单。
只需要从A6中提取滞后期,应用一个简单的公式七小于五,就可以得到两个样本的100%。谢谢大家。好运...
那么,有什么好处呢?我也可以在这样的一堆输入垃圾中编码一个输出变量。你绝对猜不到。我仍然不知道这有什么意义。
 
Mihail Marchukajtes:
这有什么好玩的?我也可以在一堆输入的垃圾中编码一个输出变量。你将无法猜到它。我仍然不知道这有什么意义。
他提请我们注意,所使用的数据量并不总是足以进行预测。例如,如果把自己限制在9个小节,我们可能会错过更远的小节的重要信息。还有,如果不考虑一个预测器与其他预测器的相互作用,我们就无法评估它。
 
Mihail Marchukajtes:
这有什么好玩的?我也可以在一堆输入的垃圾中编码一个输出变量。你将无法猜到它。我还是不明白这个问题的意义。
那就是你看不到地鼠,但你可以看到它)。
来吧,让我们试试吧。只是一个简单的问题。
 
Vizard_
在这一点上,你看不到地鼠,但它就在那里)))。
来吧,让我们试一试。只是一个简单的问题。
来吧,我会想办法的....
 
例如,这个文件。Chitso火车不需要做任何测试。Reshetov的优化器显示垃圾il 56%,但打地鼠也在那里。谁能找到....??真的不明白这些游戏的意义,当输出是由输入的转化而成的,这里和网络不会被需要....。就这样吧....
 
Mihail Marchukajtes:
好比说这个文件。Chitso火车不需要做任何测试。雷舍托夫的优化器显示垃圾或56%,但地鼠也在那里。谁能找到....??真的不明白这些游戏的意义,当输出是由输入的转化而成时,就不需要网络了,要么....。so....
这个论坛真他妈的气人,一个简单的rar档案不能被附加....。这是一个可悲的词....
附加的文件: