交易中的机器学习：理论、模型、实践和算法交易

Alexey Burnakov 2016.08.08 14:43 #911

Vizard_。
OK))))，但要仔细阅读条件 --
"两个样本的后期结果，以%为单位（成功预测的案例）（训练=xx%，测试=xx%）。不需要指定方法和模型，只需要数字"。
我们正在等待更多的结果。我想知道米哈伊尔-马尔丘卡耶斯会得出什么结论。

我的结果（如果你愿意，我也会给你方法）。

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

56%在培训中。

> table(glm_predict_train[, 2], glm_predict_train[, 1])

down up

down 333 181

up 256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

down up

down 0.333 0.181

up 0.256 0.230

考试成绩为52%。

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

down up

down 332 173

up 309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

down up

down 0.332 0.173

up 0.309 0.186

Machine learning in trading: Machine Learning and Neural FX MATRIX PRO Trading

Mihail Marchukajtes 2016.08.08 14:49 #912

总之，最大的概括程度约为53%，所以.....。偶尔会出现 "垃圾进垃圾出"，即garbage....。我无法在测试中检查，因为Excel不支持长公式。我不想在MKUL中写它，如果模型的质量正常，我会试试，但以这样的概括比例，我认为测试结果不会很好......。

Dr. Trader 2016.08.08 15:24 #913

mytarmailS:
我不明白这种 "可预测性 "是如何计算的，如果不考虑目标，是否有任何意义？

有一些公式可以估算出信号的嘈杂程度，反之亦然。这些公式如何计算，计算什么，只有作者知道，我们只能相信他明白自己在做什么。
底线很简单--如果预测器本身不是 "噪音"，那么用它们来预测一些东西就会更容易。而如果你以某种方式处理它们，你可以得到一个更稳定的信号。一个稳定的信号是预测的良好基础。

你甚至可以用这个软件包的Omega()函数自己快速估计预测器，并将某些特定的预测器（来自训练表中的一列）的值应用于此。结果是0%--噪声和预测器是无用的。100%--一切都很好，可以使用该预测器。
我想，我们不应该把纯指标值送入函数，而应该把它们的增量送入函数，例如对于移动平均线--c(MA[0]-MA[1]，MA[1]-MA[2]，MA[2]-MA[3]，等等)。

关于目标值--是的，它们不在软件包中使用。这个包裹不能预测任何事情。它只是以某种方式确定哪些预测器可以信任，哪些不可以，并在此基础上再创造一些新的预测器。选择目标变量和训练预测模型必须以不同方式处理。符合逻辑的是，有些目标变量可以预测得更好，有些更差。
目标变量对任何包来说都是一个问题。甚至不能确定使用的目标变量是否可以用现有的预测器进行预测。例如，我可以使用 "下一栏的价格上升/下降 "或 "上升/下降之字形 "作为目标变量。我想学习如何创建新的目标变量，使其最适合现有的预测器。谁知道呢，也许我可以用我的预测器完美地预测一个平面，但我永远不会知道，因为我没有试过。

Vizard_ 2016.08.08 15:53 #914

阿列克谢-伯纳科夫。

SanSanych Fomenko

米哈伊尔-马奇卡耶特

据我所知，没有人阅读条款和条件（任何数据操作都是允许的），所以我不会去折磨。事实上，一切都很简单。
我只需要从A6中提取滞后期，应用一个简单的公式七小于五，在两个样本上得到100%。谢谢大家。好运...

Mihail Marchukajtes 2016.08.08 16:02 #915

Vizard_。
据我所知，没有人阅读条款和条件（任何数据操作都是允许的），所以我不会去折磨。事实上，一切都很简单。
只需要从A6中提取滞后期，应用一个简单的公式七小于五，就可以得到两个样本的100%。谢谢大家。好运...

那么，有什么好处呢？我也可以在这样的一堆输入垃圾中编码一个输出变量。你绝对猜不到。我仍然不知道这有什么意义。

Dr. Trader 2016.08.08 16:15 #916

Mihail Marchukajtes:
这有什么好玩的？我也可以在一堆输入的垃圾中编码一个输出变量。你将无法猜到它。我仍然不知道这有什么意义。

他提请我们注意，所使用的数据量并不总是足以进行预测。例如，如果把自己限制在9个小节，我们可能会错过更远的小节的重要信息。还有，如果不考虑一个预测器与其他预测器的相互作用，我们就无法评估它。

Vizard_ 2016.08.08 16:27 #917

Mihail Marchukajtes:
这有什么好玩的？我也可以在一堆输入的垃圾中编码一个输出变量。你将无法猜到它。我还是不明白这个问题的意义。

那就是你看不到地鼠，但你可以看到它)。
来吧，让我们试试吧。只是一个简单的问题。

Mihail Marchukajtes 2016.08.08 16:32 #918

Vizard_。
在这一点上，你看不到地鼠，但它就在那里）））。
来吧，让我们试一试。只是一个简单的问题。

来吧，我会想办法的....

Mihail Marchukajtes 2016.08.08 16:39 #919

例如，这个文件。Chitso火车不需要做任何测试。Reshetov的优化器显示垃圾il 56%，但打地鼠也在那里。谁能找到....？？真的不明白这些游戏的意义，当输出是由输入的转化而成的，这里和网络不会被需要....。就这样吧....

Mihail Marchukajtes 2016.08.08 16:40 #920

Mihail Marchukajtes:
好比说这个文件。Chitso火车不需要做任何测试。雷舍托夫的优化器显示垃圾或56%，但地鼠也在那里。谁能找到....？？真的不明白这些游戏的意义，当输出是由输入的转化而成时，就不需要网络了，要么....。so....

这个论坛真他妈的气人，一个简单的rar档案不能被附加....。这是一个可悲的词....

附加的文件：

lm9m_mwe9y5a1.txt 5 kb

交易中的机器学习：理论、模型、实践和算法交易 - 页 92