交易中的机器学习:理论、模型、实践和算法交易 - 页 82

 
mytarmailS:

在训练模型时,树越多,"0 "类就学得越多,随着 "0 "类学得越来越多,它开始(吸收-挤出)"1 "和"-1 "类。这就是为什么树越多交易越少的原因

有些事情是不对的,森林几乎总是被训练到100%的准确性,有任何偏差。在用这样的数据进行验证时,可能会有问题,但在训练数据上预测结果,森林将总是准确的。我可以假设你不是在使用分类,而是在使用回归,当你测试模型时,你不会得到清晰的类-1;0;1,而是在-1到1的范围内的实际数字。有了这种倾斜的回归,就不会有好的结果。

一个更好的方法是,你有一个trainingData表,其中最后一列是目标变量,所有其他列是预测因子。

trainingData <- data.frame(trainingData) #на  всякий случай сконвертировать таблицу из матрицы в датафрейм, если не было сделано раньше
trainingData[,ncol(trainingData)] <- factor(trainingData[,ncol(trainingData)]) #тип  последней колонки сменить на фактор. Модели в R обычно сразу по этому типу понимают что нужна классификация, и работают чуть иначе чем при регрессии
 
mytarmailS:

并非如此...

我写的东西只适用于我的方法。

你知道我是如何做我的目标的,它的支点

我有三类枢轴( 1 , -1 , 0 )

你也知道,类的偏度是巨大的,"0 "类比"-1 "和 "1 "大几十倍。

这意味着模型最好在 "0 "类上训练,因为它有最多的观测数据,在训练模型时,树越多,"0 "类就被训练得越多,随着 "0 "类变得更好更强,它开始(吸收-挤出)"1","-1 "类。这就是为什么树越多交易越少的原因

对我来说,你写出了令人惊奇的东西!

对于不平衡的班级来说,这是一个非常原始的方法。

那么我的理解是,你的预测器列表不仅不包含噪音,而且还具有非常高的预测能力。

如果是这样,你是如何实现的?

 
Dr.Trader:

有些事情是不对的,森林几乎总是被训练到100%的准确性,有任何偏差。在验证时,这样的数据可能会有问题,但森林总是会准确地预测训练数据的结果。我可以假设你不是在使用分类,而是在使用回归,当你测试模型时,你不会得到清晰的类-1;0;1,而是在-1到1的范围内的实际数字。有了这种倾斜的回归,就不会有好的结果。

最好这样做,假设你有一个trainingData表,其中最后一列是目标变量,所有其他列是预测变量。

一棵树100%的价格绝对是无稽之谈!

如果你的预测器都是噪音,这个结果就很难实现:仍然会有3%-5%的误差。在所有的交叉验证和其他技巧下,噪声总是给出非常好的结果。

100%的准确率只意味着:在预测因素中,你有一个目标变量的重复(对它的一些修改)。也就是说,该模型着眼于未来。

 
桑桑尼茨-弗门科


100%的准确率只意味着一件事:在预测因素中,你有一个目标变量的重复(对它的某种修改)。也就是说,该模型着眼于未来。

这是一次数据泄漏。你需要再次检查数据。
 
阿列克谢-伯纳科夫

你不喜欢这种做法的原因是什么?你打算如何调整参数?

是的,这个方法很好,很难想出更好的办法,问题出在市场本身......。

记得吗,我告诉过你我的实验、关联和在历史中寻找模式(不是SSA,而是之前),我做了什么。

我把目前的情况,在过去寻找它的类似物,并看它们是如何结束的,如果我找到一个情况 "X",当我找到20个类似物,其中17个以下跌结束,3个以上涨结束,所以统计学上的优势是明显的(我们必须卖出),顺便说一下,为什么不是交叉验证? 只是通过单一的模式,你不同意? 我们发现这种模式不会起作用,我们发现以巨大的概率,市场会上涨,它以巨大的统计概率违背了自己的统计

简单点说,如果昨天我们有事件 "x",之后我们有秋天,前天我们有事件"x",之后一切也都倒下了,昨天在事件"x "之后有一个秋天--所以如果今天我们有 事件"x"--一切都会增长,什么交叉验证会帮助我们?没有,从来没有。

最重要的是要了解这个过程。

市场是一个残酷的行业,一些建立这个行业的人合法地从其他人那里拿钱。 群众,大多数人,总是不得不输,每个人都知道它,每个人都写它,没有人隐藏它,总之,它是一个公理--95%的交易者输钱的模式--市场对大多数人的行动,交易者输钱的概率是这95%

那么众人在交易时使用什么呢?事实上,除了一件事,群众没有任何东西让他们做交易。

任何从对图表的视觉观察开始,在分解中寻找模式,并 神经网络训练结束的 行为,都不过是通过统计数字进行交易,而这些统计数字在市场上是不起作用的,你知道我在说什么吗?

市场的走势与群众的交易相悖 ----- 群众的行为是基于统计数字 ------ 你需要做的就是预测群众在未来的行动,然后做相反的事情,预测的唯一方法就是统计数字。

))))从一个开始,以第三个结束 :)好了,就这样吧,至少我把它从我的系统中解脱出来了)。

p.s. 我在这里说的都是我的个人意见,我不想把任何东西强加给别人,我可以争论并证明它,但我没有心情。

 
Dr.Trader:

有些事情是不对的,森林几乎总是被训练到100%的准确性,有任何偏差。在验证时,这样的数据可能会有问题,但森林总是会准确地预测训练数据的结果。我可以假设你不是在使用分类,而是在使用回归,当你测试模型时,你不会得到清晰的类-1;0;1,而是在-1到1范围内的实际数字。有了这样一个倾斜的回归,就不会有好的结果。

最好有一个trainingData表,其中最后一列是目标变量,所有其他列是预测变量。

不,分类,你有一些错误...

qqq

我是这样想的,两个模型,分别是买入和卖出类(1, 0)和(-1, 0)。

看起来很难看 )同意

 
mytarmailS:

是的,方法很好,很难想出更好的办法,问题出在市场本身......。

记得我告诉过你我的实验、关联和在历史中寻找模式(不是SSA,而是以前),我做了什么。

我把目前的情况,在过去寻找它的类似物,并看它们是如何结束的,如果我找到一个情况 "X",当我找到20个类似物,其中17个以下跌结束,3个以上涨结束,所以统计学上的优势是明显的(我们必须卖出),顺便说一下,为什么不是交叉验证? 只是通过单一的模式,你不同意? 我们发现这种模式不会起作用,我们发现以巨大的概率,市场会上涨,它以巨大的统计概率违背了自己的统计

简单点说,如果昨天我们有事件 "x",之后我们有秋天,前天我们有事件"x",之后一切也都倒下了,昨天在事件"x "之后有一个秋天--所以如果今天我们有 事件"x"--一切都会增长,什么交叉验证会帮助我们?没有,从来没有。

最重要的是要了解这个过程。

市场是一个残酷的行业,一些建立这个行业的人合法地从其他人那里拿钱。 群众,大多数人,总是不得不输,每个人都知道它,每个人都写它,没有人隐藏它,总之,它是一个公理--95%的交易者输钱的模式--市场对大多数人的行动,交易者输钱的概率是这95%

那么众人在交易时使用什么呢?事实上,除了一件事,群众没有任何东西让他们做交易。

任何从对图表的视觉观察开始,在细分市场中寻找模式,并 神经网络训练结束的 行为,都不过是通过统计数字进行交易,而这些统计数字在市场中是不起作用的,你知道我在说什么?

市场的走势与群众的交易相悖 ----- 群众的行为是基于统计数字 ------ 你需要做的就是预测群众在未来的行动,然后做相反的事情,预测的唯一方法就是统计数字。

))))从一个开始,以第三个结束 :)好了,就这样吧,至少我把它从我的系统中解脱出来了)。

p.s. 我在这里所说的一切只是我的观点,没有人强加什么,我可以争论和证明,但不是心情。

好的。

对我来说,外汇是一个带有噪音的简单信号。如果我发现上瘾了,我就把钱拿走,如果我重新培训,经纪人就把钱拿走。而关于人群等,我没有任何信息。我不知道如何才能得到足够的东西。

我想在完成这个实验后开始处理股票报价。我将在那里得到真正的数量,这也是一个优点。

 
阿列克谢-伯纳科夫

好的。

对我来说,外汇是一个带有噪音的愚蠢信号。如果我发现上瘾了,我就拿钱,如果我再培训,经纪人就拿钱。而关于人群等,我没有任何信息。我不知道如何才能得到足够的东西。

我想在完成这个实验后开始处理股票报价。我想用真实的引语。

如果你在外汇上交易欧元,你需要了解是什么驱动你的外汇。如果你在CME上交易欧元兑美元,真正的人群会进行真正的交易,而你在终端广播中看到的只是一张重复真实欧元兑美元走势的图片,仅此而已,你在MT4上的交易对市场没有影响,没有人把你的10美元(比喻) 带到银行间市场,你与你的经纪公司交易,仅此而已,相反它对你进行交易,因为你的损失就是它的净利润。
 
阿列克谢-伯纳科夫

在完成这个实验后,我想拿起证券交易所的报价。那里会有真正的量,这也是一个优点。

我几乎一直在真实市场上交易,我知道我在说什么。
 
mytarmailS:
相信我,交易量不会对你有多大帮助,你可以用常规的波动率来代替它,我几乎一直只在真实的市场上交易,我知道我在说什么。

好的。

我会试着把卷子做成输入框,然后我们再看。