交易中的机器学习:理论、模型、实践和算法交易 - 页 3179

 
Maxim Dmitrievsky #:
看哪,如果你没有得到原始系列的模式,希尔伯特之路就不会把你引向你所珍视的目标。你们的努力将变成魔鬼的行为,你们将发现可耻的屠杀,而不是天堂。

😁😁

 

我问 boost 开发人员如何处理多重共线性和特征选择(预处理)。

我得到了一个明确的答案:老兄,算了吧:)

 
Maxim Dmitrievsky #:

如果将 flots 转换为 ints 主要是为了加速处理超大数据,那我为什么还要问呢?

运气好的话,奖励可以是对模型的一个小校准,或好或坏。

他们只会给你同样的答案,所以你可能不敢问,因为这会让你多年的努力付之东流:)

如果我以结果来判断我的劳动,我的劳动又怎么会因为回答问题而贬值呢?

是的,从指标增长来看,结果并不是超级的,但它是存在的,包括其他表现形式。

例如,在有些样本中,如果不使用我的方法进行预处理,我根本无法在新数据上得到一个有利可图的模型。

 
Maxim Dmitrievsky #:

我问助推器开发人员如何处理多重共线性和特征选择(预处理)。

我得到了一个明确的答案:老兄,算了吧:)

如果有十亿个特征,我们就应该忘掉它吗?还是应该选择那些不相关的特征?
 
mytarmailS #:
如果有十亿个性状,我们是否就可以把它忘掉?还是我们仍然要选择那些不相关的特征?
随意
 
Maxim Dmitrievsky #:
随意
必须过滤,别无选择
 
Maxim Dmitrievsky #:

我问助推器开发人员如何处理多重共线性和特征选择(预处理)。

我得到了一个明确的答案:老兄,算了吧:)

从实际应用案例的信息来看,有一种功能很少有人讨论。

例如,对预测因子进行分组并赋予权重的功能。我也看到了改进模型的潜力,但我无法在这里进行实验--这需要大量的搜索。

而且,最初把整个项目记在脑子里的人现在还在继续工作,这也是不争的事实,很有可能有同事和其他人从执行速度和修复错误的角度改进了算法本身。好了,小芯片有时也会出现。

 
mytarmailS #:
你需要过滤,没有选择。
也许一开始就不做十亿个功能会更容易些
 
Aleksey Vyazmikin #:

从实际应用案例的信息来看,很少有人会讨论这些功能。

例如,对预测因子进行分组并赋予权重的功能。我也看到了改进模型的潜力,但我无法在这里进行实验--这需要大量的搜索。

而且,最初把整个项目记在脑子里的人现在还在继续工作,这也是不争的事实,很有可能有同事和其他人从执行速度和修复错误方面改进了算法本身。当然,有时也会出现一些小问题。

这些都是可有可无的
 
Maxim Dmitrievsky #:
也许一开始就不做十亿个标志更容易些。
要意识到某个功能不好,你必须检查它,要看到它,你必须有一个功能,要有一个功能,你必须有它....。