交易中的机器学习:理论、模型、实践和算法交易 - 页 3339

 
СанСаныч Фоменко #:

放弃只看标题的习惯:一本书不是一条微博。

我已经读了一多半的书,所以我可以自己判断内容;有些章节 80% 都是代码。

以下是编写书中代码时使用的软件包列表。

就内容而言,这本书系统地介绍了所谓 "机器学习 "的问题和解决方案,在这个网站上非常有用,因为 "机器学习 "通常被理解为只是一个模型。

是的,这是一本好书。

既然你已经读了一半。

你也许就能写一行代码了。

最让你难忘的是什么?

P.Z.

我建议每个人都读一读这本书。

 
Maxim Dmitrievsky #:
统计学习

kozul 是自我推销,是旧裤子上的新贴纸。

Maxim Dmitrievsky#:
重采样和 cv 后的统计输出在哪里?以及最终分类器的构建。以此为题,展开讨论。

Tuls for Creating Efficient Modells, comparing multiple modells vis resampling.下一步应该是统计推理和无偏模型构建。

我们需要统计推断。它能提供一些与相同 RL 和其他方法相比较的结果。

在 R 中搜索:统计学习、弱监督学习、功能增强学习。

Kozul 是不公平的广告,是旧裤子上的新贴纸。

Tuls 用于创建有效模型,比较多重模型与重采样。下一步应该是统计推断和无偏模型的建立。

这是机器学习的标准,书中大部分内容都在讨论这些问题,这些问题已有多年历史,并为此发明了许多工具。本书第 3 部分名为:创建有效模型的工具,内容如下:

-10 用于性能评估的重采样

-11 比较 重采样 模型

-12 模型调整和过拟合的危险

-13 网格搜索

-14 迭代搜索

-15 查看多个模型

此外,第 20 章"模型集合 "介绍了如何建立最终模型。

我们需要统计学知识。

需要吗? 请:CRAN 任务视图:机器学习与 统计学习

10 Resampling for Evaluating Performance | Tidy Modeling with R
10 Resampling for Evaluating Performance | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
集合已经更接近于 kozul,至少可以通过增加方差来平衡偏差。

但在预测中仍会出现大量噪音(因为方差更大),您将如何处理呢?也就是说,TS 即使在测试中也只有 60% 的交易是盈利的。在测试中也是如此,甚至更少。

是的,您将开始投注以纠正这种噪音......好吧,试试看。
 
Maxim Dmitrievsky #:
这些都是给初学者的提示,您需要一个 Kozul 和思考能力

来,去统计局,别挤前台。

能不能给我一篇论文,告诉我如何根据这本书建立最终模型?我在用手机,现在不能看。

模型集合,即把多个单一学习者的预测汇总为一个预测,可以产生一个高性能的最终模型。创建集合模型最常用的方法有袋装法BaggingBreiman,1996a、随机森林法Random Forest,Ho,1995Breiman2001a 和提升法 boosting,Freund 和 Schapire,1997)。这些方法中的每一种都结合了同一类型模型(如分类树)的多个版本的预测结果。不过,创建集合的最早方法之一是模型堆叠Wolpert,1992 年Breiman,1996 年 b

模型堆叠结合了任何类型的多个模型的预测结果。例如,逻辑回归、分类树和支持向量机都可以包含在堆叠集合中。

本章将展示如何使用堆叠 软件包 堆叠预测模型。我们将重新使用第15 章中的结果, 在该章中 ,我们对多个模型进行了评估,以预测混凝土混合物的抗压强度。

建立堆叠集合的过程如下

  1. 集合训练集的保留预测(通过重采样产生)。
  2. 创建一个模型来混合这些预测结果。
  3. 对于集合中的每个成员,在原始训练集上拟合模型。


20.5 本章 小结

本章演示了如何将不同的模型组合成一个集合,以获得更好的预测性能。创建集合的过程可以自动排除候选模型,以找到能提高性能的小型子集。堆栈 软件包 有一个流畅的界面,可将重采样和调整结果组合成元模型。



这是作者对这一问题的看法,但这并不是组合多个模型的唯一方法--R 中也有用于组合模型的堆栈包。 例如,caretEnsemble:Caret 模型的 集合

20 Ensembles of Models | Tidy Modeling with R
20 Ensembles of Models | Tidy Modeling with R
  • Max Kuhn and Julia Silge
  • www.tmwr.org
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
 
我们需要集合和堆叠,即对分类器进行分层。集合可以消除偏差,堆叠可以消除差异。理论上是可行的,但实际上我还没做过。而且会有很多模型,这在生产中很不愉快。

因为当你投入生产时,你会被大量的模型困住。而你只想要一两个。

另外,它也不能解决你不一定需要在市场上出现的问题。车型会一直一锤定音。由于这些细微差别,从开发到实施的整个周期就会中断。
测试人员的测试速度会很慢,一切都会很慢,棉絮一样。
 
书中似乎还混淆了合奏和堆叠。简而言之,这是一种正常的方法,但在生产中可能会很古怪。它不需要堆积如山的软件包。

哦,它也没有解决最重要的标记问题。
 
比如最近弗拉基米尔的文章链接。这是最古怪的 TC 创造的一个例子。当你做了大量的工作和转换,而输出结果却是一些你什么都不用做就能通过随机 蛮力得到的 模型。这很有趣,但毫无益处。
 
Maxim Dmitrievsky #:
一切都会很慢, 棉花
马克西姆-德米特里耶夫斯基#:
这本书似乎还混淆了合奏和堆叠。总之,这是一种正常的方法,但在生产中可能会出现棉花
马克西姆-德米特里 耶夫斯基 #:
因为您最近给出了弗拉基米尔文章的链接。最古怪 的 TC 创造的一个例子。

什么样的棉花感?

 
Forester #:

棉花感是怎么回事?

缓慢的同义词
 

我建议我们回到 kozul、统计学习和可靠的人工智能上来。

P.Z.

弄清其中的细节