The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
The tidymodels framework is a collection of R packages for modeling and machine learning using tidyverse principles. This book provides a thorough introduction to how to use tidymodels, and an outline of good methodology and statistical practice for phases of the modeling process.
放弃只看标题的习惯:一本书不是一条微博。
我已经读了一多半的书,所以我可以自己判断内容;有些章节 80% 都是代码。
以下是编写书中代码时使用的软件包列表。
就内容而言,这本书系统地介绍了所谓 "机器学习 "的问题和解决方案,在这个网站上非常有用,因为 "机器学习 "通常被理解为只是一个模型。是的,这是一本好书。
既然你已经读了一半。
你也许就能写一行代码了。
最让你难忘的是什么?
P.Z.
我建议每个人都读一读这本书。
统计学习
kozul 是自我推销,是旧裤子上的新贴纸。
重采样和 cv 后的统计输出在哪里?以及最终分类器的构建。以此为题,展开讨论。
Kozul 是不公平的广告,是旧裤子上的新贴纸。
Tuls 用于创建有效模型,比较多重模型与重采样。下一步应该是统计推断和无偏模型的建立。
这是机器学习的标准,书中大部分内容都在讨论这些问题,这些问题已有多年历史,并为此发明了许多工具。本书第 3 部分名为:创建有效模型的工具,内容如下:
-10 用于性能评估的重采样
-11 比较 重采样 模型
-12 模型调整和过拟合的危险
-13 网格搜索
-14 迭代搜索
-15 查看多个模型
此外,第 20 章"模型集合 "介绍了如何建立最终模型。
我们需要统计学知识。
需要吗? 请:CRAN 任务视图:机器学习与 统计学习
这些都是给初学者的提示,您需要一个 Kozul 和思考能力
模型集合,即把多个单一学习者的预测汇总为一个预测,可以产生一个高性能的最终模型。创建集合模型最常用的方法有袋装法(Bagging,Breiman,1996a)、随机森林法 ( Random Forest,Ho,1995;Breiman,2001a) 和提升法( boosting,Freund 和 Schapire,1997)。这些方法中的每一种都结合了同一类型模型(如分类树)的多个版本的预测结果。不过,创建集合的最早方法之一是模型堆叠(Wolpert,1992 年;Breiman,1996 年 b)。
模型堆叠结合了任何类型的多个模型的预测结果。例如,逻辑回归、分类树和支持向量机都可以包含在堆叠集合中。
本章将展示如何使用堆叠 软件包 堆叠预测模型。我们将重新使用第15 章中的结果, 在该章中 ,我们对多个模型进行了评估,以预测混凝土混合物的抗压强度。
建立堆叠集合的过程如下
20.5 本章 小结
本章演示了如何将不同的模型组合成一个集合,以获得更好的预测性能。创建集合的过程可以自动排除候选模型,以找到能提高性能的小型子集。堆栈 软件包 有一个流畅的界面,可将重采样和调整结果组合成元模型。
这是作者对这一问题的看法,但这并不是组合多个模型的唯一方法--R 中也有用于组合模型的堆栈包。 例如,caretEnsemble:Caret 模型的 集合
一切都会很慢, 棉花。
这本书似乎还混淆了合奏和堆叠。总之,这是一种正常的方法,但在生产中可能会出现棉花 。
因为您最近给出了弗拉基米尔文章的链接。最古怪 的 TC 创造的一个例子。
什么样的棉花感?
棉花感是怎么回事?
我建议我们回到 kozul、统计学习和可靠的人工智能上来。
P.Z.
弄清其中的细节