过去,计算 p 值比现在更具挑战性。它涉及依靠表格进行计算,例如正态分布的表格,其精度有限且条目有限。为了最大限度地减少这些计算的需要,通常使用临界区域或拒绝区域的概念。
当今假设检验的典型过程包括根据样本数据计算 p 值并将其与所选的显着性水平 (alpha) 进行比较。然而,对于关键区域,我们扭转了这个过程。我们首先选择显着性水平 (alpha),然后定义检验统计量的截止值,表示为 Z 星或 T 星。如果样本数据产生的样本统计量比该截止值更极端,则会导致我们拒绝原假设。
A formerly very practical idea, now mostly of theoretical interest. If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more ...
大家好,今天我们将讨论使用t分布的假设检验。在这种情况下,我们正在处理总体标准差未知的情况。之前,我们使用 Z 统计量进行假设检验,假设我们知道总体标准差 (Sigma)。然而,在统计推断中,目标是使用样本信息来深入了解总体,因此通常不知道西格玛。在这种情况下,我们使用样本标准差来估计总体标准差,并进行类似的计算。
出现挑战的原因是,当 Sigma 替换为 s 时,表达式 (X-bar - mu)/(s/sqrt(n)) 不再遵循正态分布。 X-bar 和 s 均随每个新样本而变化,使得分布遵循自由度为 (n-1) 的 t 分布。幸运的是,一旦我们考虑这种调整,计算结果基本保持不变。
为了在西格玛未知时进行假设检验,我们从原假设和备择假设开始。假设原假设成立,我们计算实际样本数据的 t 统计量:(X-bar - mu_naught)/(s/sqrt(n))。然后我们根据备择假设计算 p 值。
对于左侧备择假设,当我们怀疑 mu 小于给定值时,我们会发现获得的 t 值小于或等于原假设为真时获得的 t 值的概率。这对应于第一张图片中的阴影区域。
类似地,对于右侧备择假设,其中 mu 大于给定值,我们确定获得大于我们获得的 t 值的概率。这对应于 t 值右侧的区域。
在双边测试的情况下,我们会考虑这两个方面。我们计算获得比我们获得的 t 值(绝对值)更大的 t 值的概率,然后将其加倍。
获得 p 值后,我们将其与选定的显着性水平 (alpha) 进行比较以做出决定。如果 p 值小于 alpha,我们拒绝原假设。然而,当手动执行计算时,从样本数据获取 t 值可能很棘手。建议使用统计软件或计算器等技术。例如,在 R 中,命令 PT(t, n-1) 计算自由度为 (n-1) 的 t 分布中给定 t 值左侧的面积。
让我们考虑一个例子来演示这个过程。假设我们在实验中发现七只老鼠的体重减轻了。我们想要确定是否有足够的证据表明小鼠在实验期间体重减轻,α 显着性水平等于 0.05。由于我们没有给出总体标准差,因此我们正在处理 t 检验情况。
How can we run a significance test when the population standard deviation is unknown? Simple: use the sample standard deviation as an estimate. If this vid h...
A two-sided test with unknown population standard deviation. If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more stats j...
现在让我们继续讨论问题一。一位官员声称该市的平均风速为每小时九英里。我们想根据数据确定这一说法是否合理。我们将使用 t 检验,其原假设是平均风速为每小时 9 英里。从直方图来看,这似乎是合理的,尽管稍微居中于该值的右侧。我们将使用 t.test 命令执行 t 检验。我们将 Wind 变量传递给它,并将零假设指定为 mu = 9。默认情况下,R 假设两侧备择假设。 t.test 命令为我们提供了样本均值、t 统计量和 p 值。样本平均值为 9.96,计算的 t 统计量为 3.36,对应于低于 0.1 的 p 值。由于 p 值如此之小,因此该数据仅由于随机机会而显着偏离原假设是不合理的。因此,我们拒绝零假设并得出纽约的平均风速不是每小时九英里的结论。
继续讨论第二个问题,我们想要评估如果平均太阳辐射超过 175 兰利,某个太阳能电池阵列是否具有成本效益。我们将使用单边备择假设,其中零假设是平均太阳辐射为 175 兰利,备择假设是它更大。我们将通过创建太阳辐射变量的直方图来可视化数据。同样,根据直方图,零假设似乎是合理的。我们将使用 t.test 命令执行 t 检验,传递太阳辐射变量并将原假设指定为 mu = 175。此外,我们需要使用 Alternative =“greater” 参数来指示单边备择假设。 t.test 命令为我们提供了样本均值、t 统计量和 p 值。样本平均值为 185.9,计算的 t 统计量为 1.47,导致 p 值为 0.07。 p 值为 0.07,我们没有令人信服的证据来支持纽约平均太阳辐射超过 175 兰利的说法,而这是证明购买太阳能电池阵列合理性的门槛。因此,我们不应下结论,需要进一步研究来准确评估平均太阳辐射。
总之,使用 t 检验的假设检验使我们能够根据样本数据评估主张或假设的合理性。通过指定原假设和备择假设、执行检验并检查生成的 p 值,我们可以就接受或拒绝假设做出明智的决定。通过直方图或其他图表对数据进行可视化可以在分析过程中提供额外的见解。
Hypothesis testing in R is easy with the t.test command!If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more #rstats joy,...
现在我们知道抽样分布遵循均值和标准差已知的钟形曲线,我们可以计算 z 分数。我们计算观测值 (P-hat) 和期望值 (P-naught) 之间的差值,并将其除以标准差。代入值(P-hat = 0.139、P-naught = 0.30、n = 36)会产生 -2.11 的 z 分数。
为了评估获得与我们观察到的极端(甚至更极端)的 P 帽的概率,我们检查相应的 z 分数。在本例中,我们感兴趣的是 z 分数小于 -2.11 或大于 2.11 的概率。我们可以通过评估标准正态分布的累积分布函数(CDF)来计算这一点。使用统计软件或网络应用程序,我们发现获得小于 -2.11 的 z 分数的概率约为 0.017。然而,由于我们考虑的是分布的两个尾部,因此我们需要将该值加倍,从而得到大约 0.035 的 p 值。
将 p 值与我们选择的显着性水平 (α = 0.05) 进行比较,我们发现 p 值小于 α。因此,我们拒绝零假设并得出结论,评论者的主张可能是错误的。美国六岁儿童缺锌的比例不到30%。
How should we run a hypothesis test when we have data involving percentages, proportions, or fractions? Using a normal approximation. of course, at least whe...
假设原假设成立,我们可以应用中心极限定理,该定理指出,当样本量(n)足够大时,比例(P-hat)的抽样分布将近似正态。该分布的平均值等于总体平均值 (P),标准差由 P 乘以 1 减去 P 除以 n 的平方根得出。在我们的例子中,由于我们假设原假设为真,因此总体比例 (P) 为 0.65。
现在,让我们计算 z 分数,以确定仅通过随机机会获得与观察到的比例一样极端或更极端的结果的概率。通过代入这些值,我们发现 z 分数为 -1.91。为了找到与该 z 分数相关的概率(表示获得小于或等于观察值的比例的可能性),我们使用正态累积分布函数 (CDF)。这可以使用表格、网络应用程序或统计软件等各种工具来完成。例如,在 R 中,命令“Pnorm(-1.91)”产生的值为 0.028。
将此 p 值与 0.05 的显着性水平 (α) 进行比较,我们观察到 p 值小于 α。因此,我们拒绝原假设,表明有理由得出大学高估其四年毕业率的结论。
大家好!今天,我们将深入研究散点图,它是涉及同时收集的多个变量的数据的可视化显示。散点图至关重要,因为它们经常出现在现实世界的数据收集场景中。通常,我们收集不止一项信息。例如,我们可能有一组学生的 SAT 数学和语言成绩、医学研究中个人的身高和体重,或者各种汽车的发动机尺寸和油耗数据。在每种情况下,数据都是成对的,这意味着一个变量的每个值对应于另一个变量的特定值,从而创建一对一的关系。当存在这样的配对数据时,我们可以构建散点图。
让我们考虑一个使用表格的示例。表中的每一列代表一个科学或工程领域,顶部的数字表示2005年该领域授予女性博士学位的人数,底部的数字表示同年授予男性博士学位的人数。通过绘制这些数据(其中女性博士学位由 x 值表示,男性博士学位由 y 值表示),我们获得了一组点。有些点被标记,例如(2168, 2227),它对应于表中的第二数据列。 2005 年,该科学领域共有 2168 名女性获得博士学位,2227 名男性获得博士学位。
What is a scatterplot? How do we construct them? How do we describe them? If this vid helps you, please help me a tiny bit by mashing that 'like' button. For...
现在,我们来讨论计算相关性。总之,不建议手动计算。幸运的是,我们有软件包等工具来帮助我们。例如,在 R 中,命令是“cor”。通过提供 X 和 Y 值(我们想要关联的两个变量),我们可以立即获得相关系数。对于给定的表,如果我们将第一行指定为 X,将第二行指定为 Y,则可以简单地使用命令“cor(X, Y)”来获取相关值。在此示例中,我们得到的相关性为 0.787,表明存在中等正相关性。
Let's talk about relationships between quantitative variables!If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more #rstat...
为了分析这种线性关系,我们可以智能地在散点图上画一条线。这条线称为最佳拟合线或回归线。现在,让我们深入研究线性回归的数学方面。关键思想涉及残差的概念。我们在数据上放置一条线并选择特定的 X 值。然后,我们计算数据集中的实际 Y 值与线上预测的 Y 值之间的差异。这种差异称为残差,表示实际高度和预期高度之间的偏差。通过计算数据集中每个点的残差、对它们进行平方并求和,我们获得了可以最小化的数量。
使用微积分,我们可以最小化这个数量并导出最小二乘回归线的方程。事实证明,这条线穿过点 (X bar, Y bar),其中 X bar 是 X 值的样本均值,Y bar 是 Y 值的样本均值。最小二乘回归线的斜率由 r × (sy / SX) 给出,其中 r 是相关系数,sy 是 Y 值的标准差,SX 是 X 值的标准差。总之,最小二乘回归线的方程在幻灯片底部提供。
手动计算这些值可能很麻烦。为了简化流程,强烈建议使用技术或软件。让我们考虑与上一张幻灯片中显示的散点图相对应的数据。通过计算平均值和标准差,我们发现 X 条为 5.4,Y 条为 2.4,依此类推。相关系数约为0.34,表明中度至弱正相关。通过代入这些值,我们得到最小二乘回归线的方程:0.19x + 1.34。
Drawing a line of best fit over a scatterplot. So easy and fun! If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more stat...
要创建散点图,我们将使用基本语法“qplot”。首先,指定 x 值,水平轴为“virginica$sepal_length”,其中“virginica”是数据集,“sepal_length”是列名称。然后,将纵轴的 y 值指示为“virginica$sepal_width”。接下来,我们需要定义数据的显示方式。对于散点图,我们使用“geom = 'point'”。确保“point”拼写正确。这将生成一个基本的散点图。
让我们通过调整轴标签和探索自定义选项(例如更改颜色和点大小)来改进绘图。要修改 x 轴标签,请使用“xlab = '萼片长度'”。同样,设置“ylab = '萼片宽度'”以更改 y 轴标签。要更改点颜色,请添加“color = 'darkred'”。请注意,由于 R 的复杂性,指定颜色的语法有点特殊。
A quickstart guide to making scatterplots in R using the qplot() command. So easy! So much fun! If this vid helps you, please help me a tiny bit by mashing t...
使用关键区域的假设检验
使用关键区域的假设检验
大家好,今天我们将讨论使用关键区域的假设检验。虽然这种方法可能被认为是老派的,但它仍然与我们将要介绍的理论相关。因此,对其有一个基本的了解是有益的。
过去,计算 p 值比现在更具挑战性。它涉及依靠表格进行计算,例如正态分布的表格,其精度有限且条目有限。为了最大限度地减少这些计算的需要,通常使用临界区域或拒绝区域的概念。
当今假设检验的典型过程包括根据样本数据计算 p 值并将其与所选的显着性水平 (alpha) 进行比较。然而,对于关键区域,我们扭转了这个过程。我们首先选择显着性水平 (alpha),然后定义检验统计量的截止值,表示为 Z 星或 T 星。如果样本数据产生的样本统计量比该截止值更极端,则会导致我们拒绝原假设。
让我们考虑一个例子来说明这一点。假设我们有一个双边备择假设,并且正在执行正态分布且 alpha 显着性水平等于 0.05 的检验。在这种情况下,alpha 等于 0.05 对应于分布中 0.05 的阴影区域(每边 0.025)。通过执行逆正态计算(使用 R 中的命令 Q 范数),我们发现临界值 Z-star 为 1.96。因此,如果样本统计量(Z星)大于1.96(绝对值),则表明我们应该拒绝原假设。
再举一个例子,我们考虑一个具有 8 个自由度和单边替代(右侧替代)的 t 分布。假设我们选择 alpha 等于 0.01 作为显着性水平。在本例中,T 星右侧有 0.01 的面积,对应于左侧 0.99 的面积。通过使用 R 中值为 0.99 和 8 的逆 t CDF(使用命令 QT),我们发现 T-star 约为 2.9。如果样本的 t 统计量大于 2.9,则它落在阴影区域内,导致我们拒绝原假设。
在正态分布的情况下,我们可以将临界 Z 值转化为关于临界样本均值的陈述。考虑以下示例:某品牌可乐罐的含量呈正态分布,标准差为 0.2 盎司。我们希望使用大小为 15 的样本来检验原假设(即罐子的平均含量为 12 盎司)和替代假设(即罐子的实际含量小于 12 盎司)。采用单边替代且 alpha 等于 0.05 时,临界 Z 值为 -1.645。因此,如果样本平均值 (X 条) 比平均值低 1.645 个标准差以上,我们应该拒绝原假设。具体来说,如果样本均值小于 11.92 盎司,我们将拒绝原假设。
使用 t 分布进行假设检验
使用 t 分布进行假设检验
大家好,今天我们将讨论使用t分布的假设检验。在这种情况下,我们正在处理总体标准差未知的情况。之前,我们使用 Z 统计量进行假设检验,假设我们知道总体标准差 (Sigma)。然而,在统计推断中,目标是使用样本信息来深入了解总体,因此通常不知道西格玛。在这种情况下,我们使用样本标准差来估计总体标准差,并进行类似的计算。
出现挑战的原因是,当 Sigma 替换为 s 时,表达式 (X-bar - mu)/(s/sqrt(n)) 不再遵循正态分布。 X-bar 和 s 均随每个新样本而变化,使得分布遵循自由度为 (n-1) 的 t 分布。幸运的是,一旦我们考虑这种调整,计算结果基本保持不变。
为了在西格玛未知时进行假设检验,我们从原假设和备择假设开始。假设原假设成立,我们计算实际样本数据的 t 统计量:(X-bar - mu_naught)/(s/sqrt(n))。然后我们根据备择假设计算 p 值。
对于左侧备择假设,当我们怀疑 mu 小于给定值时,我们会发现获得的 t 值小于或等于原假设为真时获得的 t 值的概率。这对应于第一张图片中的阴影区域。
类似地,对于右侧备择假设,其中 mu 大于给定值,我们确定获得大于我们获得的 t 值的概率。这对应于 t 值右侧的区域。
在双边测试的情况下,我们会考虑这两个方面。我们计算获得比我们获得的 t 值(绝对值)更大的 t 值的概率,然后将其加倍。
获得 p 值后,我们将其与选定的显着性水平 (alpha) 进行比较以做出决定。如果 p 值小于 alpha,我们拒绝原假设。然而,当手动执行计算时,从样本数据获取 t 值可能很棘手。建议使用统计软件或计算器等技术。例如,在 R 中,命令 PT(t, n-1) 计算自由度为 (n-1) 的 t 分布中给定 t 值左侧的面积。
让我们考虑一个例子来演示这个过程。假设我们在实验中发现七只老鼠的体重减轻了。我们想要确定是否有足够的证据表明小鼠在实验期间体重减轻,α 显着性水平等于 0.05。由于我们没有给出总体标准差,因此我们正在处理 t 检验情况。
为了开始测试,我们设置了原假设(假设数据是随机机会产生的)和备择假设(断言小鼠在实验期间平均体重减轻)。在这种情况下,我们选择一种片面的备择假设,重点关注体重减轻而不是体重增加。
接下来,我们使用样本均值和样本标准差计算 t 统计量。利用获得的 t 值,我们计算 p 值,它表示仅偶然获得大于或等于观测值的 t 值的概率。
为了评估这个概率,我们参考具有 (n-1) 个自由度的 t 分布。我们通过从 1 减去左侧面积来计算 t 值右侧的面积。在 R 中,这可以使用 PT 函数来完成。如果 p 值大于所选的显着性水平 (alpha),我们无法拒绝原假设。
在我们的示例中,计算出的 p 值为 0.059。由于 0.059 大于显着性水平 0.05,因此我们没有足够的证据来拒绝原假设。因此,我们不能得出该实验导致小鼠平均体重减轻的结论。
值得注意的是,未能拒绝原假设并不意味着原假设是正确的。这仅仅意味着证据不足以支持替代假设。
总之,当处理假设检验且总体标准差未知时,我们可以使用 t 分布并使用样本标准差来估计标准差。然后,我们计算 t 统计量,根据备择假设计算 p 值,并将其与显着性水平进行比较以做出决定。利用统计软件或表格可以简化计算并提供更准确的结果。
使用 t 分布进行显着性检验:示例
使用 t 分布进行显着性检验:示例
大家好,今天我想向您介绍另一个使用 t 分布进行假设检验的示例。此示例重点关注特定草种的碳吸收率。传统观点认为平均吸收率为每秒每平方米 34.0 微摩尔。然而,一群研究人员对此表示怀疑。他们进行了一项研究,得出样本平均值为 30.6,样本标准差为 9.7。现在,在显着性水平为 0.05 的情况下,他们想要确定该数据是否提供了反对传统观点的有力证据。
与任何显着性检验一样,让我们首先明确地陈述我们的假设。我们旨在挑战的零假设假设我们的样本数据仅仅是随机机会的结果,并且传统观点是正确的。另一方面,备择假设试图确定真实平均吸收率大于或小于 34.0 的可能性。在这种情况下,我们将考虑一个双向备择假设来涵盖这两种情况。
接下来,我们想要评估我们的样本平均值 (x-bar) 与我们在原假设下的预期相比有多极端。我们通过从样本均值中减去原假设 (mu-naught) 下的预期均值并将其除以样本标准差 (s) 再除以样本大小 (n) 的平方根来计算检验统计量 (T)。该计算得出 T = -2.27。
为了确定仅由于随机机会而获得极端为 -2.27 的检验统计量的概率,我们需要考虑分布的两侧。我们计算 -2.27 左侧和右侧的组合阴影面积,这为我们提供了检验的 p 值。在R中,我们可以使用PT命令来计算最左边的区域,它代表T小于-2.27的概率。然后,我们将该面积加倍以考虑分布的两侧。
在 R 中应用 -2.27 且自由度 (df) 等于样本大小减一 (41) 的 PT 命令后,我们发现左侧阴影面积为 0.029。将此值加倍即可得到总阴影面积,它对应于测试的 p 值。
计算出的 p 值为 0.029,小于我们的显着性水平 (alpha) 0.05。因此,我们拒绝零假设并得出结论,该草种的平均二氧化碳吸收率实际上并非每平方米每秒 34.0 微摩尔。
总之,当总体标准差未知时,使用 t 分布的假设检验使我们能够评估反对零假设的证据强度。通过计算检验统计量、将其与临界值(显着性水平)进行比较并计算 p 值,我们可以就原假设的有效性做出明智的决策。
R 中的假设检验
R 中的假设检验
大家好!今天,我们将使用 t.test 命令在 R 中进行假设检验。我们将解决与内置空气质量数据集相关的几个问题,我们将其视为纽约市空气质量测量值的简单随机样本。
让我们切换到 R,我已经在其中加载了 tidyverse 包,我通常在 R 会话开始时执行此操作。我还提取了空气质量数据集的帮助文件。该数据集收集于 1973 年,因此不是最新的数据。我们可以使用 view 命令来查看数据集。它由 6 个变量的 153 个观测值组成,其中包括我们感兴趣的两个变量:风和太阳辐射。
在进行任何统计测试之前,最好将数据可视化。因此,让我们使用 qplot 命令创建一个直方图。我们将重点关注风变量并指定我们想要一个直方图。
现在让我们继续讨论问题一。一位官员声称该市的平均风速为每小时九英里。我们想根据数据确定这一说法是否合理。我们将使用 t 检验,其原假设是平均风速为每小时 9 英里。从直方图来看,这似乎是合理的,尽管稍微居中于该值的右侧。我们将使用 t.test 命令执行 t 检验。我们将 Wind 变量传递给它,并将零假设指定为 mu = 9。默认情况下,R 假设两侧备择假设。 t.test 命令为我们提供了样本均值、t 统计量和 p 值。样本平均值为 9.96,计算的 t 统计量为 3.36,对应于低于 0.1 的 p 值。由于 p 值如此之小,因此该数据仅由于随机机会而显着偏离原假设是不合理的。因此,我们拒绝零假设并得出纽约的平均风速不是每小时九英里的结论。
继续讨论第二个问题,我们想要评估如果平均太阳辐射超过 175 兰利,某个太阳能电池阵列是否具有成本效益。我们将使用单边备择假设,其中零假设是平均太阳辐射为 175 兰利,备择假设是它更大。我们将通过创建太阳辐射变量的直方图来可视化数据。同样,根据直方图,零假设似乎是合理的。我们将使用 t.test 命令执行 t 检验,传递太阳辐射变量并将原假设指定为 mu = 175。此外,我们需要使用 Alternative =“greater” 参数来指示单边备择假设。 t.test 命令为我们提供了样本均值、t 统计量和 p 值。样本平均值为 185.9,计算的 t 统计量为 1.47,导致 p 值为 0.07。 p 值为 0.07,我们没有令人信服的证据来支持纽约平均太阳辐射超过 175 兰利的说法,而这是证明购买太阳能电池阵列合理性的门槛。因此,我们不应下结论,需要进一步研究来准确评估平均太阳辐射。
总之,使用 t 检验的假设检验使我们能够根据样本数据评估主张或假设的合理性。通过指定原假设和备择假设、执行检验并检查生成的 p 值,我们可以就接受或拒绝假设做出明智的决定。通过直方图或其他图表对数据进行可视化可以在分析过程中提供额外的见解。
比例假设检验
比例假设检验
大家好!今天,我们将继续探索假设检验,这次重点关注比例。我们将通过检查示例来了解所涉及的关键概念来讨论该主题。
让我们开始吧。一位评论员声称,美国 30% 的六岁儿童缺锌。我们希望通过收集样本并在显着性水平 α = 0.05 下进行假设检验来评估这一说法。为了进一步调查,我们对36名六岁儿童进行了调查,发现其中有5人缺锌,比例不到30%。然而,我们需要确定这种差异是否只能归因于随机机会。我们的主要问题是:获得这样的样本的可能性有多大?
为了解决这个问题,我们将获得的样本比例 (P-hat)(36 个中的 5 个)与原假设下声称的比例进行比较。我们将人口比例表示为 P₀ 或 P-naught。我们的原假设假设人口比例为 0.30 (30%)。在这种情况下,备择假设只是人口比例不等于 0.30。我们没有具体的理由来假设它大于或小于 30%,因此我们考虑了这两种可能性。默认情况下,我们选择双边替代方案,除非有令人信服的理由支持单边替代方案。
我们计算出的样本比例(P-hat)为0.139,显着低于30%。但这种差异在统计上显着吗?为了评估这一点,我们分析了 P-hat 的抽样分布。我们想象重复获取相同大小的样本并计算每次缺锌的比例。假设样本量 (n) 很大(此处 n = 36),则样本分布将呈现钟形曲线。我们可以确定它的中心和分布。样本比例 (P-hat) 的平均值将与总体比例 (P) 相同,而 P-hat 的标准差将是 P(1-P)/n 的平方根。如果您需要更详细的解释,我建议观看我关于比例置信区间的视频。
现在我们知道抽样分布遵循均值和标准差已知的钟形曲线,我们可以计算 z 分数。我们计算观测值 (P-hat) 和期望值 (P-naught) 之间的差值,并将其除以标准差。代入值(P-hat = 0.139、P-naught = 0.30、n = 36)会产生 -2.11 的 z 分数。
为了评估获得与我们观察到的极端(甚至更极端)的 P 帽的概率,我们检查相应的 z 分数。在本例中,我们感兴趣的是 z 分数小于 -2.11 或大于 2.11 的概率。我们可以通过评估标准正态分布的累积分布函数(CDF)来计算这一点。使用统计软件或网络应用程序,我们发现获得小于 -2.11 的 z 分数的概率约为 0.017。然而,由于我们考虑的是分布的两个尾部,因此我们需要将该值加倍,从而得到大约 0.035 的 p 值。
将 p 值与我们选择的显着性水平 (α = 0.05) 进行比较,我们发现 p 值小于 α。因此,我们拒绝零假设并得出结论,评论者的主张可能是错误的。美国六岁儿童缺锌的比例不到30%。
当涉及样本量和正态近似值时,需要牢记一些经验法则。当样本至少有五次成功和五次失败时,正态近似往往效果良好。从数学上讲,这意味着样本量(n)与样本比例(P)的乘积应大于或等于5,以及样本量(n)与样本比例的补集的乘积(1-P) 也应大于或等于五。
在我们的例子中,我们的样本量为 36,样本比例 (P-hat) 为 0.139,满足正态近似的条件。因此,我们可以放心地依靠正态分布进行统计推断。
还值得注意的是,一般来说,较大的样本量往往会通过正态近似产生更好的结果。随着样本量的增加,正态分布成为 P-hat 抽样分布的更准确表示。
因此,总而言之,我们可以得出结论,示例中的样本量 36 足以让我们在假设检验中使用正态近似。
我希望这能够澄清样本量在正态近似中的作用,并为比例的假设检验过程提供全面的解释。
比例的假设检验:示例
比例的假设检验:示例
大家好!今天,我们将研究比例假设检验的示例。让我们深入探讨这个问题。一所大学声称 65% 的学生在四年或更短的时间内毕业。不过,这一说法的准确性存在疑问。为了进一步调查,我们对120名学生进行了简单随机抽样,发现120名学生中只有68人在规定的时间内毕业。由于这个比例低于声称的65%,这为大学的说法提供了证据。现在的问题是,这些证据是否足够有力,足以表明这种说法不太可能发生,或者是否可以归因于随机机会。为了确定这一点,我们将计算 p 值并使用 0.05 的显着性水平 (α) 做出决定。
首先,我们需要制定原假设和备择假设。原假设指出,结果完全是随机机会造成的,四年或更短时间内毕业的学生的真实比例确实是 0.65。另一方面,备择假设表明大学高估了其毕业率,而人口比例低于0.65。在这种情况下,片面的备择假设是合适的,因为我们只对毕业率低于 65% 的可能性感兴趣。
假设原假设成立,我们可以应用中心极限定理,该定理指出,当样本量(n)足够大时,比例(P-hat)的抽样分布将近似正态。该分布的平均值等于总体平均值 (P),标准差由 P 乘以 1 减去 P 除以 n 的平方根得出。在我们的例子中,由于我们假设原假设为真,因此总体比例 (P) 为 0.65。
现在,让我们计算 z 分数,以确定仅通过随机机会获得与观察到的比例一样极端或更极端的结果的概率。通过代入这些值,我们发现 z 分数为 -1.91。为了找到与该 z 分数相关的概率(表示获得小于或等于观察值的比例的可能性),我们使用正态累积分布函数 (CDF)。这可以使用表格、网络应用程序或统计软件等各种工具来完成。例如,在 R 中,命令“Pnorm(-1.91)”产生的值为 0.028。
将此 p 值与 0.05 的显着性水平 (α) 进行比较,我们观察到 p 值小于 α。因此,我们拒绝原假设,表明有理由得出大学高估其四年毕业率的结论。
散点图简介
散点图简介
大家好!今天,我们将深入研究散点图,它是涉及同时收集的多个变量的数据的可视化显示。散点图至关重要,因为它们经常出现在现实世界的数据收集场景中。通常,我们收集不止一项信息。例如,我们可能有一组学生的 SAT 数学和语言成绩、医学研究中个人的身高和体重,或者各种汽车的发动机尺寸和油耗数据。在每种情况下,数据都是成对的,这意味着一个变量的每个值对应于另一个变量的特定值,从而创建一对一的关系。当存在这样的配对数据时,我们可以构建散点图。
让我们考虑一个使用表格的示例。表中的每一列代表一个科学或工程领域,顶部的数字表示2005年该领域授予女性博士学位的人数,底部的数字表示同年授予男性博士学位的人数。通过绘制这些数据(其中女性博士学位由 x 值表示,男性博士学位由 y 值表示),我们获得了一组点。有些点被标记,例如(2168, 2227),它对应于表中的第二数据列。 2005 年,该科学领域共有 2168 名女性获得博士学位,2227 名男性获得博士学位。
在检查散点图时,定性地描述它们是很有价值的。在此示例中,我们观察到数据总体呈下降趋势,尽管在某些情况下,当我们从左向右移动时,值会增加。总体而言,数据的形状倾向于向下倾斜,表明两个变量之间呈负相关。然而,值得注意的是,我们应该避免使用术语“负相关”,除非关联是线性的,这意味着图形遵循一条直线。在这种情况下,数据不呈现线性关系。
该图另一个值得注意的方面是右上角的异常值。异常值可以分为多种类别,例如数据输入错误、影响分析的异常情况或需要进一步调查的有趣现象。最后,考虑将哪个变量放置在水平轴上以及将哪个变量放置在垂直轴上至关重要。如果研究中一个变量自然地解释或影响另一个变量,则应将其作为解释变量放在横轴上。相反,被解释或影响的变量应该作为响应变量位于纵轴上。例如,在汽油里程的示例中,将里程视为通过发动机尺寸(排量)来解释是有意义的,因此我们将里程放在垂直轴上。然而,这种选择可能涉及一些主观性,并且根据研究背景,可能存在角色互换的情况。
散点图和相关性
散点图和相关性
大家好!今天,我们将简要介绍相关性。我们将在三分钟内讨论这个主题。让我们开始吧!
当我们检查散点图时,有时我们会观察到数据大致遵循直线的线性关系。在这种情况下,我们可以讨论变量之间的相关性。然而,当变量之间的关系不是线性关系时,抵制使用术语“相关性”的诱惑很重要。相关性可以是弱的,也可以是强的,可以是正的,也可以是负的。
正相关表示当我们在图表上从左向右移动时,数据点的总体形状向上倾斜。相反,负相关意味着当我们从左到右阅读时,数据点的总体形状呈下降趋势。相关性较强的特点是数据点更紧密地聚集在假想线周围,而相关性较弱则显示数据点更加分散。
为了量化相关性,我们使用称为相关系数(通常表示为“r”)的统计量。它的范围在 -1 和 1 之间。接近 0 的值表示数据更浑浊或更分散。在提供的示例中,0.4 或-0.4 的相关性表示中等相关性,而0.9 或-0.9 表示较强的相关性。相关性为 1 或 -1 表示完美的线性关系,其中所有数据点都精确地位于直线上。
值得注意的是,相关系数“r”不应与直线的斜率混淆。 “r”的符号表示斜率是正还是负,但“r”本身并不具体表示斜率。相反,相关系数反映了数据从想象的穿过数据中心的线的分布程度。
当变量不表现出线性关系时,我们说它们不相关。在这种情况下解释相关系数时要小心。即使变量之间存在明显的关联(如抛物线形状),计算相关性也会产生接近于零的值。
现在,我们来讨论计算相关性。总之,不建议手动计算。幸运的是,我们有软件包等工具来帮助我们。例如,在 R 中,命令是“cor”。通过提供 X 和 Y 值(我们想要关联的两个变量),我们可以立即获得相关系数。对于给定的表,如果我们将第一行指定为 X,将第二行指定为 Y,则可以简单地使用命令“cor(X, Y)”来获取相关值。在此示例中,我们得到的相关性为 0.787,表明存在中等正相关性。
线性回归简介
线性回归简介
大家好!今天,我们将深入探讨线性回归。我们一直在检查散点图并讨论观察变量之间线性关系的情况。换句话说,随着X变量的增加,Y变量趋于以恒定速率增加或减少。我们可以在关系紧密时讨论这种现象(如图左侧所示),也可以在关系较分散(如图右侧所示)时讨论这种现象。
为了分析这种线性关系,我们可以智能地在散点图上画一条线。这条线称为最佳拟合线或回归线。现在,让我们深入研究线性回归的数学方面。关键思想涉及残差的概念。我们在数据上放置一条线并选择特定的 X 值。然后,我们计算数据集中的实际 Y 值与线上预测的 Y 值之间的差异。这种差异称为残差,表示实际高度和预期高度之间的偏差。通过计算数据集中每个点的残差、对它们进行平方并求和,我们获得了可以最小化的数量。
使用微积分,我们可以最小化这个数量并导出最小二乘回归线的方程。事实证明,这条线穿过点 (X bar, Y bar),其中 X bar 是 X 值的样本均值,Y bar 是 Y 值的样本均值。最小二乘回归线的斜率由 r × (sy / SX) 给出,其中 r 是相关系数,sy 是 Y 值的标准差,SX 是 X 值的标准差。总之,最小二乘回归线的方程在幻灯片底部提供。
手动计算这些值可能很麻烦。为了简化流程,强烈建议使用技术或软件。让我们考虑与上一张幻灯片中显示的散点图相对应的数据。通过计算平均值和标准差,我们发现 X 条为 5.4,Y 条为 2.4,依此类推。相关系数约为0.34,表明中度至弱正相关。通过代入这些值,我们得到最小二乘回归线的方程:0.19x + 1.34。
我必须强调,手动执行这些计算可能很乏味。利用技术是一种更有效的方法。以下是此数据的最小二乘回归线的示例。它似乎与数据点合理拟合。
R 中的散点图和回归线
R 中的散点图和回归线
大家好!在本快速入门指南中,我将向您展示如何使用 RStudio 中的 ggplot2 包创建漂亮的图形。本讨论适合统计一级的初学者。虽然有更强大和复杂的方法可用,但我将重点关注最直观和直接的方法。我们将使用 iris 数据集的一个子集,特别是与 virginica 花对应的 50 行。我们的目标是创建萼片长度与萼片宽度的散点图。
在开始之前,请确保加载 tidyverse 软件包或其软件包系列。如果您还没有安装它,请使用命令“install.packages('tidyverse')”。如果安装过程中出现错误,建议在线搜索解决方案。加载包后,我们就可以继续了。
要创建散点图,我们将使用基本语法“qplot”。首先,指定 x 值,水平轴为“virginica$sepal_length”,其中“virginica”是数据集,“sepal_length”是列名称。然后,将纵轴的 y 值指示为“virginica$sepal_width”。接下来,我们需要定义数据的显示方式。对于散点图,我们使用“geom = 'point'”。确保“point”拼写正确。这将生成一个基本的散点图。
让我们通过调整轴标签和探索自定义选项(例如更改颜色和点大小)来改进绘图。要修改 x 轴标签,请使用“xlab = '萼片长度'”。同样,设置“ylab = '萼片宽度'”以更改 y 轴标签。要更改点颜色,请添加“color = 'darkred'”。请注意,由于 R 的复杂性,指定颜色的语法有点特殊。
现在标签和点颜色已调整完毕,您可以进一步进行实验。例如,您可以使用“size = ...”更改磅值。此外,您可以向情节添加主标题。我鼓励您通过使用“?qplot”或在线搜索来进一步探索“qplot”的功能。
让我们更进一步,添加一条回归线。 ggplot2 和 tidyverse 的优点之一是您可以通过简单地扩展现有命令来向绘图添加图层。从我们之前创建的“qplot”命令开始,现在添加“geom_smooth()”。这将生成一条拟合线。由于我们对线性回归感兴趣,因此指定“method = 'lm'”以使用线性模型。包含这个论点是一个很好的做法,尤其是在统计学入门课程中。
如果您想更改回归线的颜色,可以在“geom_smooth()”命令中包含“color = 'darkgray'”。这将导致不同的颜色。
最后,让我们解决如果删除“se = FALSE”会发生什么的问题。如果没有这个参数,R 将显示错误带。粗略地说,这条丝带代表一个置信区间。如果我们要绘制数据集中对这 50 个观测值进行采样的所有图,我们会期望回归线位于该误差带内,从而提供不确定性的粗略测量。