皆さん、こんにちは。今日は中心極限定理を適用して母平均の信頼区間を構築します。母集団平均の信頼区間の式 mu は、サンプリングされる母集団が平均 mu と分散シグマ二乗を持つ完全な正規分布に従うという仮定に基づいています。ただし、多くの場合、この仮定は合理的ではありません。たとえば、電話銀行からの平均通話時間を決定する場合、通話時間の分布が正規である可能性は低くなります。釣鐘曲線ではなく、歪んだ分布を持つヒストグラムになる可能性が高くなります。
それにもかかわらず、中心極限定理を利用することで、母集団平均 mu の信頼区間を構築することができます。この定理は、標本サイズ n が十分に大きい限り (通常は n ≥ 30)、母集団の分布の形状に関係なく、標本平均の標本分布はほぼ正規分布になる、というものです。これを視覚化するには、サイズ n のサンプルを繰り返し取得し、毎回サンプル平均 (x バー) を計算し、それらのサンプル平均のヒストグラムを作成することを想像してください。中心極限定理によれば、そのヒストグラムは母集団の平均を中心とする釣鐘型の曲線を示し、その広がりは母集団の分散をサンプルサイズで割ったものになります。
この近似は、サンプル サイズ n が増加するにつれて改善されることに注意することが重要です。この概念を説明するために、いくつかの例を見てみましょう。電話銀行への通話の標準偏差がシグマ = 1 分で、サイズ 81 のサンプルを取得しているとします。サンプル平均の分布 (x バー) はほぼ正規になり、平均は母平均と標準に等しくなります。シグマの偏差を n の平方根で割った値 (この場合、1 / √81 ≈ 0.11)。
The central limit theorem lets us build confidence intervals for the mean even when the shape of the population distribution isn't known. If this vid helps y...
臨界 Z スコア「Z スター」は、指定された信頼レベル「c」によって決定されます。この値は、テクノロジーを使用するか、テーブルを参照することによって計算できます。統計計算にテーブルを使用することは通常は推奨されませんが、95% の信頼水準 (az スコア 1.960 に相当) など、一般的に使用される信頼水準の場合、テーブルは小さいため、使用するのが妥当です。
Choosing the correct sample size to accommodate a required margin of error is easy! Let's see how to do it. If this vid helps you, please help me a tiny bit ...
皆さん、こんにちは。今日のセッションでは、t 分布を使用して信頼区間を構築します。これまでの説明では、n の平方根に mu と x bar をプラスまたはマイナスした Z スター シグマと等しいという式を使用して、母平均 mu を標本平均 x bar で近似し、誤差の範囲を計算しました。ただし、この式は母集団の標準偏差シグマがわかっていることを前提としていますが、実際にはそうではないこともよくあります。
この制限を克服するために、標本標準偏差 s を使用して母集団標準偏差 sigma を推定できます。 t 分布の信頼区間の式は前の式と似ていますが、わずかに変更があります。臨界 Z スコアの代わりに、選択した信頼レベルに基づいて臨界 t 値を使用します。 t 分布は、変数 t の変動性を表します。これは、t に等しい x bar から s 上の mu を引いた値を n の平方根で割って求められます。 t 分布は対称で釣鐘型で、標準正規分布に似ていますが、サンプル サイズが小さい場合はわずかに広がります。
信頼区間を構築するには、t が負の t スターと正の t スターの間にある確率が、選択した信頼水準と等しくなるように、t スターとして示される t のカットオフ値を見つける必要があります。 t スターを決定したら、式 mu は、n の平方根に対して x bar プラスまたはマイナス t-スター s に等しいという式を使用して信頼区間を計算できます。
How do we construct confidence intervals when the population standard deviation is unknown? Easy! We use the t-distribution. If this vid helps you, please he...
R is a fantastic way to do computations in the t-distribution. If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more #rsta...
Quick t-distribution confidence intervals in R. So easy! If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more #rstats joy...
How can we estimate a population proportion using only a sample proportion? Using a confidence interval, of course! If this vid helps you, please help me a t...
Constructing a confidence interval for a population proportion using sample data, and planning the sample size of a study. Awesome! If this vid helps you, pl...
Let's talk about hypothesis testing (also known as significance testing). How can we test a claim about a population using just sample data? What is a p-valu...
みなさん、良い一日を!今日は、仮説検定の概念をさらに深く掘り下げ、統計的有意性の概念について説明します。仮説検定にはさまざまな形式がありますが、最も一般的なものは母平均の z 検定と t 検定です。それにもかかわらず、基本的なロジックは変わりません。
まず、帰無仮説が正しいと仮定します。次に、データのサンプルを収集し、帰無仮説が正しいと仮定して、純粋にランダムな偶然によって同様のサンプルが得られる確率を計算します。この確率は検定の p 値として知られています。 p 値が低いほど、帰無仮説に対する証拠がより強力であることを示します。
ただし、ほとんどの場合、単に p 値を比較するだけでは、最終的な決定を下すのに十分ではない可能性があります。したがって、仮説検定を実行する前に、有意水準アルファとして知られる所定のカットオフ p 値を確立すると役立つことがよくあります。通常、アルファは 0.05 に設定されますが、値は異なる場合があります。
アルファより小さい p 値に基づいて帰無仮説を棄却すると、結果は統計的に有意であると見なされます。言い換えれば、証拠は対立仮説を裏付けています。ここで、これらの概念を説明するためにいくつかの例を見てみましょう。
Let's talk about statistical significance! What's up with alpha anyway?? If this vid helps you, please help me a tiny bit by mashing that 'like' button. For ...
次に、データを収集し、x̄ で示される標本平均を計算します。そこから、帰無仮説が真であると仮定して、観察したものと同じくらい極端なサンプル平均が得られる確率 (p 値) を決定します。 p 値は帰無仮説に対する証拠の強さを示し、値が低いほど対立仮説を支持する強力な証拠を示します。多くの場合、p 値を、検定の有意水準を示すアルファと呼ばれる事前に決定されたカットオフと比較することによって仮説検定を終了します。 p 値がアルファより小さい場合、帰無仮説は棄却されます。データ収集の前に有意水準アルファを選択する必要があることに注意することが重要です。
ここで、対立仮説をさらに詳しく見てみましょう。前の議論で、対立仮説は帰無仮説と矛盾するように選択されると述べました。 mu が mu₀ に等しいという単純な帰無仮説 (mu₀ が仮説値を表す) の場合でも、潜在的な対立仮説が 3 つあります。
mu < mu₀: この対立仮説は、母集団平均 mu が仮説値 mu₀ よりも小さいことを主張します。
mu > mu₀: この対立仮説は、母集団平均 mu が仮説値 mu₀ よりも大きいことを示唆しています。
p 値が有意水準 (アルファ) 以下の場合、帰無仮説は棄却されます。これは、データが帰無仮説に対する強力な証拠を提供し、対立仮説を裏付けることを意味します。一方、p 値が有意水準より大きい場合は、帰無仮説を棄却できません。この場合、データは帰無仮説を棄却するのに十分な証拠を提供しておらず、対立仮説を十分に裏付けることができません。
要約すると、仮説検定には、証拠を収集したいステートメントを表す帰無仮説と、帰無仮説に矛盾する対立仮説を定式化することが含まれます。データが収集され、サンプル平均などの検定統計量が計算されます。次に、帰無仮説が真であると仮定して、観察されたものと同じくらい極端な検定統計量が得られる確率を表す p 値が計算されます。片側対立仮説と両側対立仮説の選択は、研究課題と母集団パラメーターに関する特定の仮定によって異なります。最後に、p 値が有意水準と比較され、データによって提供される証拠に基づいて帰無仮説を棄却するか棄却できないかが決定されます。
信頼区間と中心極限定理
信頼区間と中心極限定理
皆さん、こんにちは。今日は中心極限定理を適用して母平均の信頼区間を構築します。母集団平均の信頼区間の式 mu は、サンプリングされる母集団が平均 mu と分散シグマ二乗を持つ完全な正規分布に従うという仮定に基づいています。ただし、多くの場合、この仮定は合理的ではありません。たとえば、電話銀行からの平均通話時間を決定する場合、通話時間の分布が正規である可能性は低くなります。釣鐘曲線ではなく、歪んだ分布を持つヒストグラムになる可能性が高くなります。
それにもかかわらず、中心極限定理を利用することで、母集団平均 mu の信頼区間を構築することができます。この定理は、標本サイズ n が十分に大きい限り (通常は n ≥ 30)、母集団の分布の形状に関係なく、標本平均の標本分布はほぼ正規分布になる、というものです。これを視覚化するには、サイズ n のサンプルを繰り返し取得し、毎回サンプル平均 (x バー) を計算し、それらのサンプル平均のヒストグラムを作成することを想像してください。中心極限定理によれば、そのヒストグラムは母集団の平均を中心とする釣鐘型の曲線を示し、その広がりは母集団の分散をサンプルサイズで割ったものになります。
この近似は、サンプル サイズ n が増加するにつれて改善されることに注意することが重要です。この概念を説明するために、いくつかの例を見てみましょう。電話銀行への通話の標準偏差がシグマ = 1 分で、サイズ 81 のサンプルを取得しているとします。サンプル平均の分布 (x バー) はほぼ正規になり、平均は母平均と標準に等しくなります。シグマの偏差を n の平方根で割った値 (この場合、1 / √81 ≈ 0.11)。
この情報を使用すると、母集団の分布が正規であることがわかっている場合と同様に、信頼区間を計算できます。ただし、これらの信頼区間は近似値にすぎないことを覚えておく必要があります。たとえば、サイズ 81 のサンプルがあり、サンプル平均が 1.1 分である場合、次の式を使用して母集団平均の 95% 信頼区間を構築できます。
mu ≈ x bar ± z star * シグマ / √n
値 (x bar = 1.1、sigma = 1.0、n = 81) を代入し、95% 信頼度 (1.960) に対応する臨界 Z 値 (Z star) を使用すると、母集団平均 (μ) はおよそ95% の信頼度で 1.1 ± 0.22 分。
別の例を考えてみましょう。ある大企業では、全国の小売店で何千人もの店員を雇用しています。サイズ 35 のサンプルでは、週あたりの平均労働時間は 23 時間でした。標準偏差 (シグマ) を仮定して、この企業に雇用されているすべての事務員の平均労働時間の 90% 信頼区間を構築したいと考えています。 5時間。同じ公式を使用できます。
mu ≈ x bar ± z star * シグマ / √n
値 (x bar = 23、sigma = 5、n = 35) を代入し、90% 信頼度 (1.645) に対応する臨界 Z 値 (Z star) を使用すると、母集団平均 (μ) はおよそ90% の信頼性で 23 ± 1.4 時間。
要約すると、母集団の分布が正確に正規でなくても、中心極限定理を使用して母集団の平均値の近似信頼区間を構築できます。これらの間隔は貴重な洞察を提供し、統計的推論を行うのに役立ち、推定値に関連する信頼レベルを理解します。
信頼区間とサンプルサイズ
信頼区間とサンプルサイズ
皆さんこんにちは。今日は信頼区間とサンプルサイズについて説明します。サイズ「n」、サンプル平均「x bar」の単純なランダムサンプルがある場合、次の式を使用して母集団平均「mu」のレベル「c」信頼区間を構築できます。
ミュー = x バー ± z スター * シグマ / √n
ここで、「z スター」は信頼水準「c」に対応する臨界 z スコアを表し、「シグマ」は母集団標準偏差です。 「z star * sigma / √n」という用語は誤差範囲と呼ばれ、サンプル平均が母集団の真の平均値「mu」からどの程度逸脱する可能性があるかの推定値です。
信頼区間の構築の背後にある考え方は、大まかに言えば、「mu」は時間のパーセンテージ「c」だけ「x bar」の誤差範囲内に収まるということです。
ここで、実際的な質問を考えてみましょう。誤差範囲を指定したしきい値「e」以下にしたい場合、どのくらいの大きさのサンプルが必要ですか?この場合、「e」は望ましい誤差範囲、「c」は信頼度、そして「シグマ」は母標準偏差(既知であると仮定します)がわかっています。方程式を代数的に解くことで、必要なサンプル サイズ「n」を見つける必要があります。
サンプル サイズを計算するには、方程式の両辺に √n を掛け、両辺を「e」で割って、両辺を 2 乗すると次のようになります。
n = (z スター * シグマ / e)^2
「n」の結果の値が整数でない場合は、「z スター」が無理数になる傾向があるため、これはよく起こりますが、最も近い整数に切り上げます。サンプル サイズを増やすと誤差の範囲が減少し、「n」を切り捨てると誤差の範囲が目的のしきい値「e」を超えて増加する可能性があることに注意することが重要です。
臨界 Z スコア「Z スター」は、指定された信頼レベル「c」によって決定されます。この値は、テクノロジーを使用するか、テーブルを参照することによって計算できます。統計計算にテーブルを使用することは通常は推奨されませんが、95% の信頼水準 (az スコア 1.960 に相当) など、一般的に使用される信頼水準の場合、テーブルは小さいため、使用するのが妥当です。
例を考えてみましょう。標準偏差 1.2 ポンドの体重計を使用して、統計学者の体重を最も近い 0.5 ポンドまで 95% の信頼度で決定したいとします。統計学者の重み付けを何回行う必要があるでしょうか?
指定された値をサンプル サイズの式に代入すると、必要なサンプル サイズの最小値は 23 回の計量であることがわかり、これを 23 に切り上げます。 したがって、次の式で最も近い 0.5 ポンドまでの体重を知るには、統計学者の体重を 23 回計量する必要があります。 95%の信頼性。
予想通り、信頼水準を上げたり、誤差の範囲を減らしたりすると、必要なサンプル サイズも増加します。逆に、誤差の範囲を大きくすると、必要なサンプル サイズは減少します。
別の例では、メーカーが特定のタイプの鉄くぎの平均重量を 99% の信頼度で 0.2 グラム以内に決定したいと考えており、母集団標準偏差は 0.5 グラムであるとします。サンプル サイズの式を適用すると、誤差が 0.2 グラム以下で 99% の信頼水準を達成するには、最小サンプル サイズ 42 本の釘が必要であることがわかります。
信頼区間とそのサンプルサイズとの関係を理解することで、研究や実験を効果的に計画し、必要な信頼性と精度のレベル内で推定値が正確で信頼できることを保証できます。
t 分布を使用した信頼区間
t 分布を使用した信頼区間
皆さん、こんにちは。今日のセッションでは、t 分布を使用して信頼区間を構築します。これまでの説明では、n の平方根に mu と x bar をプラスまたはマイナスした Z スター シグマと等しいという式を使用して、母平均 mu を標本平均 x bar で近似し、誤差の範囲を計算しました。ただし、この式は母集団の標準偏差シグマがわかっていることを前提としていますが、実際にはそうではないこともよくあります。
この制限を克服するために、標本標準偏差 s を使用して母集団標準偏差 sigma を推定できます。 t 分布の信頼区間の式は前の式と似ていますが、わずかに変更があります。臨界 Z スコアの代わりに、選択した信頼レベルに基づいて臨界 t 値を使用します。 t 分布は、変数 t の変動性を表します。これは、t に等しい x bar から s 上の mu を引いた値を n の平方根で割って求められます。 t 分布は対称で釣鐘型で、標準正規分布に似ていますが、サンプル サイズが小さい場合はわずかに広がります。
信頼区間を構築するには、t が負の t スターと正の t スターの間にある確率が、選択した信頼水準と等しくなるように、t スターとして示される t のカットオフ値を見つける必要があります。 t スターを決定したら、式 mu は、n の平方根に対して x bar プラスまたはマイナス t-スター s に等しいという式を使用して信頼区間を計算できます。
例を見てみましょう。研究者のグループは、カナダの湖のナトリウム濃度を調査したいと考えています。彼らは 23 個のサンプルを収集し、平均値が 24.7 ppm で、サンプルの標準偏差が 4.2 ppm であることがわかりました。湖の平均ナトリウム濃度の 95% 信頼区間を構築したいと考えています。母集団の標準偏差がわからないため、t 分布を使用します。
値を代入すると、x bar は 24.7、s は 4.2、n は 23 となります。臨界 t 値を見つけるには、各側の面積の 2.5% を残すことに対応する t スター値を決定する必要があります。 t 分布の。逆 t 計算を使用すると、t-star は約 2.074 であることがわかります。
これで、信頼区間を構築できます。24.7 プラスまたはマイナス 2.074 掛ける 4.2 を 23 の平方根で割った値です。この式を単純化すると、24.7 プラスまたはマイナス 1.8 の信頼区間が得られます。
臨界 t 値 2.074 は、同じ信頼水準の臨界 Z スコアよりわずかに大きいことに注目してください。これは、母集団の標準偏差を推定しているため、追加の不確実性が導入され、その結果、信頼区間がわずかに広くなるからです。
要約すると、母集団の標準偏差がわからない場合に信頼区間を構築する場合は、t 分布を使用し、標本の標準偏差で母集団の標準偏差を推定します。プロセスの残りの部分は、既知の標準偏差を使用して信頼区間を構築するのと似ていますが、臨界 Z スコアの代わりに臨界 t 値を使用します。
R を使用した t 分布での計算
R を使用した t 分布での計算
皆さん、今日は R の t 分布を使用して計算を実行します。3 つの問題を段階的に解決していきます。さっそく飛び込んでみましょう!
まず、累積分布関数 (CDF) を使用して t 分布の確率を計算する方法について説明します。 0.44 などの特定の t 値を代入すると、CDF はその値以下の t スコアをランダムに取得する確率を与えます。視覚的には、t 分布は釣鐘型のパターンを示すため、これは釣鐘曲線のグラフ化に相当します。
確率を求めるために、対象の t スコア (0.44) にラベルを付け、そのスコアの左側の領域を陰影付けします。この影付きの領域は、探している確率を表します。 t 分布の計算には、困難で精度が低い可能性があるため、テーブルに依存するのではなく、R を使用することを強くお勧めします。 R では、t 分布の CDF に対応するコマンドは pt であり、これには 2 つの引数、t 値 (0.44) と自由度の数 (26) が必要です。
R に切り替えて、pt コマンド pt(0.44, 26) を実行しましょう。結果は約 0.668 で、この t 分布で 0.44 以下の t スコアをランダムに取得する確率が約 66.8% であることを示しています。
さて、問題 2 に移りましょう。自由度 19 の t 分布で t が -0.8 から 0.5 の間にある確率を見つけたいと考えています。これを解決するには、t = 0.5 の左側の面積を計算し、t = -0.8 の左側の面積を減算します。これは、間に減算を挟んだ 2 つの pt コマンド (pt(0.5, 19) - pt(-0.8, 19)) を使用することで実現できます。結果は約 0.472 で、自由度 19 の t 分布で -0.8 ~ 0.5 の t スコアをランダムに取得する確率が約 47.2% であることを示しています。
問題 3 に進み、タウ以下の t スコアを取得する確率が 0.3 となるように、自由度 50 の t 分布の値 (タウ) を見つける必要があります。これには、逆 CDF 計算が含まれます。 R で qt 関数を使用して、確率 (0.3) と自由度 (50) を指定できます。 qt コマンド qt(0.3, 50) を実行してみましょう。結果は約 -0.5277 になります。どの t 分布でも釣鐘曲線の中心は t = 0 にあるため、負の数を取得することは合理的であることに注意することが重要です。
これらの計算は手動で行うこともできますが、R にはプロセスを簡素化する便利な関数 (pt および qt) が用意されていることに注意してください。これらの機能を活用することで時間を節約し、正確性を確保します。
R の信頼区間
R の信頼区間
皆さん、今日は R で信頼区間を扱います。これは、単なる要約統計量ではなく実際のデータセットがある場合に特に役立ちます。この例では、CO2 データセットを調べ、「取り込み」変数に焦点を当てます。
以前は、サンプル平均 (x バー) とサンプル標準偏差 (s) を使用して信頼区間を計算しましたが、今回は「t.test」コマンドを使用したショートカットを学習します。対象の変数 (この場合は CO2 データ セットからの「取り込み」) を指定すると、コマンドはデフォルトで 95% の信頼水準に設定されます。
t-test コマンドはいくつかの情報を提供します。そのうちのいくつかは、後で仮説検定について説明するときにより関連性が高くなります。今のところ、注目すべき重要な詳細は、95% 信頼区間と点推定値です。信頼区間は、母集団平均を推定できる値の範囲を表します。点推定値はサンプル平均値であり、母集団平均値の単一値推定値として機能します。
t 検定の出力には、サンプル サイズより 1 つ少ない自由度も含まれます。 p 値や対立仮説などのその他の情報については、有意性検定に関する今後のビデオで説明されます。
t 検定の出力は誤差の範囲を直接提供しませんが、手動で計算できます。 t 信頼区間の誤差の範囲は次の式に従います。T* * (s / sqrt(n))。ここで、s はサンプルの標準偏差、n はサンプル サイズ、T* は臨界 t 値です。望ましい信頼レベル。
T* を求めるには、「qt」関数を使用して、T* の左側の領域を指定します。 95% 信頼区間の場合、T* の左側の領域の 97.5% が必要です。したがって、T* は「qt(0.975, 83)」として計算されます。 T* にサンプルの標準偏差を乗算し、それをサンプル サイズの平方根で割ると、誤差の範囲が求められます。
あるいは、R の「t.test」関数を使用して、信頼区間を自動的に計算することもできます。信頼レベルを変更するには、引数「conf.level=」を追加し、必要なパーセンテージを指定します。たとえば、「conf.level = 90」と設定すると、90% の信頼区間が得られます。
信頼水準を下げると、結果として得られる信頼区間は狭くなります。間隔の上限が減少していることは、推定の精度がより高いレベルであることを示しています。
要約すると、信頼区間は、母集団平均を推定するための値の範囲を提供します。 R には、計算を簡素化し、正確な結果を得るために「t.test」や「qt」などの便利な関数が用意されています。
比率の信頼区間
比率の信頼区間
皆さん、こんにちは。今日は比率の信頼区間を構築します。多くの場合、表か裏、はいかいいえ、真か偽など、2 つの結果が考えられるランダムなプロセスに遭遇します。私たちは、サンプル データに基づいて、これらの結果の確率について結論を導き出したいと考えています。
これらの結果を分析するには、1 つの結果を成功として割り当てて 1 としてエンコードし、もう 1 つの結果を失敗として 0 としてエンコードします。 「成功」と「失敗」という用語は恣意的なものであり、結果に対する価値判断を意味するものではないことに注意することが重要です。
この方法で変数をエンコードすることで、X と呼ぶ離散確率変数を作成します。X は 2 つの値 (1 と 0) をとり、確率はそれぞれ p と (1 - p) です。ここで、p は成功の確率を表します。
このタイプの確率変数については、概要情報を計算できます。平均値または期待値は、それぞれの確率で重み付けされた確率変数のすべての可能な値の合計です。ベルヌーイ試行の場合、平均は p に等しくなります。
確率変数の標準偏差は、個々の値と期待値の間の差の二乗和の平方根であり、それぞれに確率で重み付けされます。ベルヌーイ試行の場合、標準偏差は (p * (1 - p)) の平方根で求められます。
ここで、p が試行全体で一定のままである n 個の同一の独立したベルヌーイ試行を実行することを考えてみましょう。これらの試行における成功の割合は p-hat として示され、これは (1/n) * sum(xi) に等しくなります。ここで、xi は成功の場合は 1、失敗の場合は 0 です。言い換えれば、p-hat は n 回の試行における成功の割合です。
p-hat は単なる標本平均であるため、標本平均に関する知識をそれに適用できます。 p-hat の平均は p に等しく、個々のベルヌーイ試行の平均と同じです。 p ハットの標準偏差は ((p * (1 - p)) / n) の平方根に等しく、これは 1 回のベルヌーイ試行の標準偏差を n の平方根で割ったものです。中心極限定理により、n が大きい場合 (通常は 30 以上)、p ハットの標本分布はほぼ正規になります。
次に、信頼区間について説明します。平均の場合、信頼区間の基本構造は mu = x-bar +/- z-star * sigma-sub-x-bar です。同様に、比率の信頼区間の式は、p = p-hat +/- z-star * sqrt((p-hat * (1 - p-hat)) / n) です。
比例式では、p-hat はサンプル内の成功の実験的割合を表し、p は推定しようとしている全体的な成功確率です。 p-hat が 0 または 1 に近づくと誤差の範囲が小さくなるため、そのような場合にはこの信頼区間を使用しないことをお勧めします。
特定の誤差範囲 (e) に必要なサンプル サイズを決定するには、式 n = (p-hat * (1 - p-hat) * z-star^2) / epsilon^2 を使用します。予備データがない場合は、最も控えめな推定値である p-hat = 0.5 を使用できます。これにより、可能な限り最大のサンプル サイズが得られます。この場合、式は n = (z-star^2) / (4 * epsilon^2) となります。
例を考えてみましょう。 95% の信頼度で調査を実施し、誤差の範囲が 3% を超えないようにする必要があるとします。予備データがないため、控えめな推定値 p-hat = 0.5 を使用します。値 z-star = 1.96 および epsilon = 0.03 を式に代入すると、次のようになります。
n = (1.96^2) / (4 * 0.03^2) ≈ 1067.1
サンプル サイズは整数である必要があるため、誤差範囲が 3% を超えないように値を切り上げます。したがって、この調査には 1068 のサンプル サイズが必要になります。
要約すると、比率の信頼区間を構築するには、成功値と失敗値を割り当て、サンプル平均と標準偏差を計算し、適切な式を使用して信頼区間を決定することが含まれます。これらの間隔を使用する条件を考慮し、必要な誤差範囲に基づいてサンプル サイズを調整することが重要です。
比率の信頼区間: 例
比率の信頼区間: 例
今日は、比率の信頼区間の構築を含む 2 つの問題例に取り組みます。問題を詳しく見てみましょう。
問題 1: 無作為に選ばれた 275 人のアメリカ成人を対象とした調査では、そのうち 29 人がコーヒーを飲んでいることが明らかになりました。コーヒーを飲むアメリカ成人全体の割合の 90% 信頼区間を構築する必要があります。
比率の信頼区間の公式の使用: p = p̂ ± z √(p̂(1 - p̂)/n)、ここで、p̂ はサンプル比率、n はサンプル サイズ、z は次の値に対応する臨界 Z 値です。望ましい信頼レベル。
p̂ = 29/275 = 0.1055、n = 275、および z* = 1.645 (90% の信頼水準の場合) とすると、次の値を代入できます。
p = 0.1055 ± 1.645 * √((0.1055 * (1 - 0.1055))/275)
この式を計算すると、コーヒーを飲むアメリカ成人の割合の信頼区間は約 0.1055 ± 0.045 であることがわかります。したがって、真の割合が区間 (0.0605、0.1505) 内に収まると 90% の信頼度で推定できます。
問題 2: 研究者はアメリカでのお茶の飲み方を研究したいと考えており、誤差範囲が 4% 以下であることを保証するために必要なサンプル サイズを決定する必要があります。
比率の信頼区間の誤差の公式 e = z*√(p̂(1 - p̂)/n) を使用して、サンプル サイズを求めるためにそれを並べ替えることができます。
n = (z*^2 * p̂(1 - p̂)) / e^2。
この場合、予備データがないため、p^ の最も保守的な推定値である 0.5 (最大の変動を示す) を使用します。 z* = 1.645 (90% 信頼水準の場合) および e = 0.04 の場合、これらの値を式に代入できます。
n = (1.645^2 * 0.5(1 - 0.5)) / 0.04^2
式を単純化すると、必要な最小サンプル サイズは約 257.03 であることがわかります。サンプル サイズは整数である必要があるため、必要な誤差の範囲を超えないように切り上げます。したがって、誤差範囲が 4% 以下であることを保証するには、サンプル サイズ 258 が必要です。
要約すると、比率の信頼区間を構築するには、サンプル比率、サンプルサイズ、臨界値を組み込んだ式を使用する必要があります。これらの式を適用すると、指定された信頼レベル内で母集団の割合を推定し、望ましい誤差範囲を達成するために必要なサンプル サイズを決定できます。
仮説検定の概要
仮説検定の概要
皆さん、こんにちは。今日のセッションでは、有意性検定とも呼ばれる仮説検定について詳しく説明します。概念をよりよく理解するために、一緒に例を見てみましょう。さぁ、始めよう。
チョコレートメーカーが、自社のチョコレートバーの重さは平均 350 グラムであると主張しているとします。しかし、私は彼らの主張が誇張されているのではないかと疑っており、彼らのチョコレートバーの本当の平均重量は350グラム未満です。これを調査するために、10 個のチョコレート バーのサンプルを収集し、その重量を記録します。サンプル平均が 350 グラム未満であれば、会社の主張に対する証拠となります。 350グラム以上であれば、彼らの主張に異議を唱えることはできません。
私のサンプルの平均重量は 347 グラムで、これは 350 グラム未満であると仮定します。したがって、この結果は私の疑惑を裏付けるものであり、会社の主張に異議を唱えるものです。しかし、会社は、私のサンプルはランダムに軽かった可能性があり、別のサンプルを収集した場合、ランダムな偶然により正確に 350 グラム、あるいはそれ以上の量が得られる可能性があると主張する可能性があります。したがって、会社が嘘をついているのか、それとも偶然による結果なのか、この 2 つの可能性のどちらかを判断する方法が必要です。
このような状況では、私たちにできるのは、会社の主張に関して確率論を述べるのがせいぜいです。私たちは、企業が真実を語っている場合、純粋に偶然に観察したものと同じくらい低い標本平均が得られる確率を決定したいと考えています。確率が低いほど、企業の主張に対する証拠が強力であることを示します。
数学的に話を進めるために、会社の主張と一致する、H0 で示される帰無仮説を仮定しましょう。この場合、帰無仮説は、すべてのチョコレート バーの母集団平均がちょうど 350 グラムであることを示します。一方、Ha で示される対立仮説があり、これは確立しようとしているものを表しています。この場合、Ha は、すべてのチョコレート バーの平均重量は 350 グラム未満であると主張します (Ha: μ < 350)。
H0 と Ha は両方とも、標本平均 (x バー) ではなく、母集団パラメーターを指すことに注意することが重要です。 x-bar については、H0 と Ha の間の決定に使用するため、まだ言及していません。
確率を計算するには、x バーの標本分布を考慮する必要があります。帰無仮説が正しいと仮定し、サイズ 10 の複数のサンプルを取得することを想定します。x バーの分布はどのように見えるでしょうか?個々のチョコレート バーの重量は異なる場合がありますが、平均重量 (x バー) は平均して母集団平均 (μ) と一致します。
中心極限定理は、標本分布を理解するのにさらに役立ちます。十分に大きなサンプル サイズ (多くの場合、n > 30) の場合、x バーの標本分布は、平均 μ と標準偏差 σ/√n をもつ正規分布に近似します。母集団分布自体が正規である場合、近似は正確であり、x バーの分布も正確に正規です。
個々のチョコレート バーを表す青い曲線を想像してください。帰無仮説の下での平均重量は 350 グラムです。一部のバーはわずかに重かったり軽かったり、いくつかは大幅にずれている場合があります。次に、x バーの標本分布を表す緑色の曲線を視覚化します。帰無仮説が正しい場合、X バーは平均して 350 グラムになりますが、若干の変動はあります。ただし、サンプル内では極端な重みが互いにバランスする傾向があるため、x バーの変動は個々のバーに比べて小さくなります。
チョコレートバーの標準偏差が 4 グラムであると仮定します。これは私たちが通常知っている値ではないかもしれませんが、今後のビデオで取り上げる予定です。 μ = 350 グラムの帰無仮説と中心極限定理により、x バーの標本分布について必要な情報がすべて得られます。これは、平均 350 グラム、標準偏差 4 グラムを 10 の平方根 (サンプル サイズが 10 であるため) で割った正規分布に従い、これは約 1.26 グラムになります。
純粋にランダムな偶然によって 347 グラム以下のサンプル平均 (x バー) が得られる確率を計算するには、z スコアを計算します。 X バーが 347 グラム以下である確率は、対応する Z スコアが (347 - 350) / 1.26 以下である確率と等しく、単純化すると -2.37 になります。
統計ソフトウェアまたは表を使用すると、標準正規分布が -2.37 以下になる確率は約 0.0089 であることがわかります。この確率は p 値と呼ばれます。
ここで、p 値の解釈について説明します。この場合、p 値 0.0089 は比較的小さいです。 p 値は、帰無仮説 (μ = 350 グラム) が正しい場合に、347 グラム以下のサンプル平均が得られる確率を表します。 p 値が小さいということは、帰無仮説が正しい場合、そのような低いサンプル平均が観察される可能性は低いことを示しています。
考慮すべき可能性は 2 つあります。1 つ目は、帰無仮説が正しい可能性があり、約 0.0089 回発生するまれなイベント (サンプル平均が 347 グラム以下) が偶然に観察されたということです。第 2 に、帰無仮説が (最初に疑ったように) 偽で、対立仮説 (μ < 350 グラム) が真である可能性があります。
p 値 0.0089 は非常に低いため、最初の可能性は低いと思われます。したがって、帰無仮説 (H0: μ = 350 グラム) を棄却し、対立仮説 (Ha: μ < 350 グラム) を支持します。このことから、この会社が製造するチョコレートバーの母集団平均重量が実際に 350 グラム未満であることを示唆する強力な証拠があると結論付けられます。
最後に、仮説検定を実施する基本的な手順を説明しました。ただし、十分に小さい p 値のしきい値の決定、対立仮説の検討、母集団パラメーターが不明な状況への対処など、まだ取り組んでいない追加の質問もあります。今後のビデオでは、これらの質問を検討し、仮説検証についてのさらなる洞察を提供します。
統計的有意性
統計的有意性
みなさん、良い一日を!今日は、仮説検定の概念をさらに深く掘り下げ、統計的有意性の概念について説明します。仮説検定にはさまざまな形式がありますが、最も一般的なものは母平均の z 検定と t 検定です。それにもかかわらず、基本的なロジックは変わりません。
まず、帰無仮説が正しいと仮定します。次に、データのサンプルを収集し、帰無仮説が正しいと仮定して、純粋にランダムな偶然によって同様のサンプルが得られる確率を計算します。この確率は検定の p 値として知られています。 p 値が低いほど、帰無仮説に対する証拠がより強力であることを示します。
ただし、ほとんどの場合、単に p 値を比較するだけでは、最終的な決定を下すのに十分ではない可能性があります。したがって、仮説検定を実行する前に、有意水準アルファとして知られる所定のカットオフ p 値を確立すると役立つことがよくあります。通常、アルファは 0.05 に設定されますが、値は異なる場合があります。
アルファより小さい p 値に基づいて帰無仮説を棄却すると、結果は統計的に有意であると見なされます。言い換えれば、証拠は対立仮説を裏付けています。ここで、これらの概念を説明するためにいくつかの例を見てみましょう。
例 1: チョコレート製造業者は、自社のチョコレート バーの平均重量は 350 グラムであると主張しています。ただし、真の平均体重はこれより低いのではないかと考えられます。会社の主張が真実であるという帰無仮説と、平均重量が 350 グラム未満であるという対立仮説を述べることで、有意性検定を設定しました。アルファの有意水準として 0.05 を使用することを事前に決定します。
サイズ 10 のサンプルを収集し、347 グラムのサンプル平均を計算した後、帰無仮説が真であると仮定して、これと同じくらい極端な結果が得られる確率を決定します。この結果、p 値は 0.0089 になります。この p 値は 0.05 未満であるため、帰無仮説は棄却され、その会社のチョコレート バーの平均重量は確かに 350 グラム未満であると結論付けられます。
例 2: 医学研究者は、新しい減量薬の有効性をテストする研究を実施します。アルファの有意水準として 0.01 を選択します。帰無仮説は、プラセボと比較した平均体重減少がゼロであると述べますが、対立仮説は、正の平均体重減少を示唆します。データを分析した後、p 値は 0.045 になりました。 p 値は選択した有意水準 0.01 より大きいため、帰無仮説を棄却できません。したがって、この治療法が平均してプラセボよりも優れていると結論付けるには十分な証拠がありません。
代わりに 0.05 に等しいアルファの有意水準を選択していたら、結論は異なっていた可能性があることに注意することが重要です。これは、有意性検定とアルファしきい値の使用に潜在的な落とし穴があることを浮き彫りにしています。意思決定のために仮説テストに盲目的に依存するのは危険です。有意水準アルファに基づいて行われた決定と並行して、常に p 値を報告します。さらに、次のビデオで説明するように、p 値を解釈するときは注意し、さまざまな要素を考慮してください。
仮説検定: 片面および両面の代替案
仮説検定: 片面および両面の代替案
今日の議論では、特に片側対立仮説と両側対立仮説に焦点を当てて、仮説検定の概念をさらに深く掘り下げていきます。まず、平均値の仮説検定の基本構造を再検討しましょう。
最初のステップは、H₀ で示される帰無仮説を特定することです。この記述は母集団の平均に関するものであり、私たちが反対する証拠を収集しようとしている主張を表しています。その後、Hₐ で示される対立仮説を確立します。これは帰無仮説に矛盾し、通常、確立しようとしている仮説を表します。このプロセスの背後にある概念は、帰無仮説に対する証拠を蓄積することで、対立仮説に有利な証拠を間接的に蓄積するというものです。
次に、データを収集し、x̄ で示される標本平均を計算します。そこから、帰無仮説が真であると仮定して、観察したものと同じくらい極端なサンプル平均が得られる確率 (p 値) を決定します。 p 値は帰無仮説に対する証拠の強さを示し、値が低いほど対立仮説を支持する強力な証拠を示します。多くの場合、p 値を、検定の有意水準を示すアルファと呼ばれる事前に決定されたカットオフと比較することによって仮説検定を終了します。 p 値がアルファより小さい場合、帰無仮説は棄却されます。データ収集の前に有意水準アルファを選択する必要があることに注意することが重要です。
ここで、対立仮説をさらに詳しく見てみましょう。前の議論で、対立仮説は帰無仮説と矛盾するように選択されると述べました。 mu が mu₀ に等しいという単純な帰無仮説 (mu₀ が仮説値を表す) の場合でも、潜在的な対立仮説が 3 つあります。
最初の 2 つの対立仮説は特定の方向に焦点を当てているため片側対立仮説と呼ばれますが、3 番目の対立仮説は両側対立仮説として知られています。これらの選択肢はそれぞれ、わずかに異なる方法で帰無仮説と矛盾します。
平均値の仮説検定を実行する場合、これらのオプションの選択は現実世界の考慮事項によって異なります。一般的なガイドラインとして、現実世界の要因に基づいて、母集団の平均が、統計によって提供される値よりも大きくなったり小さくなったりすることはできない、あるいは大きくなるべきではないと仮定する特別な理由がない限り、両側対立仮説を選択することをお勧めします。帰無仮説、mu₀。
理解を深めるために、いくつかの例を見てみましょう。最初の例は、チョコレートバーの平均重量が 350 グラムであると主張するキャンディ会社に関するものです。平均重量が実際にはこれより小さいと疑う場合、帰無仮説が企業の主張となり、対立仮説は mu < 350 グラムになります。この場合、チョコレート バーの平均重量が 350 グラム未満である可能性のみを考慮します。
2 番目の例では、指導マニュアルには、特定の演習には平均 30 分かかると記載されています。帰無仮説はマニュアルの主張である mu = 30 となり、対立仮説は mu ≠ 30 となります。 ここで、mu が 30 より小さいか大きいかの可能性を除外したり無視したりする正当な理由はありません。
3 番目の例では、オイル交換業者は、オイル交換は平均 15 分で完了すると主張しています。実際の時間はもっと長いのではないかと考えてみましょう。
p 値が有意水準 (アルファ) 以下の場合、帰無仮説は棄却されます。これは、データが帰無仮説に対する強力な証拠を提供し、対立仮説を裏付けることを意味します。一方、p 値が有意水準より大きい場合は、帰無仮説を棄却できません。この場合、データは帰無仮説を棄却するのに十分な証拠を提供しておらず、対立仮説を十分に裏付けることができません。
帰無仮説を棄却できなかったとしても、必ずしも帰無仮説が正しいとは限らないことに注意することが重要です。これは単に、データが対立仮説を裏付ける重要な証拠を提供していないことを意味します。帰無仮説に対する証拠がないからといって、帰無仮説が真実であることは証明されません。
片側対立仮説と両側対立仮説のどちらを選択するかは、特定の研究課題と対処したい仮説によって異なります。母集団の平均が特定の値と大きく異なるかどうかを判断したい場合は、両側対立仮説を選択します。これにより、平均が仮説値よりも大きいか小さいかの両方の可能性を考慮することができます。
ただし、平均が仮説値よりも大きくなるか小さくなる可能性があると信じる特定の理由がある場合は、片側対立仮説を選択できます。これにより、検定の焦点が帰無仮説からの逸脱の一方向のみに絞り込まれます。
要約すると、仮説検定には、証拠を収集したいステートメントを表す帰無仮説と、帰無仮説に矛盾する対立仮説を定式化することが含まれます。データが収集され、サンプル平均などの検定統計量が計算されます。次に、帰無仮説が真であると仮定して、観察されたものと同じくらい極端な検定統計量が得られる確率を表す p 値が計算されます。片側対立仮説と両側対立仮説の選択は、研究課題と母集団パラメーターに関する特定の仮定によって異なります。最後に、p 値が有意水準と比較され、データによって提供される証拠に基づいて帰無仮説を棄却するか棄却できないかが決定されます。