Учебники по программированию - страница 15

 

Доверительные интервалы для среднего — пример


Доверительные интервалы для среднего — пример

Всем привет, сегодня мы обсудим построение доверительных интервалов для среднего значения генеральной совокупности, когда известно стандартное отклонение генеральной совокупности. Кроме того, мы рассмотрим факторы, которые могут повлиять на размер погрешности, на примере домашних весов для ванной комнаты.

При использовании напольных весов разумно предположить, что показания будут нормально распределены вокруг истинного веса взвешиваемого человека. Однако ожидается, что эти показания не будут абсолютно точными и могут немного отличаться в большую или меньшую сторону. В этом примере предположим, что у нас есть доступ к информации о стандартном отклонении шкалы населения, которое составляет 1,2 фунта.

Наш основной интерес заключается в построении доверительного интервала для истинного веса взвешиваемого человека, который мы обозначим как μ. Для этого мы многократно взвешиваем человека на весах, вычисляем выборочное среднее этих взвешиваний и используем формулу μ = x-bar ± z-star * σ / √n. Здесь столбец x представляет собой среднее значение выборки, n представляет собой размер выборки, σ представляет собой стандартное отклонение генеральной совокупности, а z-звездочка представляет собой критическое значение z, соответствующее желаемому уровню достоверности (C).

Чтобы сделать наш пример более конкретным, предположим, что мы пять раз взвешиваем статистика на весах и получаем средний вес 153,2 фунта. Это служит нашим образцом среднего. Теперь мы хотим построить 90% доверительный интервал для истинного веса статистика, предполагая стандартное отклонение 1,2 фунта для весов. Подставляя эти значения в формулу, мы получаем, что оценка интервала составляет 153,2 ± 0,88 фунта.

Поскольку мы выбрали уровень достоверности 90%, мы можем ожидать, что этот интервал будет отражать истинный вес статистики примерно в 90% случаев.

Теперь давайте углубимся в структуру погрешности. Предел погрешности соответствует формуле z-звезда * σ / √n, где есть три ключевых компонента: критическое значение z-звезда (относится к доверительному уровню), стандартное отклонение популяции σ (отражающее разброс в популяции) , а размер выборки n.

Изменяя любой из этих трех компонентов, мы можем предсказуемо повлиять на размер погрешности. Если мы увеличим уровень достоверности, погрешность также увеличится, поскольку соответствующее значение z-звезды будет больше. Точно так же увеличение стандартного отклонения совокупности σ приведет к увеличению погрешности, поскольку в данных больше изменчивости, что делает выборочное среднее менее надежным. С другой стороны, увеличение размера выборки n уменьшит погрешность, поскольку среднее значение выборки становится более точным предиктором среднего значения генеральной совокупности.

Чтобы проиллюстрировать эти эффекты, давайте вернемся к нашему примеру с доверительным интервалом 90 % со стандартным отклонением 1,2 фунта и размером выборки 5. Если мы увеличим уровень достоверности до 95 %, значение z-звезды станет равным 1,960, что приведет к большему запасу. ошибки 1,05 фунта. Если мы вернемся к уровню достоверности 90%, но увеличим стандартное отклонение до 1,5 фунта, погрешность увеличится до 1,1 фунта. Наконец, если мы сохраним стандартное отклонение на уровне 1,2 фунта, но удвоим размер выборки до 10, погрешность уменьшится до 0,62 фунта, что указывает на более узкий доверительный интервал.

Важно отметить, что хотя изменение уровня достоверности и размера выборки является практической корректировкой, изменение стандартного отклонения обычно находится вне нашего контроля, поскольку оно отражает присущую популяции изменчивость.

В заключение, доверительные интервалы обеспечивают диапазон правдоподобных значений для интересующего параметра генеральной совокупности. Погрешность, зависящая от уровня достоверности, стандартного отклонения генеральной совокупности и размера выборки, помогает нам понять точность и надежность наших оценок. Увеличение уровня достоверности расширяет интервал, чтобы обеспечить более высокий уровень достоверности при захвате истинного параметра. Большее стандартное отклонение населения приводит к более широкому интервалу из-за повышенной изменчивости данных. И наоборот, увеличение размера выборки сужает интервал, поскольку предоставляет больше информации и повышает точность оценки.

В рассмотренном нами примере можно внести два реалистичных изменения: настроить доверительный уровень и изменить размер выборки. Эти изменения позволяют нам контролировать уровень достоверности и количество данных, используемых для оценки. Однако стандартное отклонение шкалы находится вне нашего контроля, что делает его изменение менее реалистичным.

Понимание факторов, влияющих на погрешность и доверительные интервалы, имеет решающее значение для интерпретации статистических результатов. Это позволяет нам принимать обоснованные решения и делать осмысленные выводы, основанные на точности и надежности наших оценок.

Confidence Intervals for the Mean - Example
Confidence Intervals for the Mean - Example
  • 2020.07.31
  • www.youtube.com
Let's construct a confidence interval for a population mean! We'll also talk about the structure of the margin of error, and what goes into making it large o...
 

Доверительные интервалы и размер выборки


Доверительные интервалы и размер выборки

Всем привет, сегодня мы будем обсуждать доверительные интервалы и размер выборки. Когда у нас есть простая случайная выборка размера «n» со средним значением «x bar», мы можем построить доверительный интервал уровня «c» для среднего значения совокупности «mu», используя формулу:

мю = x бар ± z звезда * сигма / √n

Здесь «звездочка z» представляет критический показатель z, соответствующий уровню достоверности «с», а «сигма» представляет собой стандартное отклонение совокупности. Термин «z star * sigma / √n» упоминается как предел погрешности, который является оценкой того, насколько среднее значение нашей выборки может отклоняться от истинного среднего значения генеральной совокупности «мю».

Идея построения доверительного интервала заключается в том, что, грубо говоря, «мю» будет находиться в пределах погрешности «х бар» в процентах «с» времени.

Теперь давайте рассмотрим практический вопрос: какой размер выборки нам нужен, если мы хотим, чтобы погрешность не превышала заданный порог «e»? В этом случае мы знаем «е» — желаемую погрешность, «с» — уровень достоверности и «сигма» — стандартное отклонение генеральной совокупности (при условии, что оно известно). Нам нужно найти требуемый размер выборки «n», решив уравнение алгебраически.

Чтобы вычислить размер выборки, мы умножаем обе части уравнения на √n, делим обе части на «е», а затем возводим обе части в квадрат, что дает нам:

n = (z звезда * сигма / e) ^ 2

Если результирующее значение «n» не является целым числом, что часто бывает, поскольку «z star» имеет тенденцию быть иррациональным, мы округляем его до ближайшего целого числа. Важно отметить, что увеличение размера выборки уменьшает погрешность, а округление «n» в меньшую сторону потенциально может увеличить погрешность за пределы желаемого порога «e».

Критический показатель z, «звезда z», определяется заданным уровнем достоверности «с». Это значение можно вычислить с помощью технологии или по таблице. Хотя использование таблиц для статистических расчетов обычно не рекомендуется, в случае часто используемых уровней достоверности, таких как уровень достоверности 95% (соответствующий z-показателю 1,960), таблица небольшая и ее целесообразно использовать.

Давайте рассмотрим пример: предположим, мы хотим определить вес статистика с точностью до полфунта с достоверностью 95%, используя шкалу со стандартным отклонением 1,2 фунта. Сколько раз нужно взвесить статистика?

Подставляя данные значения в формулу размера выборки, мы обнаруживаем, что минимальный требуемый размер выборки составляет 23 взвешивания, которые мы округляем до 23. Следовательно, нам нужно взвесить статистика 23 раза, чтобы узнать их вес с точностью до полфунта. 95% уверенности.

Как и ожидалось, если мы увеличим уровень достоверности или уменьшим допустимую погрешность, требуемый размер выборки также увеличится. И наоборот, если мы увеличим погрешность, необходимый размер выборки уменьшится.

В другом примере предположим, что производитель хочет определить средний вес железного гвоздя определенного типа в пределах 0,2 грамма с достоверностью 99%, а стандартное отклонение совокупности составляет 0,5 грамма. Применяя формулу размера выборки, мы обнаруживаем, что минимальный размер выборки в 42 гвоздя необходим для достижения уровня достоверности 99% с погрешностью не хуже 0,2 грамма.

Понимание доверительных интервалов и их связи с размером выборки позволяет нам эффективно планировать исследования и эксперименты, гарантируя, что наши оценки будут точными и надежными в пределах желаемого уровня уверенности и точности.

Confidence Intervals and Sample Size
Confidence Intervals and Sample Size
  • 2020.08.03
  • www.youtube.com
Choosing the correct sample size to accommodate a required margin of error is easy! Let's see how to do it. If this vid helps you, please help me a tiny bit ...
 

Доверительные интервалы и центральная предельная теорема


Доверительные интервалы и центральная предельная теорема

Всем привет, сегодня мы будем применять Центральную предельную теорему и строить доверительные интервалы для среднего значения генеральной совокупности. Формула доверительного интервала для среднего значения генеральной совокупности, mu, основана на предположении, что изучаемая совокупность следует совершенно нормальному распределению со средним значением mu и сигма-квадратом дисперсии. Однако во многих случаях такое предположение не является разумным. Например, при определении средней продолжительности звонков из телефонного банка распределение продолжительности звонков вряд ли будет нормальным. Скорее всего, это будет гистограмма с асимметричным распределением, а не колоколообразная кривая.

Тем не менее, мы все же можем построить доверительный интервал для среднего значения генеральной совокупности mu, используя центральную предельную теорему. Эта теорема утверждает, что пока размер выборки n достаточно велик (обычно n ≥ 30), выборочное распределение среднего значения выборки будет примерно нормально распределено, независимо от формы распределения населения. Чтобы визуализировать это, представьте, что вы многократно берете выборки размера n, каждый раз вычисляете выборочное среднее (x столбец) и создаете гистограмму этих выборочных средних. Согласно центральной предельной теореме, эта гистограмма будет иметь колоколообразную кривую с центром вокруг среднего значения генеральной совокупности, с разбросом, измеряемым дисперсией генеральной совокупности, деленной на размер выборки.

Важно отметить, что это приближение улучшается по мере увеличения размера выборки n. Давайте рассмотрим пару примеров, чтобы проиллюстрировать эту концепцию. Предположим, что стандартное отклонение звонков в телефонный банк составляет сигма = 1 минута, и мы получаем выборки размером 81. Распределение средних значений выборки (х столбцов) будет приблизительно нормальным, со средним значением, равным среднему по совокупности, и стандартным отклонение сигмы, деленное на квадратный корень из n (в данном случае 1 / √81 ≈ 0,11).

С помощью этой информации мы можем вычислить доверительные интервалы, аналогичные тем, когда известно, что распределение населения является нормальным. Однако мы должны помнить, что эти доверительные интервалы являются приблизительными. Например, если у нас есть выборка размером 81 и среднее значение выборки составляет 1,1 минуты, мы можем построить 95% доверительный интервал для среднего значения генеральной совокупности, используя формулу:

мю ≈ x бар ± z звезда * сигма / √n

Подставляя значения (x bar = 1,1, sigma = 1,0, n = 81) и используя критическое значение z (звездочка z), соответствующее 95% достоверности (1,960), мы находим, что среднее значение генеральной совокупности (mu) приблизительно равно 1,1 ± 0,22 минуты с достоверностью 95%.

Рассмотрим другой пример. Крупная корпорация нанимает тысячи продавцов в розничных магазинах по всей стране. В выборке размером 35 человек среднее количество часов, отработанных в неделю, составило 23. Мы хотим построить 90-процентный доверительный интервал для среднего количества часов, отработанных всеми клерками, нанятыми этой корпорацией, исходя из стандартного отклонения (сигмы) 5 часов. Мы можем использовать ту же формулу:

мю ≈ x бар ± z звезда * сигма / √n

Подставляя значения (x bar = 23, sigma = 5, n = 35) и используя критическое значение z (звездочка z), соответствующее 90% достоверности (1,645), мы находим, что среднее значение генеральной совокупности (mu) приблизительно равно 23 ± 1,4 часа с достоверностью 90 %.

Таким образом, даже если распределение населения не совсем нормальное, мы все равно можем использовать центральную предельную теорему для построения приблизительных доверительных интервалов для среднего значения населения. Эти интервалы дают ценную информацию и помогают нам делать статистические выводы, понимая уровень достоверности, связанный с нашими оценками.

Confidence Intervals and the Central Limit Theorem
Confidence Intervals and the Central Limit Theorem
  • 2020.08.11
  • www.youtube.com
The central limit theorem lets us build confidence intervals for the mean even when the shape of the population distribution isn't known. If this vid helps y...
 

Доверительные интервалы с использованием t-распределения


Доверительные интервалы с использованием t-распределения

Всем привет, на сегодняшнем занятии мы будем строить доверительные интервалы, используя t-распределение. В наших предыдущих обсуждениях мы использовали формулу mu равно x bar плюс или минус z-звездное сигма над квадратным корнем из n, чтобы аппроксимировать среднее популяции mu с выборочным средним x bar и рассчитать погрешность. Однако эта формула предполагает, что мы знаем сигму стандартного отклонения совокупности, что часто не так.

Чтобы преодолеть это ограничение, мы можем оценить сигма стандартного отклонения совокупности, используя стандартное отклонение выборки s. Формула доверительного интервала с t-распределением аналогична предыдущей с небольшим изменением. Вместо критического z-показателя мы используем критическое t-значение на основе выбранного уровня достоверности. Распределение t описывает изменчивость переменной t, которая определяется как t равно x bar минус mu по s, деленному на квадратный корень из n. Стьюдентное распределение является симметричным и колоколообразным, подобно стандартному нормальному распределению, но с немного большим разбросом для меньших размеров выборки.

Чтобы построить доверительный интервал, нам нужно найти пороговые значения для t, обозначенные как t-звезда, такие, что вероятность того, что t находится между отрицательной t-звездой и положительной t-звездой, равна выбранному доверительному уровню. Как только мы определили t-звезду, мы можем рассчитать доверительный интервал, используя формулу мю равно x бар плюс или минус t-звезда s на квадратный корень из n.

Давайте поработаем на примере. Группа исследователей хочет исследовать концентрацию натрия в канадском озере. Они собрали 23 образца и нашли среднее значение 24,7 частей на миллион и стандартное отклонение образца 4,2 частей на миллион. Мы хотим построить 95% доверительный интервал для средней концентрации натрия в озере. Поскольку стандартное отклонение населения неизвестно, мы будем использовать t-распределение.

Подставляя значения, мы получаем, что бар x равен 24,7, s равен 4,2, а n равен 23. Чтобы найти критическое значение t, нам нужно определить значение t-звезды, которое соответствует оставлению 2,5% площади с каждой стороны. t-распределения. Используя обратный расчет t, мы находим, что t-звезда приблизительно равна 2,074.

Теперь мы можем построить доверительный интервал: 24,7 плюс-минус 2,074 умножить на 4,2, деленное на квадратный корень из 23. Упростив это выражение, мы получим доверительный интервал 24,7 плюс-минус 1,8.

Стоит отметить, что критическое t-значение, равное 2,074, немного больше критического z-значения, которое было бы при том же уровне достоверности. Это связано с тем, что мы оцениваем стандартное отклонение генеральной совокупности, внося некоторую дополнительную неопределенность, что приводит к несколько более широкому доверительному интервалу.

Таким образом, при построении доверительных интервалов, не зная стандартного отклонения совокупности, мы используем t-распределение и оцениваем стандартное отклонение совокупности с помощью стандартного отклонения выборки. Остальная часть процесса аналогична построению доверительных интервалов с известным стандартным отклонением, но с критическими t-значениями вместо критических z-показателей.

Confidence Intervals Using the t-Distribution
Confidence Intervals Using the t-Distribution
  • 2020.08.15
  • www.youtube.com
How do we construct confidence intervals when the population standard deviation is unknown? Easy! We use the t-distribution. If this vid helps you, please he...
 

Использование R для расчета в t-распределении


Использование R для расчета в t-распределении

Всем привет, сегодня мы проведем некоторые расчеты, используя t-распределение в R. Мы шаг за шагом решим три задачи. Давайте погрузимся прямо в!

Во-первых, давайте поговорим о том, как мы вычисляем вероятности в t-распределении, используя кумулятивную функцию распределения (CDF). Подставляя конкретное значение t, например 0,44, CDF дает нам вероятность случайного получения t-показателя, меньшего или равного этому значению. Визуально это соответствует графику колоколообразной кривой, поскольку t-распределения имеют колоколообразную форму.

Чтобы найти вероятность, мы помечаем интересующий t-показатель (0,44) и заштриховываем область слева от этого показателя. Эта заштрихованная область представляет вероятность, которую мы ищем. Я настоятельно рекомендую использовать R для расчетов t-распределения вместо того, чтобы полагаться на таблицы, поскольку они могут быть сложными и менее точными. В R команда, соответствующая CDF t-распределения, есть pt, для которой требуются два аргумента: t-значение (0,44) и количество степеней свободы (26).

Переключимся на R и выполним команду pt: pt(0.44, 26). Результат составляет приблизительно 0,668, что указывает на то, что вероятность случайного получения t-показателя меньше или равного 0,44 в этом t-распределении составляет около 66,8%.

Теперь давайте перейдем к проблеме номер два. Мы хотим найти вероятность того, что t находится между -0,8 и 0,5 в t-распределении с 19 степенями свободы. Чтобы решить эту проблему, мы вычисляем площадь слева от t = 0,5 и вычитаем площадь слева от t = -0,8. Мы можем добиться этого, используя две команды pt с вычитанием между ними: pt(0,5, 19) - pt(-0,8, 19). Результат составляет приблизительно 0,472, что указывает на то, что вероятность случайного получения t-показателя между -0,8 и 0,5 в t-распределении с 19 степенями свободы составляет приблизительно 47,2%.

Переходя к третьей проблеме, нам нужно найти значение (тау) в t-распределении с 50 степенями свободы, такое, что вероятность получения t-показателя, меньшего или равного тау, составляет 0,3. Это включает обратный расчет CDF. Мы можем использовать функцию qt в R, обеспечивая вероятность (0,3) и число степеней свободы (50). Выполним команду qt: qt(0.3, 50). Результат приблизительно равен -0,5277. Важно отметить, что получение отрицательного числа является разумным, поскольку центр кривой нормального распределения в любом t-распределении находится в точке t = 0.

Помните, что эти вычисления можно выполнить вручную, но R предоставляет удобные функции (pt и qt), упрощающие процесс. Использование этих функций экономит время и обеспечивает точность.

Using R to Calculate in the t-Distribution
Using R to Calculate in the t-Distribution
  • 2020.08.15
  • www.youtube.com
R is a fantastic way to do computations in the t-distribution. If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more #rsta...
 

Доверительные интервалы в R


Доверительные интервалы в R

Привет всем, сегодня мы будем работать с доверительными интервалами в R, что особенно полезно, когда у нас есть фактический набор данных, а не просто сводная статистика. В этом примере мы рассмотрим набор данных CO2 и сосредоточимся на переменной «поглощение».

Ранее мы вычисляли доверительные интервалы, используя выборочное среднее (x-bar) и выборочное стандартное отклонение (s), но теперь мы изучим более быстрый способ с помощью команды «t.test». Если указать интересующую переменную, в данном случае «поглощение» из набора данных CO2, команда по умолчанию установит уровень достоверности 95%.

Команда t-test предоставляет несколько фрагментов информации, некоторые из которых станут более актуальными, когда мы будем обсуждать проверку гипотез позже. На данный момент ключевыми деталями, которые следует отметить, являются 95% доверительный интервал и точечная оценка. Доверительный интервал представляет собой диапазон значений, в пределах которого мы можем оценить среднее значение генеральной совокупности. Точечная оценка — это выборочное среднее, которое служит оценкой одного значения для среднего значения генеральной совокупности.

Выходные данные t-теста также включают степени свободы, которые на одну меньше размера выборки. Другая информация, такая как p-значения и альтернативные гипотезы, будет обсуждаться в будущих видеороликах о тестировании значимости.

Хотя выходные данные t-теста не дают прямой погрешности, мы можем рассчитать ее вручную. Погрешность для t-доверительного интервала следует формуле: T* * (s / sqrt(n)), где s — стандартное отклонение выборки, n — размер выборки, а T* — критическое значение t для желаемый уровень достоверности.

Чтобы найти T*, мы используем функцию «qt» и указываем площадь слева от T*. Для доверительного интервала 95% нам нужно 97,5% площади слева от T*. Поэтому мы вычисляем T * как «qt (0,975, 83)». Умножение T* на стандартное отклонение выборки и деление его на квадратный корень из размера выборки дает погрешность.

В качестве альтернативы мы можем использовать функцию «t.test» в R для автоматического вычисления доверительного интервала. Чтобы изменить уровень доверия, мы добавляем аргумент "conf.level=" и указываем желаемый процент. Например, установка «conf.level = 90» дает нам доверительный интервал 90%.

Когда мы уменьшаем уровень достоверности, результирующий доверительный интервал становится уже. Верхняя граница интервала уменьшается, что указывает на более высокий уровень точности нашей оценки.

Таким образом, доверительные интервалы обеспечивают диапазон значений, в пределах которого мы оцениваем среднее значение генеральной совокупности. R предоставляет удобные функции, такие как «t.test» и «qt», для упрощения вычислений и получения точных результатов.

Confidence Intervals in R
Confidence Intervals in R
  • 2020.03.27
  • www.youtube.com
Quick t-distribution confidence intervals in R. So easy! If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more #rstats joy...
 

Доверительные интервалы для пропорций


Доверительные интервалы для пропорций

Всем привет, сегодня мы будем строить доверительные интервалы для пропорций. Часто мы сталкиваемся со случайными процессами с двумя возможными исходами, такими как «орел» или «решка», «да» или «нет», «истина» и «ложь». Мы хотим сделать выводы о вероятностях этих исходов на основе выборочных данных.

Чтобы проанализировать эти результаты, мы назначаем один результат как успех и кодируем его как единицу, а другой результат является неудачей и кодируем как ноль. Важно отметить, что термины «успех» и «неудача» являются произвольными и не подразумевают каких-либо оценочных суждений о результатах.

Кодируя переменную таким образом, мы создаем дискретную случайную величину, которую назовем X. X может принимать два значения, единицу и ноль, с вероятностями p и (1 - p) соответственно. Здесь p представляет вероятность успеха.

Для этого типа случайной величины мы можем вычислить сводную информацию. Среднее или ожидаемое значение представляет собой сумму всех возможных значений случайной величины, взвешенных по их соответствующим вероятностям. Для испытания Бернулли среднее значение равно p.

Стандартное отклонение случайной величины представляет собой квадратный корень из суммы квадратов разностей между отдельными значениями и ожидаемым значением, каждое из которых взвешено по их вероятностям. Для испытания Бернулли стандартное отклонение дается квадратным корнем из (p * (1 - p)).

Теперь давайте проведем n идентичных независимых испытаний Бернулли, где p остается постоянным во всех испытаниях. Доля успехов в этих испытаниях обозначается как p-hat, что равно (1/n) * sum(xi), где xi равно единице в случае успеха и нулю в случае неудачи. Другими словами, p-hat — это доля успехов в n испытаниях.

Поскольку p-hat — это всего лишь выборочное среднее, мы можем применить к нему наши знания о выборочных средствах. Среднее значение p-hat равно p, как и среднее значение для отдельного испытания Бернулли. Стандартное отклонение p-hat равно квадратному корню из ((p * (1 - p)) / n, что является стандартным отклонением одного испытания Бернулли, деленным на квадратный корень из n. Согласно центральной предельной теореме, выборочное распределение p-hat является приблизительно нормальным, когда n велико, обычно 30 или более.

Теперь давайте обсудим доверительные интервалы. В случае среднего значения основная структура доверительного интервала такова: mu = x-bar +/- z-star * sigma-sub-x-bar. Точно так же для пропорции формула доверительного интервала такова: p = p-hat +/- z-star * sqrt((p-hat * (1 - p-hat)) / n).

В формуле пропорции p-hat представляет собой экспериментальную долю успехов в нашей выборке, а p — это общая вероятность успеха, которую мы пытаемся оценить. Погрешность уменьшается, когда p-hat близок к нулю или единице, поэтому в таких случаях не рекомендуется использовать этот доверительный интервал.

Чтобы определить требуемый размер выборки для данной погрешности (e), мы используем формулу n = (p-шляпа * (1 - p-шляпа) * z-звезда ^ 2) / эпсилон ^ 2. Если у нас нет предварительных данных, мы можем использовать самую консервативную оценку p-hat = 0,5, которая дает максимально возможный размер выборки. В этом случае формула становится n = (z-звезда ^ 2) / (4 * эпсилон ^ 2).

Рассмотрим пример. Допустим, мы хотим провести опрос с достоверностью 95%, а погрешность должна быть не больше 3%. Поскольку у нас нет предварительных данных, мы будем использовать консервативную оценку p-hat = 0,5. Подставляя значения z-star = 1,96 и epsilon = 0,03 в формулу, мы получаем:

n = (1,96 ^ 2) / (4 * 0,03 ^ 2) ≈ 1067,1

Поскольку размер выборки должен быть целым числом, мы округляем значение, чтобы погрешность не превышала 3%. Таким образом, для этого опроса нам потребуется размер выборки 1068 человек.

Таким образом, построение доверительных интервалов для пропорций включает в себя присвоение значений успеха и неудачи, вычисление выборочных средних значений и стандартных отклонений, а также использование соответствующих формул для определения доверительных интервалов. Важно учитывать условия использования этих интервалов и корректировать размер выборки на основе желаемой погрешности.

Confidence Intervals for Proportions
Confidence Intervals for Proportions
  • 2020.10.11
  • www.youtube.com
How can we estimate a population proportion using only a sample proportion? Using a confidence interval, of course! If this vid helps you, please help me a t...
 

Доверительные интервалы для пропорций: примеры


Доверительные интервалы для пропорций: примеры

Сегодня мы будем работать над двумя примерами задач, связанных с построением доверительных интервалов для пропорций. Давайте углубимся в проблемы:

Проблема 1. Опрос 275 случайно выбранных взрослых американцев показал, что 29 из них пьют кофе. Нам нужно построить 90-процентный доверительный интервал для доли всех взрослых американцев, пьющих кофе.

Используя формулу доверительного интервала для пропорций: p = p̂ ± z √(p̂(1 - p̂)/n), где p̂ — доля выборки, n — размер выборки, а z — критическое значение z, соответствующее желаемый уровень достоверности.

Учитывая p̂ = 29/275 = 0,1055, n = 275 и z * = 1,645 (для уровня достоверности 90%), мы можем подставить эти значения:

р = 0,1055 ± 1,645 * √ ((0,1055 * (1 - 0,1055))/275)

Вычисляя это выражение, мы получаем, что доверительный интервал для доли взрослых американцев, пьющих кофе, составляет примерно 0,1055 ± 0,045. Таким образом, мы можем с уверенностью 90% оценить, что истинная пропорция попадает в интервал (0,0605, 0,1505).

Проблема 2. Исследователь хочет изучить чаепитие в Америке и должен определить размер выборки, необходимый для гарантии погрешности не более 4%.

Используя формулу для погрешности в доверительном интервале для пропорций: e = z*√(p̂(1 - p̂)/n), мы можем преобразовать ее, чтобы найти размер выборки:

n = (z*^2 * p̂(1 - p̂)) / e^2.

В этом случае у нас нет предварительных данных, поэтому мы используем самую консервативную оценку p̂, которая равна 0,5 (что указывает на максимальную изменчивость). Учитывая z * = 1,645 (для уровня достоверности 90%) и e = 0,04, мы можем подставить эти значения в формулу:

п = (1,645 ^ 2 * 0,5 (1 - 0,5)) / 0,04 ^ 2

Упрощая выражение, получаем, что минимально необходимый размер выборки составляет примерно 257,03. Поскольку размер выборки должен быть целым числом, мы округляем его в большую сторону, чтобы не превысить желаемую погрешность. Таким образом, требуется размер выборки 258, чтобы гарантировать погрешность не более 4%.

Таким образом, построение доверительных интервалов для пропорций включает использование формул, включающих пропорции выборки, размеры выборки и критические значения. Применяя эти формулы, мы можем оценить доли населения с заданным уровнем достоверности и определить размер выборки, необходимый для достижения желаемой погрешности.

Confidence Intervals for Proportions: Examples
Confidence Intervals for Proportions: Examples
  • 2020.10.12
  • www.youtube.com
Constructing a confidence interval for a population proportion using sample data, and planning the sample size of a study. Awesome! If this vid helps you, pl...
 

Введение в проверку гипотез


Введение в проверку гипотез

Всем привет, на сегодняшнем занятии мы погрузимся в проверку гипотез, также известную как проверка значимости. Чтобы лучше понять концепцию, мы вместе рассмотрим пример. Давай начнем.

Предположим, производитель шоколада утверждает, что его плитки шоколада в среднем весят 350 граммов. Однако я подозреваю, что их претензии завышены, а реальный средний вес их шоколадных батончиков составляет менее 350 граммов. Чтобы исследовать это, я беру образец из 10 плиток шоколада и записываю их вес. Если средний вес образца ниже 350 граммов, это будет служить доказательством против претензии компании. Если он равен или превышает 350 граммов, это не будет оспаривать их утверждение.

Предположим, что мой образец имеет средний вес 347 граммов, что меньше 350 граммов. Следовательно, этот результат подтверждает мои подозрения и оспаривает заявление компании. Однако компания может возразить, что мой образец мог быть случайно легким, и если бы я взял другой образец, он мог бы дать ровно 350 граммов или даже больше из-за случайного совпадения. Поэтому мне нужен метод, чтобы сделать выбор между этими двумя вариантами: ложь компании или случайность результата.

В такой ситуации лучшее, что мы можем сделать, — это сделать вероятностное заявление относительно заявления компании. Мы хотим определить вероятность того, что, если компания говорит правду, мы получим выборочное среднее столь же низкое, как то, которое мы наблюдали чисто случайно. Более низкая вероятность указывает на более сильные доказательства против заявления компании.

Чтобы продолжить математически, давайте предположим нулевую гипотезу, обозначенную как H0, которая согласуется с заявлением компании. В этом случае нулевая гипотеза утверждает, что среднее значение совокупности всех плиток шоколада составляет ровно 350 граммов. С другой стороны, у нас есть альтернативная гипотеза, обозначенная как Ха, которая представляет собой то, что мы стремимся установить. В этом случае Ха утверждает, что средний вес всех плиток шоколада составляет менее 350 граммов (Ха: μ < 350).

Важно отметить, что и H0, и Ha относятся к параметрам совокупности, а не к выборочному среднему (x-столбец). Мы еще не упомянули x-bar, потому что будем использовать его для принятия решения между H0 и Ha.

Чтобы рассчитать вероятность, нам нужно рассмотреть выборочное распределение x-bar. Мы предполагаем, что нулевая гипотеза верна, и предполагаем получить несколько выборок размером 10. Как выглядит распределение x-bar? В то время как отдельные плитки шоколада могут различаться по весу, средний вес (х-батончик) в среднем будет соответствовать среднему значению генеральной совокупности (μ).

Центральная предельная теорема также помогает нам понять распределение выборки. Для достаточно большого размера выборки (часто n > 30) выборочное распределение столбцов x приближается к нормальному распределению со средним значением μ и стандартным отклонением σ/√n. Если само распределение населения является нормальным, приближение является точным, и распределение x-bar является точно нормальным.

Представьте себе синюю кривую, представляющую отдельные плитки шоколада, средний вес которых составляет 350 граммов при нулевой гипотезе. Некоторые полосы могут быть немного тяжелее или легче, а некоторые могут значительно отклоняться. Теперь визуализируйте зеленую кривую, которая представляет выборочное распределение x-bar. В среднем x-bar будет равен 350 граммам, если нулевая гипотеза верна, с некоторыми небольшими отклонениями. Однако изменчивость в столбце x будет меньше по сравнению с отдельными столбцами, потому что экстремальные веса, как правило, уравновешивают друг друга в выборке.

Предположим, мы знаем стандартное отклонение плитки шоколада, которое составляет 4 грамма. Хотя это может быть не то значение, которое мы обычно знаем, мы обратимся к этому в будущих видеороликах. С нулевой гипотезой μ = 350 граммов и центральной предельной теоремой у нас есть вся необходимая информация о выборочном распределении x-bar. Оно будет следовать нормальному распределению со средним значением 350 грамм и стандартным отклонением 4 грамма, деленным на квадратный корень из 10 (поскольку размер выборки равен 10), что составляет примерно 1,26 грамма.

Чтобы вычислить вероятность получения среднего значения выборки (полоса x), меньшего или равного 347 граммам, чисто случайным образом, мы можем вычислить z-показатель. Вероятность того, что столбец x меньше или равен 347 граммам, равна вероятности того, что соответствующий показатель z меньше или равен (347 - 350)/1,26, что упрощается до -2,37.

Используя статистическое программное обеспечение или таблицу, мы находим, что вероятность того, что стандартное нормальное распределение меньше или равно -2,37, составляет примерно 0,0089. Эта вероятность называется p-значением.

Теперь давайте обсудим интерпретацию p-значения. В этом случае p-значение 0,0089 относительно невелико. Значение p представляет вероятность получения выборочного среднего значения 347 граммов или меньше, если нулевая гипотеза (μ = 350 граммов) верна. Небольшое значение p предполагает, что маловероятно наблюдать такое низкое среднее значение выборки, если нулевая гипотеза верна.

Есть две возможности для рассмотрения: во-первых, возможно, что нулевая гипотеза верна, и мы случайно наблюдали редкое событие (среднее значение выборки 347 граммов или меньше), которое происходит примерно в 0,0089 раза. Во-вторых, возможно, что нулевая гипотеза ложна (как мы изначально подозревали), а альтернативная гипотеза (μ < 350 грамм) верна.

Поскольку p-значение 0,0089 довольно низкое, первая возможность кажется маловероятной. Поэтому мы отвергаем нулевую гипотезу (H0: μ = 350 грамм) и поддерживаем альтернативную гипотезу (Ha: μ < 350 грамм). Это приводит нас к заключению, что существуют убедительные доказательства того, что средний вес шоколадных батончиков, произведенных этой компанией, для населения действительно меньше 350 граммов.

В заключение мы рассмотрели основные этапы проведения проверки гипотез. Однако есть дополнительные вопросы, которые мы еще не рассмотрели, такие как определение порога для достаточно малого p-значения, рассмотрение альтернативных гипотез и работа с ситуациями, когда параметры популяции неизвестны. В будущих видеороликах мы рассмотрим эти вопросы и предоставим дополнительную информацию о проверке гипотез.

Introduction to Hypothesis Testing
Introduction to Hypothesis Testing
  • 2020.10.29
  • www.youtube.com
Let's talk about hypothesis testing (also known as significance testing). How can we test a claim about a population using just sample data? What is a p-valu...
 

Статистическая значимость


Статистическая значимость

Всем добрый день! Сегодня мы углубимся в концепцию проверки гипотез и обсудим идею статистической значимости. Тесты гипотез бывают разных форм, наиболее распространенными из которых являются z-тест и t-тест для средних значений населения. Тем не менее, основная логика остается прежней.

Сначала предположим, что нулевая гипотеза верна. Затем мы собираем выборку данных и вычисляем вероятность получения аналогичной выборки чисто случайно, предполагая, что нулевая гипотеза верна. Эта вероятность известна как p-значение теста. Более низкое значение p указывает на более сильные доказательства против нулевой гипотезы.

Однако в большинстве случаев простого сравнения p-значений может быть недостаточно для принятия окончательного решения. Таким образом, часто бывает полезно установить заранее определенное пороговое значение p, известное как уровень значимости альфа, до проведения проверки гипотезы. Обычно альфа устанавливается на 0,05, хотя может варьироваться.

Когда мы отвергаем нулевую гипотезу на основании p-значения, меньшего, чем альфа, мы считаем результаты статистически значимыми. Другими словами, данные подтверждают альтернативную гипотезу. Теперь давайте рассмотрим пару примеров, иллюстрирующих эти концепции.

Пример 1. Производитель шоколада утверждает, что средний вес его шоколадных батончиков составляет 350 граммов. Однако мы подозреваем, что истинный средний вес ниже. Мы проводим тест значимости, формулируя нулевую гипотезу о том, что заявление компании верно, и альтернативную гипотезу о том, что средний вес составляет менее 350 граммов. Мы заранее решили использовать уровень значимости альфа, равный 0,05.

После сбора выборки размером 10 и расчета среднего значения выборки в 347 граммов мы определяем вероятность получения столь экстремальных результатов, предполагая, что нулевая гипотеза верна. Это приводит к p-значению 0,0089. Поскольку это p-значение меньше 0,05, мы отклоняем нулевую гипотезу и делаем вывод, что средний вес шоколадных батончиков компании действительно меньше 350 граммов.

Пример 2. Медицинские исследователи проводят исследование для проверки эффективности нового лекарства для похудения. Они выбирают уровень значимости альфа равным 0,01. Нулевая гипотеза утверждает, что средняя потеря веса по сравнению с плацебо равна нулю, в то время как альтернативная гипотеза предполагает положительную среднюю потерю веса. После анализа данных они получают p-значение 0,045. Поскольку p-значение превышает выбранный уровень значимости 0,01, они не могут отвергнуть нулевую гипотезу. Таким образом, недостаточно доказательств, чтобы заключить, что лечение в среднем превосходит плацебо.

Важно отметить, что вывод мог бы быть другим, если бы вместо этого они выбрали уровень значимости альфа, равный 0,05. Это подчеркивает потенциальную ловушку тестирования значимости и использования альфа-порогов. Слепо полагаться на проверку гипотез при принятии решений может быть рискованно. Всегда сообщайте p-значение вместе с любым решением, принятым на основе альфа-уровня значимости. Кроме того, будьте осторожны при интерпретации p-значений и учитывайте различные факторы, о чем я расскажу в следующем видео.

Statistical Significance
Statistical Significance
  • 2020.10.30
  • www.youtube.com
Let's talk about statistical significance! What's up with alpha anyway?? If this vid helps you, please help me a tiny bit by mashing that 'like' button. For ...