Практические задания, тест и пошаговый урок по теме Доверительные интервалы и проверка гипотез - улучшайте математические навыки с помощью точных вопросов и понятных объяснений.
Тренировочный тест по доверительным интервалам и проверке гипотез с пошаговым интерактивным уроком
Используйте тест в верхней части страницы, чтобы отрабатывать доверительные интервалы и проверку гипотез с важнейшими статистическими инструментами: уровень доверия \((1-\alpha)\), критические значения (квантили \(z^\*\), \(t^\*\) и \(\chi^2\)) и погрешность \(\text{погрешность}=z^\*\cdot\text{стандартная ошибка}\); стандартную ошибку и то, как размер выборки меняет ширину интервала; z-доверительные интервалы и t-доверительные интервалы для среднего \(\mu\) (включая методы парного t); доверительные интервалы для доли \(\hat p\) и для дисперсии \(\sigma^2\) с использованием распределения хи-квадрат; а также полный процесс проверки гипотез: нулевая и альтернативная гипотезы, статистики критерия (z, t и \(\chi^2\)), p-значения, уровень значимости \(\alpha\) и принятие решений, связывающее тесты с доверительными интервалами. Вы также укрепите ключевые идеи: ошибка I рода и ошибка II рода, статистическая мощность, а также когда применять хи-квадрат критерий согласия и хи-квадрат критерий независимости. Если хотите освежить материал, нажмите Начать урок, чтобы открыть пошаговое руководство с разобранными примерами и быстрыми проверками.
Как устроена тренировка по доверительным интервалам и проверке гипотез
1. Пройдите тест: ответьте на вопросы по доверительным интервалам и проверке гипотез в верхней части страницы.
2. Откройте урок (необязательно): повторите формулы доверительных интервалов, критические значения, погрешность и шаги проверки гипотез на понятных примерах.
3. Повторите: вернитесь к тесту и сразу примените правила доверительных интервалов и проверки гипотез.
Что вы изучите в уроке по доверительным интервалам и проверке гипотез
Основы доверительных интервалов
Общая структура доверительного интервала: оценка \(\pm\) (критическое значение)\(\times\)(стандартная ошибка)
Погрешность и стандартная ошибка: как изменчивость и \(n\) управляют точностью
Ширина доверительного интервала: как уровень доверия и размер выборки влияют на ширину интервала
Доверительные интервалы для средних
z-интервал для среднего (известна \(\sigma\)): \(\bar x \pm z_{1-\alpha/2}\dfrac{\sigma}{\sqrt{n}}\)
t-интервал для среднего (неизвестна \(\sigma\)): \(\bar x \pm t_{1-\alpha/2,\;n-1}\dfrac{s}{\sqrt{n}}\)
Парные t доверительные интервалы с использованием разностей \(d_i\) и \(df=n-1\)
Доли и интервалы для дисперсии
Доверительный интервал для доли: \(\hat p \pm z_{1-\alpha/2}\sqrt{\hat p(1-\hat p)/n}\) (условия большой выборки)
Доверительный интервал для дисперсии через хи-квадрат: использует квантили \(\chi^2_{n-1}\) (предположение нормальной совокупности)
Чтение результатов доверительных интервалов и правильная интерпретация параметров \(\mu\), \(p\) и \(\sigma^2\)
Распространенные критерии: одновыборочный z-критерий, одновыборочный/парный t-критерий, хи-квадрат критерии согласия и независимости
Ошибки и мощность: ошибка I рода, ошибка II рода и как увеличение \(n\) повышает мощность
Назад к тесту
Когда будете готовы, вернитесь к тесту в верхней части страницы и продолжайте отрабатывать доверительные интервалы и проверку гипотез.
⭐⭐⭐⭐⭐
🎯
Доверительные интервалы
Руководство по проверке гипотез
Нажмите, чтобы открыть ->
Загрузка...
Урок по доверительным интервалам и проверке гипотез
1 / 8
Обзор урока
Доверительные интервалы и проверка гипотез
Цель: Сформировать ясное понимание доверительных интервалов и проверки гипотез, чтобы вы могли выбирать правильный метод, корректно вычислять результаты и ответственно интерпретировать выводы. Вы будете отрабатывать “основной цикл” статистического вывода: выбрать параметр (например \(\mu\), \(p\) или \(\sigma^2\)), вычислить оценку и стандартную ошибку, использовать критическое значение для построения доверительного интервала, а также использовать статистику критерия и p-значение для проверки гипотезы на уровне значимости \(\alpha\).
Критерии успеха
Интерпретировать \(100(1-\alpha)\%\) доверительный интервал как долгосрочную долю покрытия (а не как вероятность о \(\mu\) после наблюдения данных).
Использовать общую форму доверительного интервала: оценка \(\pm\) критическое значение \(\times\) стандартная ошибка.
Выбирать z или t для среднего и определять степени свободы для t-интервалов/критериев.
Строить доверительный интервал для доли с \(\hat p\) и \(\sqrt{\hat p(1-\hat p)/n}\).
Строить доверительный интервал для дисперсии \(\sigma^2\) с использованием распределения хи-квадрат (предположение нормальной совокупности).
Проводить проверку гипотезы: записывать \(H_0\) и \(H_1\), вычислять статистику критерия (z, t или \(\chi^2\)), находить p-значение и принимать решение на уровне \(\alpha\).
Использовать ключевую связь: для двустороннего критерия на уровне \(\alpha\), отвергать \(H_0\!:\theta=\theta_0\), если \(\theta_0\) находится вне \(100(1-\alpha)\%\) доверительного интервала.
Объяснять ошибку I рода, ошибку II рода и влияние увеличения размера выборки на мощность.
Ключевые термины
Параметр: неизвестное значение совокупности (например \(\mu\), \(p\) или \(\sigma^2\)).
Статистика / оценка: число, вычисленное по данным (например \(\bar x\), \(\hat p\), \(s^2\)).
Стандартная ошибка: стандартное отклонение оценивателя (часто оценивается по данным).
Критическое значение: квантиль, например \(z_{1-\alpha/2}\) или \(t_{1-\alpha/2,\;df}\).
Нулевая / альтернативная гипотезы: утверждения \(H_0\) и \(H_1\) о параметре.
p-значение: вероятность (при \(H_0\)) результата не менее экстремального, чем наблюдаемый.
Ошибка I рода: отвергнуть истинную \(H_0\) (вероятность \(\alpha\)).
Ошибка II рода: не отвергнуть ложную \(H_0\) (вероятность \(\beta\)); мощность равна \(1-\beta\).
Быстрая предварительная проверка
Проверка 1: Какое утверждение лучше всего описывает смысл 95% доверительного интервала для среднего совокупности \(\mu\)?
Подсказка: случайность находится в интервале (потому что он строится по случайным выборкам), а не в \(\mu\).
Проверка 2: Что описывает ошибку I рода?
Подсказка: ошибка I рода - это “ложноположительный” результат: вы отвергаете истинную нулевую гипотезу.
Основы доверительных интервалов
Доверительные интервалы, критические значения, стандартная ошибка и погрешность
Цель обучения: Строить любой распространенный доверительный интервал по одной структуре и правильно его интерпретировать.
Ключевая идея
Большинство доверительных интервалов следуют одному шаблону: \[\text{доверительный интервал} = \text{оценка} \pm (\text{критическое значение})\times(\text{стандартная ошибка}).\] Погрешность равна: \[\text{погрешность}=(\text{критическое значение})\times \text{стандартная ошибка}.\] Более высокий уровень доверия (например, 99% вместо 95%) использует большее критическое значение, поэтому интервал становится шире. Больший размер выборки обычно уменьшает стандартную ошибку (часто пропорционально \(1/\sqrt{n}\)), поэтому интервал становится уже.
Критические значения, которые часто встречаются
z-критическое значение: \(z_{1-\alpha/2}\) для двусторонних доверительных интервалов, когда выборочное распределение (приближенно) нормально.
t-критическое значение: \(t_{1-\alpha/2,\;df}\) для средних, когда \(\sigma\) неизвестна (часто на практике).
Односторонние границы: для нижней границы с доверием \(1-\alpha\) критическое значение равно \(z_{1-\alpha}\) (или \(t_{1-\alpha,\;df}\)).
Разобранный пример
Пример: В выборке \(\bar x=72\), известна \(\sigma=12\), и \(n=36\). Найдите 95% доверительный интервал для \(\mu\).
Для 95% используйте \(z_{0.975}\approx 1.96\). Стандартная ошибка равна \(\sigma/\sqrt{n}=12/\sqrt{36}=12/6=2\). Значит, погрешность: \[\text{погрешность}=1.96(2)=3.92.\] Доверительный интервал равен: \[72\pm 3.92 \Rightarrow (68.08,\;75.92).\]
Попробуйте
Попробуйте 1: Приблизительно найдите погрешность, если \(z^\*=1.96\) и стандартная ошибка равна \(0.5\).
Что меняет ширину доверительного интервала? (и как планировать \(n\))
Цель обучения: Предсказывать, как уровень доверия и размер выборки влияют на ширину доверительного интервала, и находить требуемый размер выборки.
Ключевая идея
Шириной доверительного интервала управляют две части:
Критическое значение: больший уровень доверия \(\Rightarrow\) большее критическое значение \(\Rightarrow\) более широкий интервал.
Стандартная ошибка: большее \(n\Rightarrow\) меньшая стандартная ошибка \(\Rightarrow\) более узкий интервал. Для многих оценивателей стандартная ошибка часто пропорциональна \(1/\sqrt{n}\).
Распространенная формула планирования получается из \(\text{погрешность}=z^\*\sigma/\sqrt{n}\) (среднее при известной \(\sigma\)): \[n=\left(\frac{z^\*\sigma}{\text{погрешность}}\right)^2.\] Это “правило квадрата” объясняет, почему уменьшение погрешности может требовать гораздо больших выборок.
Разобранный пример: размер выборки для целевой погрешности
Пример: Вам нужен 95% доверительный интервал для \(\mu\) при известной \(\sigma=10\) и погрешности не более \(2\). Какой размер выборки \(n\) нужен?
Попробуйте 1: Как влияет увеличение уровня доверия с 95% до 99% на ширину доверительного интервала (при прочих равных)?
Подсказка: более высокое доверие использует большее критическое значение (например, 2.576 вместо 1.96 для z).
Попробуйте 2: Чтобы удвоить ширину доверительного интервала (при фиксированных уровне доверия и \(\sigma\)), во сколько раз должен измениться \(n\)?
Подсказка: ширина пропорциональна \(1/\sqrt{n}\). Чтобы удвоить ширину, \(\sqrt{n}\) нужно уменьшить вдвое.
Итог
Большее доверие \(\Rightarrow\) более широкий доверительный интервал (большее критическое значение).
Больший размер выборки \(\Rightarrow\) более узкий доверительный интервал (меньшая стандартная ошибка, часто \(1/\sqrt{n}\)).
Во многих задачах планирование \(n\) получается из \(n=\left(\frac{\text{критическое значение}\times \sigma}{\text{погрешность}}\right)^2\).
Доверительный интервал для среднего и парный t
Доверительные интервалы для среднего: z против t и идеи парного t
Цель обучения: Выбирать правильное распределение и вычислять доверительные интервалы для \(\mu\), включая парные планы.
Ключевая идея
Для среднего совокупности \(\mu\) доверительный интервал зависит от того, известна ли \(\sigma\):
Известна \(\sigma\) (z-интервал): \[\bar x \pm z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}.\]
Неизвестна \(\sigma\) (t-интервал): \[\bar x \pm t_{1-\alpha/2,\;n-1}\frac{s}{\sqrt{n}}.\] Здесь \(df=n-1\). При росте \(df\) t-распределение приближается к стандартному нормальному.
Парные t-интервалы рассматривают каждую пару как одно наблюдение через разности \(d_i\) (например, “после − до”). Вычислите \(\bar d\) и \(s_d\), затем используйте: \[\bar d \pm t_{1-\alpha/2,\;n-1}\frac{s_d}{\sqrt{n}},\] где \(n\) - число пар.
Разобранный пример (t-интервал)
Пример: В выборке \(\bar x=15\), \(s=4\), \(n=16\). Запишите 95% t-интервал для \(\mu\).
Степени свободы: \(df=16-1=15\). Интервал: \[15 \pm t_{0.975,\;15}\frac{4}{\sqrt{16}} = 15 \pm t_{0.975,\;15}(1).\] Численно \(t_{0.975,\;15}\approx 2.13\), поэтому доверительный интервал примерно \(15\pm 2.13\).
Попробуйте
Попробуйте 1: Какая формула дает статистику критерия \(z\) для проверки среднего, когда \(\sigma\) известна?
Подсказка: известная \(\sigma\) использует \(\sigma/\sqrt{n}\) в знаменателе.
Попробуйте 2: Для парного t-критерия с \(n\) парами степени свободы равны:
Подсказка: парный t использует разности \(d_i\) как одну выборку размера \(n\).
Итог
Известна \(\sigma\): z-интервал и z-критерий используют \(\sigma/\sqrt{n}\).
Неизвестна \(\sigma\): t-интервал и t-критерий используют \(s/\sqrt{n}\) с \(df=n-1\).
Парный t работает с разностями \(d_i\) и использует \(df=n-1\).
Доверительные интервалы для доли и дисперсии
Доверительные интервалы для доли \(\,p\) и дисперсии \(\,\sigma^2\)
Цель обучения: Строить доверительные интервалы для долей и дисперсий и знать, какое распределение дает критические значения.
Доверительный интервал для доли (большая выборка)
Для одновыборочной доли пусть \(\hat p=\dfrac{x}{n}\), где \(x\) - число успехов. Когда условия нормального приближения выполняются (частое правило: \(n\hat p\ge 10\) и \(n(1-\hat p)\ge 10\)), приближенный \(100(1-\alpha)\%\) доверительный интервал равен: \[\hat p \pm z_{1-\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}.\]
Доверительный интервал для дисперсии (хи-квадрат)
Если совокупность нормально распределена, то \[\frac{(n-1)s^2}{\sigma^2}\sim \chi^2_{n-1}.\] \(100(1-\alpha)\%\) доверительный интервал для \(\sigma^2\) равен: \[\left(\frac{(n-1)s^2}{\chi^2_{1-\alpha/2,\;n-1}},\;\frac{(n-1)s^2}{\chi^2_{\alpha/2,\;n-1}}\right).\]
Разобранный пример (постановка Доверительный интервал для доли)
Пример: В выборке из \(n=120\) людей \(x=84\) предпочитают бренд A. Найдите \(\hat p\) и запишите постановку 95% доверительный интервал для \(p\).
Попробуйте 1: Для одновыборочного Доверительный интервал для доли при большом \(n\), приближенный доверительный интервал равен \(\hat p \pm z_{1-\alpha/2}\sqrt{\hat p(1-\hat p)/n}\). Что означает \(\hat p\)?
Подсказка: \(\hat p\) вычисляется непосредственно по выборке как точечная оценка для \(p\).
Попробуйте 2: 95% доверительный интервал для дисперсии \(\sigma^2\) использует квантили какого распределения?
Подсказка: \(\frac{(n-1)s^2}{\sigma^2}\) имеет распределение \(\chi^2\), когда совокупность нормальна.
Итог
Доверительный интервал для доли использует \(\hat p=x/n\) и z-критическое значение (условия большой выборки).
Доверительный интервал для дисперсии использует квантили хи-квадрат и предполагает нормальную совокупность.
Основы проверки гипотез
Проверка гипотез: \(H_0\), \(H_1\), статистика критерия, p-значение и связь с доверительными интервалами
Цель обучения: Проводить корректную проверку гипотез и связывать ее с доверительными интервалами.
Стандартный процесс проверки
1. Сформулируйте гипотезы: \(H_0:\theta=\theta_0\) против H_1:\theta≠\theta_0 (двусторонняя) или \(H_1:\theta>\theta_0\), \(H_1:\theta<\theta_0\) (односторонние).
2. Выберите уровень значимости: \(\alpha\) (частые значения: 0.10, 0.05, 0.01).
3. Вычислите статистику критерия: z, t или \(\chi^2\) в зависимости от ситуации.
4. Вычислите p-значение и примите решение: отвергнуть \(H_0\), если p-значение \(\le \alpha\); иначе не отвергать.
Связь с доверительными интервалами
Для двустороннего критерия на уровне \(\alpha\) есть тесная связь: отвергнуть \(H_0:\theta=\theta_0\) тогда и только тогда, когда \(\theta_0\) находится вне \(100(1-\alpha)\%\) доверительного интервала для \(\theta\).
Односторонние критические значения
95% нижняя доверительная граница соответствует одностороннему \(\alpha=0.05\) и использует критическое значение \(z_{0.95}\approx 1.645\) (или \(t_{0.95,df}\)). Распространенная форма нижней границы для среднего при известной \(\sigma\): \[L=\bar x - z_{0.95}\frac{\sigma}{\sqrt{n}}.\]
Разобранный пример (постановка z-критерия)
Пример: Проверьте \(H_0:\mu=50\) против H_1:\mu≠ 50 при \(\bar x=52\), известной \(\sigma=10\), \(n=25\).
Статистика критерия: \[z=\frac{\bar x-\mu_0}{\sigma/\sqrt{n}}=\frac{52-50}{10/5}=\frac{2}{2}=1.\] Двустороннее p-значение равно \(2(1-\Phi(1))\approx 0.317\), поэтому при \(\alpha=0.05\) мы не отвергаем \(H_0\).
Попробуйте
Попробуйте 1: Если 95% доверительный интервал для \(\mu\) не содержит \(\mu_0\), какой вывод проверки гипотез при \(\alpha=0.05\) (двусторонняя)?
Подсказка: двусторонний критерий на уровне \(\alpha\) соответствует \(100(1-\alpha)\%\) доверительному интервалу.
Попробуйте 2: Какое одностороннее критическое \(z\)-значение для 95% нижней доверительной границы?
Подсказка: для односторонней 95% границы используйте \(z_{1-\alpha}=z_{0.95}\).
Итог
Отвергайте \(H_0\), если p-значение \(\le \alpha\); иначе не отвергайте.
Двусторонний критерий на \(\alpha\) соответствует \(100(1-\alpha)\%\) доверительному интервалу: \(\theta_0\) вне интервала \(\Rightarrow\) отвергнуть \(H_0\).
Одностороннее 95% критическое z значение равно \(z_{0.95}\approx 1.645\).
Распространенные критерии
Какой критерий использовать? (z, t и хи-квадрат)
Цель обучения: Сопоставлять реальную задачу с правильным критерием и знать основные формулы статистик.
Быстрый справочник “какой критерий?”
Среднее против известного значения, \(\sigma\) известна:одновыборочный z-критерий.
Среднее против известного значения, \(\sigma\) неизвестна:одновыборочный t-критерий с \(df=n-1\).
Парные измерения:парный t-критерий по разностям \(d_i\).
Доля против известного значения:одновыборочный z-критерий для доли (условия большой выборки).
Дисперсия против известного значения:хи-квадрат критерий для одной дисперсии (предположение нормальной совокупности).
Категориальные частоты:хи-квадрат критерий согласия или хи-квадрат критерий независимости.
Статистика критерия для одной дисперсии
Чтобы проверить \(H_0:\sigma^2=\sigma_0^2\) для нормально распределенной совокупности: \[\chi^2=\frac{(n-1)s^2}{\sigma_0^2}\sim \chi^2_{n-1}\quad \text{при } H_0.\]
Разобранный пример (только статистика критерия)
Пример: В выборке \(n=21\) и \(s^2=16\). При \(H_0:\sigma^2=9\), чему равна статистика хи-квадрат?
Попробуйте 1: Какой критерий сравнивает среднее одной группы с известным значением, когда \(\sigma\) известна?
Подсказка: известная \(\sigma\) \(\Rightarrow\) используйте z-методы для среднего.
Попробуйте 2: Статистика критерия для одновыборочной проверки дисперсии \(H_0:\sigma^2=\sigma_0^2\):
Подсказка: выводы об одной дисперсии используют \(\chi^2\) с \(df=n-1\) при нормальной модели совокупности.
Итог
Известна \(\sigma\): одновыборочный z-критерий для \(\mu\).
Неизвестна \(\sigma\): одновыборочный t-критерий для \(\mu\) (и парный t для разностей).
Критерии и Доверительный интервал для дисперсии используют распределение хи-квадрат при нормальности.
Категориальные частоты часто используют критерии хи-квадрат (согласие или независимость).
Мощность и общая картина
Ошибки I и II рода, мощность и почему важен размер выборки
Цель обучения: Понимать компромиссы ошибок и влияние размера выборки на доверительные интервалы и проверки гипотез, а затем завершить финальной проверкой.
Ошибки и мощность в одной картине
Ошибка I рода (ложноположительная): отвергнуть истинную \(H_0\). Вероятность \(=\alpha\).
Ошибка II рода (ложноотрицательная): не отвергнуть ложную \(H_0\). Вероятность \(=\beta\).
Мощность: \(1-\beta\). Это шанс правильно обнаружить реальный эффект.
Проверки гипотез: большее \(n\Rightarrow\) меньшая стандартная ошибка \(\Rightarrow\) больший модуль статистики критерия (для фиксированного эффекта) и поэтому более высокая мощность.
Дополнение: хи-квадрат критерии и кривые выживания
В категориальных данных вы часто увидите хи-квадрат критерий согласия и хи-квадрат критерий независимости. В анализе выживаемости распространенный критерий для сравнения кривых выживания между двумя группами - лог-ранговый критерий, который обычно представляют через опорное распределение хи-квадрат.
Попробуйте
Попробуйте 1: Увеличение размера выборки в проверке гипотез в первую очередь увеличивает что из следующего?
Доверительный интервал для среднего: z-интервал использует \(\sigma\); t-интервал использует \(s\) с \(df=n-1\).
Доверительный интервал для доли: \(\hat p \pm z_{1-\alpha/2}\sqrt{\hat p(1-\hat p)/n}\) при условиях большой выборки.
Доверительный интервал для дисперсии: квантили хи-квадрат, \(\left(\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}},\frac{(n-1)s^2}{\chi^2_{\alpha/2}}\right)\) при нормальности.
Проверка: задайте \(H_0\) и \(H_1\), выберите \(\alpha\), вычислите статистику критерия и p-значение, затем примите решение.
Мощность: увеличение \(n\) обычно повышает мощность за счет уменьшения стандартной ошибки.
Следующий шаг: Закройте урок и попробуйте тест снова. Если ошибетесь в вопросе, откройте книгу и повторите страницу с нужным навыком по доверительным интервалам или проверке гипотез.