Лекция 3: проверка статистических гипотез

Report
Занятие 3. Проверка статистических гипотез
1.
2.
3.
4.
Одновыборочный критерий Стьюдента (t-критерий)
Двухвыборочный критерий Стьюдента (t-критерий)
Распределение хи-квадрат и критерий Пирсона
Распределение Фишера и критерий Фишера (F-test)
Нормальное
распределение
Ц.П.Т.
t-распределение
(распределение
Стьюдента)
Одновыборочный
t-критерий
и
Двухвыборочный
t-критерий
1 и 2
Доверительный
интервал
 ± Δ
Распределение χ2
Критерий
Пирсона
(χ2-тест)
Распределение
Фишера
Критерий
Фишера (F-test)
12 и 22
Одновыборочный t-критерий
Пусть
Тогда
- среднее по выборке
 – математическое ожидание
2

=1
 − 2
=
- несмещённая
−1
оценка дисперсии
 – число элементов в выборке
−
 / 
Где t(n-1) – распределение
Стьюдента для n-1 степеней
свободы
 −1 ~
Дано: выборка 1 , … ,  и математическое ожидание 
Использование критерия:
1. Рассчитать значения , 2 для выборки
−
2. Рассчитать значение treal(n-1)= / 

3. Рассчитать t(n-1) (см. СТЬЮДЕНТ.ОБР.2Х в MS Excel)
4. Если   − 1 > ( − 1), то  ≠ 
Примечание: можно использовать функцию MS Excel ДОВЕРИТ.СТЬЮДЕНТ
Распределение хи-квадрат (χ2)
Пусть 1 , … ,  - независимые стандартные нормальные случайные
величины (т.е.  ~(0; 1))
Тогда величина  =  2 имеет распределение  2 c k степенями свободы
(т.е. ~ 2 ()).
Функции плотности вероятности
Квантиль  (, )
Критерий согласия χ2 (Пирсона)
Пусть имеются 2 дискретных распределения, заданных двумя наборами
частот  ( = 1 … ) (наблюдаемые частоты, Observed) и  ( = 1 … )
(ожидаемые частоты, Expected), причём   =   .
Тогда если
2

=
2
  −
=1

<  2 (,  − 1), то с вероятностью 
наблюдаемое распределение совпадает с ожидаемым
«Слишком
хорошее»
согласие?
Возможно,
систематическая
ошибка или
подлог?
Распределения
одинаковые
(согласуются)
Распределения разные
(не согласуются)
Критерий согласия χ2 (Пирсона)
Пример с игральной костью
Игральная кость: pi = 1/6
+--+------+------+
|No| Oi | Ei |
+--+------+------+
| 1|
12|
8|
| 2|
4|
8|
| 3|
6|
8|
| 4|
8|
8|
| 5|
7|
8|
| 6|
11|
8|
+--+------+------+
| |
48|
48|
+--+------+------+
chi2(empirical): 5.75000
chi2(a=0.95;f=5): 11.07050
chi2(a=0.05;f=5); 1.14548
Игральная кость: p1 = 3pi (i=2..6)
+--+------+------+
|No| Oi | Ei |
+--+------+------+
| 1|
20|
8|
| 2|
4|
8|
| 3|
5|
8|
| 4|
10|
8|
| 5|
5|
8|
| 6|
4|
8|
+--+------+------+
+ |
48|
48|
+--+------+------+
chi2(empirical): 24.75000
chi2(a=0.95;f=5): 11.07050
chi2(a=0.05;f=5); 1.14548
Критерий согласия χ2 (Пирсона)
Пример с игральной костью
Игральная кость: «подгонка»
+--+------+------+
|No| Oi | Ei |
+--+------+------+
| 1|
9|
8|
| 2|
7|
8|
| 3|
8|
8|
| 4|
7|
8|
| 5|
9|
8|
| 6|
8|
8|
+--+------+------+
+ |
48|
48|
+--+------+------+
chi2(empirical): 0.50000
chi2(a=0.95;f=5): 11.07050
chi2(a=0.05;f=5); 1.14548
Критерий согласия χ2 : непрерывное распределение
1. Найти минимальное  и максимальное  значение в выборке 


2. Разделить отрезок на 5-6 равных промежутков, рассчитать  для каждого
из них (т.е. построить гистограмму)
0
1
2
3
4
5
3. Построить теоретическую гистограмму  (например, на основе  2 и )
 =


−1


0
 
  − (−1 )
=
  − (0 )
 
4. Применение критерия Пирсона
 −  2
2
 =


F-распределение (Фишера)
Пусть 1 и 2 - две независимые случайные величины с распределением  2 ,
т.е.  =  2 ( ), где  ∈ ℕ.
 /
Тогда  1 , 2 = 1 1 - распределение Фишера (F-распределение)
2 /2
Свойства:
• Если ~(1 , 2 ), то
 −1 ~ 2 , 1
• Если 1 , 2 → ∞, то  →   − 1
Дельта-функция:
0 если  ≠ 0
  =
+∞ если  = 0
F-тест (критерий Фишера)
Пусть имеются две выборки  ( = 1 … ) и  ( = 1 … ) нормально
распределённых случайных величин  и , а 2 и 2 - выборочные дисперсии
Тогда  =
2

~(
2
− 1,  − 1)
1. Рассчитать стандартные отклонения 2 , 2 для выборок X и Y
2. Если 2 < 2 , то поменять выборки местами
3. Рассчитать  =
2
2
и  ;  − 1,  − 1
Если  < , то дисперсии одинаковы
Функции MS Excel: F.ТЕСТ, F.РАСП, F.ОБР, ФТЕСТ, ФОБР, FРАСП, FРАСПОБР
Двухвыборочный t-критерий
Формула для случая двух независимых выборок со статистически
незначимым различием между дисперсиями
эмп
−
=
−
− =
 −  2 −  − 
1 + 2 − 2
 = 1 + 2 − 2
Функции MS Excel: пакет анализа данных
2

similar documents