Statistika2012_5

Report
STATISTIKA
1
Ing. Jan Popelka, Ph.D.
odborný asistent
Katedra informatiky a geoinformatiky
Univerzita Jana Evangelisty Purkyně v Ústí nad Labem
email: jan.popelka@ujep.cz
WWW: http://most.ujep.cz/~popelka
HA: σ21 > σ22
W={F; F ≥ F1-α(n-1;m-1)}
HA: σ21 < σ22
W={F; F ≤ Fα(n-1;m-1)}
HA: σ21 ≠ σ22
W={F; F ≤ Fα/2(n-1;m-1) U F ≥ F1-α/2(n-1;m-1)}
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
2
TESTOVÁNÍ HYPOTÉZ
Úvod do testování statistických hypotéz
 Parametrické testy jednovýběrové
 Parametrické testy dvouvýběrové
 Parametrické testy vícevýběrové

3
TESTOVÁNÍ HYPOTÉZ
Statistická hypotéza je určitý předpoklad
(domněnka) o rozdělení jednoho nebo více
základních souborů.
Předpoklad se týká:


parametrů rozdělení základního souboru (např. μ, σ, σ2, π)
- Je průměrná hmotnost novorozenců vetší než 2600 g?
- Je po dietě nižší hmotnost než před dietou?
zákona rozdělení základního souboru (zda má proměnná konkrétní
pravděpodobnostní rozdělení)
- Má hmotnost novorozenců normální rozdělení?
- Má koncentrace SO2 chí-kvadrát rozdělení?
4
TESTOVÁNÍ HYPOTÉZ
Testem hypotézy je postup, pomocí kterého na základě výběrového
souboru ověříme, zda je hypotéza správná nebo nesprávná.
Testovaná hypotéza se značí H0 (nulová hypotéza).
Opačná hypotéza je HA (alternativní hypotéza).
Opačnou hypotézu přijmeme pokud nulovou hypotézu zamítáme.
Výsledkem testu je tedy buď přijetí nebo zamítnutí H0.
Např.:
H0: Průměrný věk soudců je 50 let.
HA: Průměrný věk soudců není 50 let.
5
TESTOVÁNÍ HYPOTÉZ
Nulová hypotéza testu obsahuje vždy znaménko rovná se =!
Alternativní hypotéza je vždy opakem H0.
Hypotézy týkající se průměrného věku soudců.

Je průměrný věk soudců 50 let?
H0: μ = 50 vs. HA: μ ≠ 50
oboustranná hypotéza


Je průměrný věk soudců vyšší než 50 let?
H0: μ ≤ 50 vs. HA: μ > 50
pravostranná hypotéza
Je průměrný věk soudců nižší než 50 let?
H0: μ ≥ 50 vs. HA: μ < 50
levostranná hypotéza
6
TESTOVÁNÍ HYPOTÉZ
Nulová hypotéza testu obsahuje vždy znaménko rovná se =!
Alternativní hypotéza je vždy opakem H0.
Hypotézy o dvou populačních poměrech.

Podporuje vládu 70 % voličů?
H0: π = 70% vs. HA: π ≠ 70%
oboustranná hypotéza


Podporuje vládu více jak 70 % voličů?
H0: π ≤ 70% vs. HA: π > 70%
pravostranná hypotéza
Podporuje vládu méně jak 70 % voličů?
H0: π ≥ 70% vs. HA: π < 70%
levostranná hypotéza
7
TESTOVÁNÍ HYPOTÉZ
Nulová hypotéza testu obsahuje vždy znaménko rovná se =!
Alternativní hypotéza je vždy opakem H0.
Hypotézy o dvou populačních průměrech.

Je průměrný věk soudců a advokátů stejný?
H0: μsoudci = μadvokáti vs. HA: μsoudci ≠ μadvokáti


Je průměrný věk soudců vyšší než průměrný věk advokátů?
H0: μsoudci ≤ μadvokáti vs. HA: μsoudci > μadvokáti
Je průměrný věk soudců nižší než průměrný věk advokátů?
H0: μsoudci ≥ μadvokáti vs. HA: μsoudci < μadvokáti
8
TESTOVÁNÍ HYPOTÉZ
Nulová hypotéza testu obsahuje vždy znaménko rovná se =!
Alternativní hypotéza je vždy opakem H0.
Hypotézy o více populačních poměrech.

Je průměrný cena bytu stejná ve třech vybraných městech?
H0: μ1. město = μ2.město = μ3. město vs.
HA: alespoň dva průměry se nerovnají
9
TESTOVÁNÍ HYPOTÉZ
Stejně jako u intervalových odhadů nelze zjistit, zda platí hypotéza na
100 %.
Nejčastěji se používají testy s jistotou 99 %, 95 % nebo 90 %,
obecně 1-α.
α se nazývá hladina významnosti*.
Je to pravděpodobnost chyby testu, kdy zamítneme H0, přestože tato
hypotéza platí (tzv. chyba 1. řádu).
Existuje i chyba 2. řádu β, že nezamítneme H0, i když byla hypotéza
nesprávná.
*Poznámka: Při konstrukci intervalů spolehlivosti (přednáška 4) se α nazývá
hladina spolehlivosti.
10
TESTOVÁNÍ HYPOTÉZ
Samotné testování se provádí pomocí testovací statistiky, číslo
vypočtené dle zadaného vzorce, jehož hodnota má konkrétní
pravděpodobnostní rozdělení a určuje, která hypotéza platí.


Každému testu odpovídá konkrétní testovací statistika.
Autor testové statistiky uvádí i její pravděpodobnostní rozdělení
(nejčastěji jde o spojitá rozdělení: Normální, Studentovo, Chíkvadrát, F rozdělení ).

Pokud je hodnota statistiky příliš extrémní (příliš vysoká nebo příliš
nízká) zamítneme H0 a přijmeme HA
(to, zda je statistika extrémní, lze zjistit jejím porovnáním s
kvantily odpovídajícího rozdělení testovací statistiky - př. 3).
11
TESTOVÁNÍ HYPOTÉZ
Oboustranný test o střední hodnotě
H0: μ = 50 let vs.
HA: μ ≠ 50 let
pro α = 0,05
Kritický obor – testovací
statistika je příliš nízká!
Zamítáme H0
Obor přijetí H0
Kritický obor – testovací
statistika je příliš vysoká!
Zamítáme H0
12
TESTOVÁNÍ HYPOTÉZ
Levostranný test o střední hodnotě
H0: μ ≥ 50 let vs.
HA: μ < 50 let
pro α = 0,05
Kritický obor – testovací
statistika je příliš nízká!
Obor přijetí H0
13
TESTOVÁNÍ HYPOTÉZ
Pravostranný test o střední hodnotě
H0: μ ≤ 50 let vs.
HA: μ > 50 let
pro α = 0,05
Obor přijetí H0
14
Kritický obor – testovací
statistika je příliš vysoká!
TESTOVÁNÍ HYPOTÉZ
15
TESTOVÁNÍ HYPOTÉZ – POČÍTAČOVÝ SOFTWARE
16
TESTOVÁNÍ HYPOTÉZ – POČÍTAČOVÝ SOFTWARE
Základem úspěchu při vyhodnocování testů statistických hypotéz je
následující pravidlo:
Je-li p-hodnota testu < α
zamítáme H0 a přijímáme HA.
Je-li p-hodnota testu > α
nezamítáme H0 (H0 platí).
17
TESTOVÁNÍ HYPOTÉZ
P-hodnota
Je nejnižší hladina významnosti α, na které lze zamítnout H0.
Např.: p-value = 0,001. H0 lze zamítnout na hladině významnosti
α = 0,05 nebo i 0,01 (tedy i s 99% jistotou)
p-value = 0,001
18
Obor přijetí
TESTOVÁNÍ HYPOTÉZ
P-hodnota
Je nejnižší hladina významnosti, na které lze zamítnout H0.
Např.: p-value = 0,4. H0 nelze zamítnout na hladině významnosti
α = 0,05 , ale pro α = 0,45 ano (tedy s jistotou 55%).
p-value = 0,4
19
Obor přijetí
TESTOVÁNÍ HYPOTÉZ
Existují dvě základní skupiny testů:


Parametrické testy – týkají se přímo parametrů daného
základního souboru (μ, σ, σ2, π). Jsou početně náročnější ovšem
silné (jejich výsledek je dosti přesný).
Neparametrické – Nejsou početně náročné, ale mají menší sílu.
Používají se, pokud nejsou splněny podmínky použití testů
parametrických (data nejsou normálně rozdělena, data mají
ordinální charakter, výběry jsou malé, nebo existují velké rozdíly
mezi rozsahy výběrů).
Lze je použít i souběžně s parametrickými a porovnávat jejich
výsledky, pro posílení validity testů.
20
TESTY STŘEDNÍ HODNOTY
Počet Závislé/
výběrů nezávislé
1
Počet
hodnot
Rozdělení
n ≥ 30
-
-
Normální
n < 30
Není
normální
n ≥ 30
-
n < 30
Normální
rozdělení
Není
normální
Nezávislé
2
n ≥ 30
Závislé
(párové)
n < 30
Normální
rozdělení
Není
normální
Test
Jednovýběrový
t-test
Jednovýběrový
t-test
Znaménkový test
Nástroj
MS Excel
MS Excel
Online
kalkulátory
Dvouvýběrový
t-test
Dvouvýběrový
t-test
Mann–Whitneův test nebo
Wilcoxonův test
Dvouvýběrový párový
t-test
Dvouvýběrový párový
t-test
Online
kalkulátory
Wilcoxonův test
Online
kalkulátory
MS Excel
MS Excel
MS Excel
MS Excel
TESTY STŘEDNÍ HODNOTY
Počet
výběrů
Závislé/
nezávislé
Nezávislé
3 a více
Závislé
Rozdělení
Rozptyly
Test
Nástroj
Normální
rozdělení
Shodné
ANOVA
MS Excel
-
-
Kruskal–
Wallisův test
Online
kalkulátory
Normální
rozdělení
Shodné
ANOVA
MS Excel
-
-
Friedmanův
test
Online
kalkulátory
TESTOVÁNÍ HYPOTÉZ
Parametrické testy se zabývají parametry základního souboru.
Má-li základní soubor normální rozdělení
N(μ;σ2), pak lze testovat právě střední
hodnotu (populační průměr μ) a rozptyl σ2.
Tento předpoklad musí být splněn u všech následujících testů!
Někdy je uváděna volnější podmínka počtu hodnot ve výběru (n > 30).
23
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Nulová hypotéza:
H0: μ = μ0
, kde μ0 je konkrétní číslo
Alt. hypotézy:
HA: μ > μ0
pravostranná hypotéza
HA: μ < μ0
levostranná hypotéza
HA: μ ≠ μ0
oboustranná hypotéza
Test. statistika:
x  0
t
 n
s
Krit. obor: pro HA: μ > μ0
pro HA: μ < μ0
pro HA: μ ≠ μ0
má Studentovo t rozdělení
s (n-1) stupni volnosti
W={t; t ≥ t1-α(n-1)}
W={t; t ≤ tα(n-1)}
W={t; |t| ≥ t1-α/2(n-1)}
24
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Příklad: Předmětem zájmu je věk soudců. Bylo dotázáno 45 náhodně
vybraných soudců. Dotázaní mají průměrný věk 49,58 let a
směrodatnou odchylkou výběru 4,8 roku. Na hladině významnosti
α = 0,05 (pravděpodobnost chybného závěru testu 5 %) máme
zjisti, zda je průměrný věk soudců nižší jak 50 let.
Jedná se o test velikosti střední hodnoty! Zabýváme se průměrným
věkem soudců.
Postupuje se podle dříve uvedených kroků (snímek 13):
25
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Příklad: Předmětem zájmu je věk soudců...
1.
Formulace H0 a HA:
2.
3.
4.
H0: μ ≥ 50 let vs. HA: μ < 50 let
Volba hladiny významnosti:
α = 0,05
Volba vhodné testovací statistiky:
x  0
t
 n
s
Vymezení kritického oboru:
Alternativní hypotéze HA odpovídá kritický obor
W={t; t ≤ tα(n-1)} ,
tedy W={t; t ≤ t0,05(45-1)} , W={t; t ≤ -1,68}.
26
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Příklad: Předmětem zájmu je věk soudců…
5.
Výpočet testovací statistiky t z hodnot výběru:
49,8  50
t
 45  0, 28
4,8
6.
7.
Zjištění, zda testovací statistika t padne do kritického oboru:
Hodnota testovací statistiky je -0,28 . Testovací statistika nepadne
do kritického oboru W={t; t ≤ -1,68}, (protože
-0,28 > -1,68), takže nezamítáme H0.
Formulace závěru testu:
Na základě testu nezamítáme na hladině významnosti 0,05
hypotézu, že průměrný věk soudců je roven nebo větší 50 let.
27
Nelze tedy tvrdit, že je věk menší jak 50 let (neplatí HA).
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Příklad: Předmětem zájmu je věk soudců…
H0: μ ≥ 50 let vs. HA: μ < 50 let
Testovací statistika t = -0,28
5%
Kritický obor W={t; t ≤ -1,68}
95%
Obor přijetí
28
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Příklad: Předmětem zájmu je věk soudců…
S pomocí MS Excel. Je nutné mít pracovat se zdrojovými daty! Nestačí
průměr a směrodatná odchylka, ale všech 45 hodnot!
1.
Formulace H0 a HA:
H0: μ ≥ 50 let vs. HA: μ < 50 let
!Excel počítá p-hodnotu pro alternativní hypotézu
HA:μ > μ0! P-hodnotu pro levostranný test bude nutno
přepočítat.
2.
3.
Volba hladiny významnosti: α = 0,05
Volba vhodné testovací statistiky:
= 1-ZTEST (oblast dat; hypotetická hodnota μ0 tedy 50; sigma =
nezadává se!)
29
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Příklad: Předmětem zájmu je věk soudců…
4.
Zjištění p-hodnoty testu:
= 1-0,781 = 0,219
5.
Formulace závěru testu:
Protože platí: p-hodnota > α neboli 0,219 > 0,05,
nezamítáme nulovou hypotézu.
Na základě testu nezamítáme na hladině významnosti 0,05
hypotézu, že věk soudců je roven nebo větší 50 let. Nelze tedy
tvrdit, že je věk menší jak 50 let (neplatí HA).
30
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Práce s výstupem funkce ZTEST
Pro pravostranný test (HA: μ > μ0) je p-hodnotou přímo hodnota
vypočtená funkcí ZTEST.
Pro levostranný test (HA: μ < μ0) je nutno p-hodnotu dopočítat podle
vzorečku 1 - hodnota vypočtená funkcí ZTEST.
Pro oboustranný test (HA: μ ≠ μ0) je nutno p-hodnotu dopočítat podle
vzorečku 2x menší z hodnot (hodnota vypočtená funkcí ZTEST, 1 hodnota vypočtená funkcí ZTEST).
31
TEST VELIKOSTI STŘEDNÍ HODNOTY
μ
Příklad: Předmětem zájmu je věk soudců…
Funkce ZTEST vypočetla hodnotu 0,781.
P-hodnota pro pravostranný test (HA: μ > 50) je 0,781 (platí H0).
P-hodnota pro levostranný test (HA: μ < 50) je 1 – 0,781 = 0,219
(platí H0).
P-hodnota pro oboustranný test (HA: μ ≠ 50) je 2 x menší z hodnot
(0,781 a 0,219) = 2x 0,219 = 0,438 (platí H0).
32
TEST VELIKOSTI ROZPTYLU σ2
Nulová hypotéza:
H0: σ2 = σ20
, kde σ20 je konkrétní číslo
Alt. hypotézy:
HA: σ2 > σ20
pravostranná hypotéza
HA: σ2 < σ20
levostranná hypotéza
HA: σ2 ≠ σ20
oboustranná hypotéza
má chí-kvadrát rozdělení s
(n - 1) stupni volnosti
Testovací statistika:
z
(n  1) s 2
 02
Kritický obor: HA: σ2 > σ20
W={z; z ≥ χ21-α(n-1)}
HA: σ2 < σ20
W={z; z ≤ χ2α(n-1)}
HA: σ2 ≠ σ20
W={z; z ≤ χ2α/2(n-1) U z ≥ χ21-α/2(n-1)}
33
TESTOVÁNÍ HYPOTÉZ – DVA VÝBĚRY
Stejně jako u intervalů spolehlivosti lze pomocí testů porovnávat dva
výběry.
Pocházejí-li oba výběry ze základních souborů s normálním
rozdělením N(μ;σ2), pak lze testovat právě shodu středních hodnot
(populačních průměrů) a rozptylů.
Pocházejí-li oba ze základních souborů s binomickým rozdělením
Bi(n;π), pak lze testovat shodu populačních poměrů.
Toto jsou nejčastější aplikace testování statistických hypotéz pro dva
výběry.
34
TEST SHODY DVOU ROZPTYLŮ
Nulová hypotéza:
H0: σ21 = σ22
Alt.hypotézy:
HA: σ21 > σ22
pravostranná hypotéza
HA: σ21 < σ22
levostranná hypotéza
HA: σ21 ≠ σ22
oboustranná hypotéza
má F rozdělení s
(n-1; m-1) stupni volnosti
Testovací statistika:
Kritický obor:
s12
F 2
s2
HA: σ21 > σ22
W={F; F ≥ F1-α(n-1;m-1)}
HA: σ21 < σ22
W={F; F ≤ Fα(n-1;m-1)}
HA: σ21 ≠ σ22
W={F; F ≤ Fα/2(n-1;m-1) U F ≥ F1-α/2(n-1;m-1)}
35
TEST SHODY DVOU ROZPTYLŮ
MS Excel
= FTEST (první oblast; druhá oblast)
počítá p-hodnotu oboustranného testu.
nebo
Data – Analýza – Analýza dat – Dvouvýběrový F-test pro rozptyl
počítá p-hodnotu vybraného jednostranného testu
Program testuje „logickou variantu“ jednostranného test. Znaménko nerovnosti v alt.
hypotéze je stejné jako znaménko nerovnosti mezi výběrovými průměry.
Např. pokud je s21<s 22, pak má HA tvar: σ21 < σ22 .
36
TEST SHODY DVOU PRŮMĚRŮ
Nulová hypotéza:
H0: μ1 = μ2
Alt. hypotézy:
HA: μ1 > μ2
pravostranná hypotéza
HA: μ1 < μ2
levostranná hypotéza
HA: μ1 ≠ μ2
oboustranná hypotéza
Testovací statistika
(za podmínky σ21 = σ22)
, kde
x1  x2
t
1 1
s 
n m
(n  1)s  (m  1)s
s
nm2
2
1
2
2
má Studentovo t rozdělení
(n+m-2) stupni volnosti
37
TEST SHODY DVOU PRŮMĚRŮ
Kritický obor: HA: μ1 > μ2
HA: μ1 < μ2
HA: μ1 ≠ μ2
W={t; t ≥ t1-α(n+m-2)}
W={t; t ≤ tα(n+m-2)}
W={t; |t| ≥ t1-α/2(n+m-2)}
38
TEST SHODY DVOU PRŮMĚRŮ
MS Excel:
= TTEST (první oblast; druhá oblast; jednostranný test* = 1 nebo
oboustranný test = 2; výběry se stejným rozptylem = 2)
počítá p-hodnotu oboustranného nebo jednostranného testu
nebo
Data – Analýza – Analýza dat – Dvouvýběrový t-test s rovností rozptylů
počítá p-hodnotu oboustranného i jednostranného testu
Program testuje „logickou variantu“ jednostranného test. Znaménko nerovnosti v alt.
hypotéze je stejné jako znaménko nerovnosti mezi výběrovými průměry.
Např. pokud je x1  x2 , pak má HA tvar: μ1 < μ2 .
39
TEST SHODY DVOU PRŮMĚRŮ
Nulová hypotéza:
H0: μ1 = μ2
Alt. hypotézy: HA: μ1 > μ2
HA: μ1 < μ2
HA: μ1 ≠ μ2
Testovací statistika:
pravostranná hypotéza
levostranná hypotéza
oboustranná hypotéza
x1  x2
(za podmínky σ21 ≠ σ22) t 
1 1

n m v
má Studentovo t rozdělení
s (v) stupni volnosti:
2
s
s 
  
 n m
2 2
2 2
 s1 
 s2 
 
 
 n    m  40
(n  1) (m  1)
2
1
2
2
TEST SHODY DVOU PRŮMĚRŮ
Kritický obor: HA: μ1 > μ2
HA: μ1 < μ2
HA: μ1 ≠ μ2
W={t; t ≥ t1-α(v)}
W={t; t ≤ tα(v)}
W={t; |t| ≥ t1-α/2(v)}
41
TEST SHODY DVOU PRŮMĚRŮ
MS Excel:
= TTEST (první oblast; druhá oblast; jednostranný test* = 1 nebo
oboustranný test = 2; výběry s různým rozptylem = 3)
počítá p-hodnotu oboustranného nebo jednostranného testu
nebo
Data – Analýza – Analýza dat – Dvouvýběrový t-test s nerovností rozptylů
počítá p-hodnotu oboustranného i jednostranného testu
Program testuje „logickou variantu“ jednostranného test. Znaménko nerovnosti v alt.
hypotéze je stejné jako znaménko nerovnosti mezi výběrovými průměry.
Např. pokud je x1  x2 , pak má HA tvar: μ1 < μ2 .
42
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru
skupiny zdravých lidí a skupiny nemocných.
Naměřené hodnoty jsou
v tabulce. Porovnejte na hladině významnosti 0,05
obsahy vápníku obou skupin, tj. určete, zda se obě
skupiny od sebe statisticky významně liší.
Předpoklad normality základních souborů je splněn.
Jedná se o test shody dvou průměrů!
Pro tento test je nutné nejprve vědět, jestli jsou
rozptyly stejné σ21 = σ22 nebo různé σ21 ≠ σ22.
Proto nejdříve provedeme test shody dvou rozptylů a
teprve poté test shody dvou průměrů.
Zdraví
lidé
Nemocní
lidé
obsah Ca
obsah Ca
(mmol/l)
(mmol/l)
2,15
2,09
2,13
1,8
2,27
1,97
2,52
2,35
2,11
2,08
2,26
1,9
2,34
2,06
2,68
2,3
2,24
2,35
43
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru ...
S pomocí MS Excel.
1.
Formulace H0 a HA:
H0: σ21 = σ22 vs. HA: σ21 ≠ σ22
2.
3.
Volba hladiny významnosti: α = 0,05
Volba vhodné testovací statistiky:
= FTEST (první oblast; druhá oblast)
44
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru ...
4.
Zjištění p-hodnoty :
= 0,905699288
5.
Formulace závěru testu:
Protože platí p-hodnota > α (0,905699288 > 0,05) nezamítáme
nulovou hypotézu.
Na základě testu nezamítáme na hladině významnosti 0,05
hypotézu, že rozptyly obou souborů jsou stejné.
Nyní lze přistoupit k samotnému testu shody dvou průměrů.
45
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru ...
S pomocí MS Excel lze řešit i alternativně: H0: σ21=σ22 vs. HA: σ21≠ σ22
Data – Analýza – Analýza dat – Dvouvýběrový F-test pro rozptyl
Dvouvýběrový F-test pro rozptyl
Stř. hodnota
Rozptyl
Pozorování
Rozdíl
F
P(F<=f) (1)
F krit (1)
Soubor 1 Soubor 2
2,3
2,1 aritmetický průměr
0,036 0,03925 rozptyl
9
9 počet prvků výběru
8
8
hodnota testového
0,917197
kritéria
p-hodnota pro
0,45285
jednostranný test
0,290858
kritická oblast
jednostranného testu
46
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru ...
Analýza dat počítá p-hodnotu jednostranného testu.
P-hodnota oboustranného
testu je 2x menší z
Dvouvýběrový F-test pro rozptyl
hodnot p-hodnota
Soubor 1 Soubor 2
(0,45285)
a
Stř. hodnota
2,3
2,1 aritmetický
průměr
1-p-hodnota (0,54715).
Rozptyl
0,036 0,03925 rozptyl
Pozorování
Rozdíl
F
P(F<=f) (1)
F krit (1)
9
8
0,917197
0,45285
0,290858
9 počet prvků výběru
8 P-hodnota
hodnota testového
oboustranného testu:
kritéria
P-hodnota
p-hodnota
pro=
= 2*0,45285
=
jednostranný
test
= 0,9057.
kritická
oblast
jednostranného testu
47
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru ...
S pomocí MS Excel.
1.
Formulace H0 a HA:
H0: μ1 = μ2 vs. HA: μ1 ≠ μ2
2.
3.
Volba hladiny významnosti: α = 0,05
Volba vhodné testovací statistiky:
= TTEST (první oblast; druhá oblast; oboustranný test = 2; výběry se
stejným rozptylem = 2)
48
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru ...
4.
Zjištění p-hodnoty :
= 0,043918178
5.
Formulace závěru testu:
Protože platí p-hodnota < α (0,043918178 < 0,05) zamítáme
nulovou hypotézu.
Na základě testu zamítáme na hladině významnosti 0,05 hypotézu,
že obsah vápníku v krevním séru u zdravých a nemocných lidí je
stejný. Obsahy jsou rozdílné.
49
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru ...
MS Excel: Data – Analýza – Analýza dat – Dvouvýběrový t-test s rovností
rozptylů
Dvouvýběrový t-test s rovností rozptylů
Soubor 1 Soubor 2
jednostranný test
Stř. hodnota
2,3
2,1 aritmetický průměr
Rozptyl
0,036 0,03925 rozptyl
H0: 1
2
Pozorování
9
9 počet prvků výběru
Společný rozptyl
0,037625
HA: 1
2
Hyp. rozdíl stř. hodnot
0
Rozdíl
16
hodnota testového
oboustranný test
t stat
2,187248
kritéria
p-hodnota pro
H0: 1
2
P(T<=t) (1)
0,021959
jednostranný test
kritická oblast
HA: 1
2
t krit (1)
1,745884
jednostranného testu
p-hodnota pro
P(T<=t) (2)
0,043918
oboustranný test
50
kritická oblast
oboustranného testu
t krit (2)
2,119905
μ ≤μ
μ >μ
μ =μ
μ ≠μ
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byl měřen obsah vápníku v krevním séru ...
5.
Formulace závěru testu:
Na základě oboustranného testu zamítáme na hladině
významnosti 0,05 hypotézu, že obsah vápníku v krevním séru u
zdravých a nemocných lidí je stejný.
Na základě jednostranného testu přijímáme hypotézu, že obsah Ca
v krevním séru zdravých lidí je vyšší než u lidí nemocných!
51
TEST SHODY DVOU PRŮMĚRŮ
Nulová hypotéza :
H0: μ1 = μ2
Alt. hypotézy: HA: μ1 > μ2
HA: μ1 < μ2
pravostranná hypotéza
levostranná hypotéza
HA: μ1 ≠ μ2
oboustranná hypotéza
Použití: v případech, kdy hodnoty ve výběrových souborech tvoří páry.
Jde o párový test shody dvou průměrů.
MS Excel:
= TTEST (první oblast; druhá oblast; jednostranný test = 1 nebo
oboustranný test = 2; spárované výběry = 1)
Nástroje – Analýza dat – Dvouvýběrový párový t-test na střední hodnotu
52
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Na skupině dobrovolníků byl testován
prostředek na snížení váhy. Hmotnosti 12
testovaných lidí před a po dietní kůře jsou
v tabulce. Určete párovým testem, zda je
prostředek na hladině významnosti 0,05
účinný. Předpoklad normality základních
souborů je splněn.
Jedná se o párový test shody dvou průměrů,
protože hmotnosti před a po se vztahují
k jednomu člověku.
U tohoto testu není nutné zjišťovat, zda jsou
rozptyly obou souborů stejné nebo ne.
hmotnost
před dietou
(kg)
hmotnost
po dietě
(kg)
85
76
75
75
90
81
65
64
150
155
80
72
110
99
56
45
88
89
73
66
67
56
134
110
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Na skupině dobrovolníků byl testován prostředek ...
S pomocí MS Excel.
1.
Formulace H0 a HA:
H0: μ1 ≤ μ2 vs. HA: μ1 > μ2
2.
3.
Volba hladiny významnosti: α = 0,05
Volba vhodné testovací statistiky:
= TTEST (první oblast; druhá oblast; jednostranný test = 1 nebo
oboustranný test = 2; spárované výběry = 1)
Nástroje - Analýza dat – Dvouvýběrový párový t-test na střední
hodnotu
54
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Na skupině dobrovolníků byl testován prostředek ...
Dvouvýběrový párový t-test na střední hodnotu
Soubor 1 Soubor 2
Stř. hodnota
89,41667 82,33333
Rozptyl
807,7197 841,8788
Pozorování
12
12
Pears. korelace
0,964996
Hyp. rozdíl stř. hodnot
0
Rozdíl
11
t stat
3,219605
P(T<=t) (1)
0,004082
t krit (1)
1,795885
P(T<=t) (2)
0,008165
t krit (2)
2,200985
jednostranný test
H0: μ1 ≤ μ2
HA: μ1 > μ2
(p-hodnota)
oboustranný test
H0: μ1 = μ2
HA: μ1 ≠ μ2
(p-hodnota)
55
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Na skupině dobrovolníků byl testován prostředek ...
4.
Zjištění p-hodnoty :
= 0,004
5.
Formulace závěru testu:
Protože platí p-hodnota < α (0,004 < 0,05) zamítáme nulovou
hypotézu.
Na základě testu zamítáme na hladině významnosti 0,05 hypotézu,
že hmotnost před a po dietě je stejná a přijímáme hypotézu, že
hmotnost po dietě skutečně klesla.
56
TEST SHODY VÍCE PRŮMĚRŮ
Nulová hypotéza :
H0: μ1 = μ2 = μ3 = μ4 = ...
Alternativní hypotéza: HA: alespoň dva průměry se nerovnají
Jedná se o tzv. Analýzu rozptylu (ANOVA).
Podmínky analýzy:

výběry pocházejí z normálního rozdělení

rozptyly všech souborů jsou stejné
σ21 = σ22= σ23 = σ24 ... = σ
k ověření postačuje pravidlo:
max si
3
min si
MS Excel:
Data – Analýza – Analýza dat – Anova: jeden faktor
57
TEST SHODY VÍCE PRŮMĚRŮ
Testovací statistika: F má Fisherovo F rozdělení s (k-1; n-k) stupni
volnosti, kde

k ... počet kategorií (počet výběrů)

n ... celkový počet prvků ve všech kategoriích
Kritický obor:
W={F; F ≥ F1-α(k-1;n-k)}
58
TEST SHODY DVOU PRŮMĚRŮ
Příklad: Byly sledovány ceny bytů kategorie 4+1 ve třech městech.
Náhodně se podle inzerátů podařilo získat následující ceny (v tis. Kč).
Jsou ceny v průměru stejné?
A
B
C
1040
900
1550
950
1700
1300
1100
1290
1220
1570
900
1660
820
1250
1340
1460
Porovnáváme průměrné ceny bytů, použijeme analýzu rozptylu.
59
TEST SHODY VÍCE PRŮMĚRŮ
Příklad: Byly sledovány ceny bytů kategorie 4+1 ...
S pomocí MS Excel.
1.
Formulace H0 a HA:
H0: μ1 = μ2 = μ3 vs. HA: alespoň dva průměry se nerovnají nebo
také
H0: „průměrné ceny jsou všude stejné“ vs. HA: „průměry se liší“
2.
3.
Volba hladiny významnosti: α = 0,05
Volba vhodné testovací statistiky:
Data – Analýza – Analýza dat – Anova: jeden faktor
60
TEST SHODY VÍCE PRŮMĚRŮ
Příklad: Byly sledovány ceny bytů kategorie 4+1 ...
Anova: jeden faktor
Faktor
Výběr
Sloupec 1
Sloupec 2
Sloupec 3
Počet
5
6
5
ANOVA
Zdroj variability
Mezi výběry
Všechny výběry
SS
252903,8
953640
Celkem
1206544
Součet
5480
7500
7070
Průměr
1096
1250
1414
Rozptyl
81330
98640
33780
Rozdíl
MS
F
Hodnota P
F krit
2 126451,9 1,723789 0,216755 3,805565
13 73356,92
15
61
TEST SHODY VÍCE PRŮMĚRŮ
Příklad: Byly sledovány ceny bytů kategorie 4+1 ...
Ověření podmínky rovnosti rozptylů:
max si
3
min si
Maximální si je pro město B (si = √98640 = 314,1).
Minimální si je pro město C (si = √33780 = 183,8).
314,1/183,8 = 1,71. Podíl je menší než 3, rozptyly lze považovat za
rovné. Analýzu rozptylu lze použít.
62
TEST SHODY VÍCE PRŮMĚRŮ
Příklad: Byly sledovány ceny bytů kategorie 4+1 ...
Anova: jeden faktor
Faktor
Výběr
Sloupec 1
Sloupec 2
Sloupec 3
Testovací statistika F
Počet
5
6
5
ANOVA
Zdroj variability
Mezi výběry
Všechny výběry
SS
252903,8
953640
Celkem
1206544
Součet
5480
7500
7070
Průměr
1096
1250
1414
Rozptyl
81330
98640
33780
Kritický obor
Rozdíl
MS
F
Hodnota P
F krit
2 126451,9 1,723789 0,216755 3,805565
13 73356,92
15
Protože platí p-hodnota > α (0,2167 > 0,05) nezamítáme nulovou
hypotézu.
63
TEST SHODY VÍCE PRŮMĚRŮ
Příklad: Byly sledovány ceny bytů kategorie 4+1 ...
S pomocí analýzy rozptylu se na hladině významnosti 0,05 nepodařilo
prokázat, že by se průměrné ceny bytů v jednotlivých městech
lišily.
Průměrné ceny bytů jsou ve všech třech městech stejné.
64
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
DŮLEŽITÉ POJMY – 5. PŘEDNÁŠKA
Statistická hypotéza
 Nulová a alternativní hypotéza
 Hladina významnosti
 Testovací statistika
 Kritický obor
 P-hodnota testu
 Jednovýběrové testy
 Dvouvýběrové testy
 Vícevýběrové testy
 Předpoklad normality

65

similar documents