Test t dla prób zależnych

Report
Moduł
Testy statystycznej istotności
Testowanie przy użyciu
oprogramowania SPSS
Mgr Krzysztof Jurek
Sposoby doboru próby
Próby niezależne – porównujemy ze sobą w tym samym czasie dwie zbiorowości,
różniące się poziomem zmiennej niezależnej (np. klienci sklepu, mężczyźni i kobiety
itp.) Obie próby są odzwierciedleniem dwóch różnych populacji a struktura jednej z
nich nie ma żadnego wpływu na strukturę drugiej
Próby zależne –należą do tej samej grupy obiektów badanych, badane są wielokrotnie
w kolejnych jednostkach czasu lub w tym samym czasie gdy dokonujemy pomiaru
wielu zmiennych (np. ta sama grupa przed i po eksperymencie)
Testy statystycznej istotności
 Przypuśćmy że dobraliśmy próbę losowo, nie martwimy się
że jest ona skrzywiona. Innym problemem jest błąd z
próby – oznacza on odchylenie charakterystyk próby w
stosunku do populacji (np. średniej, odchylenia
standardowego)
 Badamy studentów socjologii pewnej uczelni, jest ich 70%
(mężczyzn), zaś w naszej próbie znalazło się ich 58% i to
jest właśnie błąd z próby (70% - 58%). Statystki z populacji
są niezmienne, statystyki dla każdej wylosowanej próby są
różne. Testy statystycznej istotności pozwolą nam określić,
czy różnica ta wynika z błędu z próby.
Zadaniem testów istotności jest wykrycie
istnienia istotnej różnicy lub jej braku
między wartościami parametrów (np.
wartościami średnimi, wariancjami)
charakteryzującymi różne próbki, wzorce,
metody analityczne.
Testowanie hipotez to systematyczna
procedura służąca do oceny, czy rezultaty
eksperymentu
(przeprowadzonego
na
próbie) popierają określoną teorię lub
praktyczną innowację (które będą odnosić
się do całej populacji).
Do czego służą testy t – użycie SPSS
• Testy t służą do porównywania średnich.
• Różnice istotne statystycznie - górną,
akceptowalną
wartość
przyjmuje
się
zazwyczaj 5% (5 na 100 przypadków), a
zatem otrzymaną w raporcie SPSSa
istotność statystyczną musimy porównać z
poziomem równym 0,05
Jeśli otrzymana istotność jest niższa od tej
wartości, to znaczy, iż otrzymaliśmy różnice
istotne statystycznie!!!.
Istotność zależy od dwóch czynników:
- Różnica jest bardziej istotna, gdy
zbadamy więcej osób (bo im więcej
obserwacji, tym większa szansa, że nasze
przewidywania są trafne)
- Różnica jest mniej istotna, im większe
rozproszenie (odchylenie standardowe)
wyników w każdej z porównywanych grup
(bo im bardziej zróżnicowane są grupy, tym
mniejsza możliwość przewidywania wyniku
kolejnej osoby w grupie).
Rodzaje testów t
Test t dla prób niezależnych:
Służy do porównywania średnich uzyskanych w zmiennej zależnej przez dwie niezależne
od siebie grupy np. możemy porównać kobiety i mężczyzn pod względem średniej długości
życia.
Test t dla prób zależnych:
W tym przypadku porównujemy dwa wyniki uzyskane przez te same osoby – przykładem
może być klasyczny przypadek powtarzanego w czasie pomiaru: badamy zdolność
logicznego rozumowania przed studiami i po studiach – w badaniu biorą udział te same
osoby. Przy tym teście t możemy porównać też średnie na podstawie informacji uzyskanych
od jednej osoby.
Test t dla jednej próby:
Porównujemy średnią z jakiejś zmiennej z konkretną liczbą: np. chcemy sprawdzić, czy
średnie zarobki naszych badanych różnią się istotnie od 2000.
Test t dla dwóch prób niezależnych
• Większość hipotez badawczych głosi, że dwie
populacje różnią się między sobą.
Przetestowanie tego typu twierdzeń wymaga
odpowiedniej procedury statystycznej
Ćwiczenie 1
• 1. Otwórz w programie SPSS plik
GSS93podzbiór.sav
• 2. Interesować nas będzie porównanie kobiet i
mężczyzn pod względem wieku zawarcia
związku małżeńskiego, zatem nasze pytanie
badawcze będzie brzmiało: czy kobiety i
mężczyźni różnią się wiekiem w momencie
zawierania małżeństwa?
Przyjęcie hipotez badawczych:
(Przykłady - „Do biegu gotowi , start! Wprowadzenie do spss dla Windows”)
• Mężczyźni i kobiety różnią się wiekiem
zawarcia małżeństwa – hipoteza badawcza,
alternatywna
• Mężczyźni i kobiety nie różnią się wiekiem
zawarcia małżeństwa – hipoteza zerowa
• Po wyborze testu pojawi się okno zawierające
listę zmiennych 1) testowanych (zmiennej lub
zmiennych zależnych) – Test Variable(s)
• 2) zmiennej grupującej (zmienna niezależna) –
Grouping Variable
Z racji postawionych hipotez wybieramy
zmienną Płeć respondenta i czynimy ją
zmienną grupującą, zaś Wiek zawarcia
związku małżeńskiego zmienną testowaną
• UWAGA!!! Zmienna testowana powinna być
zmierzona na skali interwałowej albo ilorazowej
(wiek w tym przypadku jest mierzony na skali
interwałowej)
3) Przygotowanie analizy dopełniamy
zdefiniowaniem grupy - Define groups – dzięki
temu określamy, które grupy zostaną porównane
Zmienna płeć zdefiniowana jest następująco 1 –
mężczyzna, 2 – kobieta, grupę pierwszą tworzą
osoby z kodem 1 , grupę druga osoby z kodem 2
4) Klikamy OK, pojawia się Edytor raportów SPSS
5) Najważniejszy etap – Interpretacja wyników
Raport:
I część raportu to statystyki ogólne
Syntax dla statystyk opisowych i
tabel krzyżowych
Wszystkie nasze analizy jesteśmy w stanie zrobić bez okienek, dzięki
zastosowaniu specjalnego języka poleceń Syntax.
Syntax dla Testu T dla
prób niezależnych
UWAGA DWA POZIOMY INTERPRETACJI:
• Pierwszy etap interpretacji to ocena
homogeniczności wariancji w obu populacjach
• Standardowa wersja testu zakłada, że wariancja
jest taka sama w obu populacjach. Test t dla prób
niezależnych sprawdza to założenie za pomocą
statystki F i testu Leven’a, poziom
prawdopodobieństwa p czyli
prawdopodobieństwo popełnienia błędu
pierwszego rodzaju.
• Odczytujemy istotność dla testu F: jeśli p jest
mniejsze od 0.05 to przyjmujemy, że populacje
mają różne wariancje (Equal variances
assumed) jeśli p jest większe od 0.05 to
założenie równości da się utrzymać (Equal
variances not assumed) – innymi słowy jeśli p>
0.05 to należy oprzeć się na wynikach w
pierwszym wierszu , jeśli p<0.05 w drugim
• Nasz wynik to ,559 a więc jest >0.05, opieramy
się na wynikach w pierwszym wierszu
Interpretacja testu t
• Spoglądamy na poziom p (dwustronny), pozwala
on ocenić prawdopodobieństwo popełnienia
błędu pierwszego rodzaju
• Jeśli p jest mniejsze od założonego poziomu alfa
zwykle 0.05 lub bardziej rygorystycznie 0.01, to
powinniśmy odrzucić hipotezę zerową
• W naszym przypadku wynosi on 0.000 co
powinniśmy zapisać p<0.001, przyjmujemy
hipotezę, że kobiety i mężczyźni różnią się pod
względem wieku zawarcia związku małżeńskiego
a różnica ta jest istotna statystycznie.
ZAPIS: t(1200) = 8,06; p < 0,01
Df = 1202 - 2
Test dla dwóch prób zależnych
• Procedura ta służy do oszacowania, czy średnie
pochodzące z dwóch powiązanych ze sobą
populacji różnią się między sobą. Badacze
formułują często pytania typu: Czy uczestnicy
badania po otrzymaniu określonego
oddziaływania eksperymentalnego będą
zachowywali się inaczej niż przed poddaniem ich
oddziaływaniu?
• Schemat ten określa się jako test/retest
Test t-Studenta dla dwóch prób
zależnych
Czy µ1= µ2?
µ1
Dwie próby zależne!!!
Czyli dwa razy te same
osoby, np. przed
manipulacją i po lub w
jakimś odstępie czasu
µ2
Ćwiczenie: Wyobraźmy sobie, że wprowadzamy na rynek reklamę,
przeprowadzamy eksperyment, interesuje nas czy reklama ma wpływ
na odbiorców pokazujemy więc produkt i pytamy o jego cechy, ilość
cech zapisujemy, to samo czynimy po emisji reklamy (po upływie
jakiegoś czas) , pytamy o cechy i zapisujemy ich liczbę. Czy jakiś czas
emisji reklamy zwiększa ilość cech przypisywanych produktowi?
Otwórzmy zbiór reklama.sav
Mamy tutaj do czynienia z dwoma etapami eksperymentu
Hipotezy badawcze jakie możemy postawić mogą być dwie:
Średnie przed i po emisji różnią się między sobą (test dwustronny)
Średnie różnią się między sobą, tak, że jedna jest większa od drugiej
(test jednostronny).
Uwaga: Zmienne muszą być na skali interwałowej lub ilorazowej
Procedura
Zmienna grupująca jest
nam niepotrzebna
Syntax dla naszej procedury
Pierwsza tabela to
statystyki opisowe
Syntax dla korelacji
Druga tabela zawiera
informacje o korelacji
pomiędzy zmiennymi w
tym przypadku zależność
jest duża i istotna
statystycznie, r=0,82,
p<0,001
Interpretacja testu t: najważniejsze komórki to t, df, oraz istotność
t= -2,29 (minus dlatego, że średnia pierwszego pomiaru jest mniejsza od
średniej drugiego pomiaru
Df=39 (liczba par pomiarów minus 1 tj. 40-1)
Poziom istotności (dwustronny) = 0,028 odrzucamy hipotezę zerową
bezkierunkową mówiącą że brak jest różnic pomiędzy „przed i po”
Gdybyśmy postawili kierunkową hipotezę uzyskany wynik 0,028/2 = 0,014 i
dopiero wtedy porównujemy z p. W obu przypadkach należy odrzucić
hipotezy zerowe.
W przypadku testu jednostronnego całe
5% kumuluje nam się na jednej stronie
rozkładu stąd łatwiej odrzucić hipotezę
zerową - stąd konieczność rozsądnego
stawiania hipotez kierunkowych
Z dla 0,05 = 1,64
W teście dwustronnym 5% rozkłada się
po obu stronach rozkładu po 2,5 %, to
bezpieczniejsza „droga”. Test
jednostronny stosujemy wtedy, gdy
mamy pewność, że hipotezy zerowa i
alternatywna wyczerpują wszystkie
możliwe hipotezy, tzn.
prawdopodobieństwo, że prawdziwa
jest hipoteza zerowa lub alternatywna
jest równe 1. Użycie testu
jednostronnego w innym przypadku
zwiększa prawdopodobieństwo
przyjęcia hipotezy fałszywej, a więc
zwiększa błąd drugiego rodzaju.
Z dla 0,05 = 1,96
Podsumowanie
• Każdy test statystyczny ma swoje założenia.
Bez ich spełnienia nie powinniśmy go
przeprowadzać. W przypadku testów t,
założenia są takie:
1. Równoliczne grupy
2. Rozkład normalny zmiennej
każdej grupie
3. Jednorodne wariancje
4. Ilościowa zmienna zależna
zależnej
w
• Testy t są dosyć odporne na złamanie założeń.
Przyjmuje się, że jeśli grupy są równoliczne,
zaburzenie
rozkładu
oraz
jednorodności
wariancji nie wpływa negatywnie na wyniki.
Jednak jeśli mamy istotnie nierównoliczne grupy
(np. liczebność jednej 1,5x przekracza
liczebność drugiej, lub otrzymamy istotny test
chi2), powinniśmy zamiast testu t wybrać jego
nieparametryczny odpowiednik. W psychologii
dosyć często stosuje się także quasi-ilościowe
zmienne zależne (skale Likerta itd.). W
przypadku zmiennych typowo porządkowych, jak
poziom wykształcenia, czy stopień w wojsku,
lepiej stosować testy nieparametryczne.
Aby sprawdzić założenia testów parametrycznych należy dokonać kilku
analiz.
Otwórzmy plik kwiat.sav
Wykorzystując zbiór „kwiaty”, możemy sprawdzić, czy badane grupy są
równoliczne: na skali 1-10 mierzono szerokość uśmiechu kobiet, którym 8
marca wręczono tulipana, lub różę. Okazało się, że tulipany są mniej
popularne i zbadano 17 kobiet z tulipanem i 27 z różą.
Sprawdźmy równoliczność grup testem chi - kwadrat
Zmienną niezależną (grupującą)
przerzucamy do okienka po
prawej stronie.
Domyślnie zaznaczona jest opcja
„wszystkie kategorie są równe”,
zatem SPSS będzie oczekiwał, że
każda kategoria będzie miała taką
samą liczebność. Można jednak
wpisać procentowe wartości dla
każdej kategorii i np. testować
założenie, że jednak kategoria jest
dwukrotnie liczniejsza od drugiej.
Syntax dla testu chikwadrat
Po wykonaniu analizy otrzymujemy raport:
Mieliśmy 44 badane kobiety, więc
przy równych kategoriach SPSS
oczekuje 22 kobiet w każdej grupie.
Rozkład otrzymany różni się jednak
od oczekiwanego. Im większe są
reszty, tym większe różnice.
Mimo sporej różnicy kobiet w
grupach test chi2 okazał się
nieistotny. Możemy założyć, że
grupy są równoliczne.
Otrzymany
zapisać:
wynik
2(1) = 2,27; p > 0,05
możemy
Rozkład normalny
W przypadku testu t dla prób niezależnych, powinniśmy sprawdzić, czy zmienna zależna ma
rozkład normalny w obu grupach, przy teście t dla prób zależnych, obie zmienne powinny
mieć rozkład normalny.
Normalność rozkładu sprawdzamy np. testem Kołmogorowa-Smirnowa. W naszym przypadku
musimy posłużyć się podziałem na podzbiory, by wykonać test K-S oddzielnie dla kobiet z
różą i tulipanem (dane-podziel na podzbiory-porównaj grupy i wrzucamy zmienną „kwiat”)
Syntax
podziel grupy
Przeprowadzamy test K-S: Analiza – testy nieparametryczne – K-S dla
jednej próby
Przerzucamy zmienną „uśmiech” na prawo i naciskamy OK.
W naszym przypadku w grupie tulipanowej nie
ma żadnego problemu z rozkładem normalnym:
Z = 0,67; p>0,05. W grupie różanej istotność
wynosi Z=0,73: p>0,05.
Pamiętajmy, że im mniej osób, tym trudniej
odrzucić H0, a zatem stosowanie testu K-S, tak
jak przy innych testach statystycznych ma sens,
gdy badamy minimum 20-30 osób w jednym
warunku.

similar documents