Document

Report
ANALISIS DATA KATEGORIK
Pertemuan III
•
•
•
•
Inferensia Tabel Kontingensi
Ukuran Asosiasi : Cohen’s Kappa
Ukuran Asosiasi Data Ordinal
Marginal dan Conditional Association
(Tabel Kontingensi 3 Arah)
Inferensia Tabel Kontingensi
– Penduga Selang Parameter Ukuran Asosiasi (sampel
besar)
– Uji Independensi tabel 2 arah
– Chi-Square Test
– Tabel 2 arah data ordinal
– Tabel 3 arah
– Uji eksak untuk data sampel kecil
Namun dilihat dulu mengenai inferensia untuk
proporsi, Agresti Bab 1.3
Novi Hidayat Pusponegoro
Interval Konfidensi untuk selisih proporsi
• CI (1-α )x100% untuk menduga 1 − 2 :
ˆ1  ˆ 2   z ˆ ˆ1  ˆ 2 
2
dengan
  1 1   1   2 1   2  

ˆ ˆ1  ˆ 2   

n2
 n1

Novi Hidayat Pusponegoro
Interval Konfidensi untuk θ
• Distribusi sampling nilai penduga OR tidak
simetris, meliputi nilai nol s.d positif tak hingga
• Solusi: menggunakan log (θ) atau log (), nilainya
meliputi negatif tak hingga s.d positif tak hingga
dan distribusinya menjadi asymptotic normal
sehingga memudahkan dalam inferensi
• CI (1-α )x100% untuk menduga log (θ) :
Novi Hidayat Pusponegoro
Interval Konfidensi untuk RR
Jika RR (r),
menduga r adalah :
maka CI (1-α)x100% untuk
Dengan
Novi Hidayat Pusponegoro
Interval Konfidensi
• Yang biasa digunakan adalah interval
konfidensi 95%, yang berarti bahwa estimasi
range yang kita lakukan memiliki 95%
kesempatan mengandung nilai populasi yang
benar atau
• Masih memiliki 5% kesempatan bahwa range
yang kita buat tidak mengandung nilai
populasi yang benar
Novi Hidayat Pusponegoro
Interval Konfidensi
• Jika kita menginginkan peluang yang lebih
kecil untuk terjadinya error, maka bisa
digunakan interval konfidensi 99%.
Konsekuensinya adalah range-nya lebih lebar
• Jika peluang terjadinya error lebih besar masih
bisa diterima maka bisa menggunakan interval
konfidensi 90%
Novi Hidayat Pusponegoro
INFERENSIA TABEL 2X2
• Secara umum, uji hipotesis yang ingin diuji dalam
tabel kontingensi 2x2 adalah:
– Ho: Tidak terdapat hubungan antara variabel X dan Y
– H1: Terdapat hubungan antara variabel X dan Y
Novi Hidayat Pusponegoro
Statistik Uji
Pearson 
– Untuk tabel kontingensi i x j, rumus umunya
dinyatakan sebagai:
2
=


 −
2

i = indeks baris dan j = indeks kolom
 = frekuensi harapan jika Ho diterima,
dinyatakan sebagai  =
 

, dengan 
merupakan jumlah observasi berdasarkan baris
ke-i dan  menyatakan jumlah observasi
berdasarkan kolom ke-j
Novi Hidayat Pusponegoro
Statistik Uji
• Bentuk statistik uji  2 khusus untuk tabel 2x2:
2 =
− 2 
1 2 1 2
• Distribusi statistik uji  2 mendekati distribusi
chi-square dengan derajat bebas (banyak baris
dikurangi satu) dikalikan dengan (banyak
kolom dikurangi satu), jika Ho benar.
(Karl Pearson, 1904)
Novi Hidayat Pusponegoro
Statistik Uji
• Untuk tabel 2x2, statistik uji  2 akan
mendekati distribusi chi-square dengan
derajat bebas 1, jika tidak ada hubungan
antara paparan dan penyakti, sehingga tabel
untuk distribusi ini dapat digunakan untuk
mendapatkan tingkat signifikansi (p-value)
• Statistik uji  2 valid digunakan jika tidak ada
sel yang memiliki frekuensi cukup kecil. SPSS,
expected count kurang dari 5
Novi Hidayat Pusponegoro
Statistik Uji
• Khusus untuk tabel 2x2, Yates (1934)
mengusulkan rumus yang memuat koreksi
(continuity correction) ketidaksesuaian
pendekatan distribusi kontinu chi-square pada
distribusi sampling statistik uji  2 yang
bersifat diskrit:
2
•  =
−


1 2
−
2
atau  2 =
Novi Hidayat Pusponegoro
 2
−−
2
1 2 1 2
Statistik Uji
Uji Rasio Likelihood

 =


   

• Kriteria pengambilan keputusan sama dengan
apabila digunakan statistik  2 , karena
distribusi pendekatan  2 adalah juga
 2 (−1)(−1)
• Jarang digunakan, rumit
• Nilai  2 tidak akan jauh berbeda dengan  2
Novi Hidayat Pusponegoro
Cross Sectional Study
• Untuk menguji hipotesis ada tidaknya
hubungan diantara paparan dan penyakit,
digunakan uji chi-square (sda)
Novi Hidayat Pusponegoro
Contoh 1:
• Tabel berikut adalah hasil dari case
control study yang dilakukan di
sebuah restaurant.
• OR = ad =
bc
(218)(85) = 19.6
(45)(21)
Novi Hidayat Pusponegoro
• Interval konfidensi 95% adalah
11.0-34.9 (Peluang range 11.0-34.9
mengandung OR yang benar
adalah 95%)
• Batas Bawah CI = 11.0 (>1)
• Kesimpulan: orang yang makan
salsa benar-benar lebih cenderung
untuk menderita Hepatitis A
dibandingkan dengan orang yang
tidak makan salsa
Novi Hidayat Pusponegoro
Contoh 2:
• Penelitian berkaitan dengan wabah
Salmonella di sebuah kapal pesiar
• Adakah perbedaan signifikan pada
jumlah orang yang terkena wabah
Salmonella antara orang yang
makan tomat dengan yang tidak
Novi Hidayat Pusponegoro
• Untuk melakukan uji chi-square,
kondisi ini harus terpenuhi:
– Jumlah observasi total minimal
adalah 30
– Setiap sel dalam tabel harus berisi 5
atau lebih
• Untuk melakukan uji Chi-Square, kita
membandingkan data observasi (hasil
penelitian) dengan data yang kita
harapkan
Novi Hidayat Pusponegoro
• Penghitungan frekuensi harapan:
Row Total x Column Total
Grand Total
Novi Hidayat Pusponegoro
Novi Hidayat Pusponegoro
• Menghitung statistik chi-square-nya:
• [(Observed – Expected)2/Expected]
untuk tiap sel di dalam tabel
• The chi-square (χ2) adalah 19.2
– 8.7 + 2.2 + 6.6 + 1.7 = 19.2
– (Chi square tabel dengan df 1 = 3.84)
– Tolak Ho, ada hubungan antara makan
tomat dengan wabah salmonella
Contoh 3:
• Dalam suatu studi longitudinal yang
dilaksanakan di suatu perusahaan, karyawan
perusahaan ditanya tentang berbagai
pertanyaan mengenai lingkungan kerjanya
dan kemudian karyawan ini diikuti selama
periode waktu 10 tahun. Data hasil
pengamatan disajikan dalam tabel berikut.
Kejadian
CHD
Ya
Apakah anda bekerja
di bawah tekanan?
Total
Tidak
Ya
97
307
404
Tidak
200
1409
1609
297
1716
2013
Total
Novi Hidayat Pusponegoro
bekerj a di bwh tekanan * kej adian CHD Crosstabulation
Count
bekerja di bwh
tekanan
kejadian CHD
ya
tidak
97
307
200
1409
297
1716
ya
tidak
Total
Nilai statistik
uji chi-square
Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
P-value
Chi-Square Tests
Value
34.428b
33.513
31.133
df
1
1
1
Asymptotic
Sig nificance
.000
.000
.000
Exact
Sig nificance
(2-sided)
.000
34.411
1
2013
a. Computed only for a 2x2 table
b. 0 cells (.0%) expf < 5. Min exp = 59.61...
Novi Hidayat Pusponegoro
Total
404
1609
2013
.000
Exact
Sig nificance
(1-sided)
.000
Risk Estimate

Value
Odds Ratio for bekerja di
bwh tekanan (ya / tidak)
For cohort kejadian CHD
= ya
For cohort kejadian CHD
= tidak
N of Valid Cases
95% Confidence
Interval
Lower
Upper
2.226
1.696
2.922
1.932
1.555
2.399
.868
.819
.919
2013
interval konfidensi 95%
untuk RR
Novi Hidayat Pusponegoro
Catatan:
Novi Hidayat Pusponegoro
• Uji Chi Square mengasumsikan
bahwa observasinya adalah
independent (nilai dari satu
observasi tidak bergantung dari nilai
observasi lainnya)
• Jangan gunakan Chi-Square pada:
– Pengulangan observasi pada kelompok
orang yang sama (misalnya: pre dan
post tes)
– Matched pair design ( case dan control
akan dicocokkan pada variabel seperti
JK dan usia.
Ukuran Asosiasi Data Ordinal
Jika X dan Y ordinal, maka asosiasi antara X dan Y, bisa sejalan X
naik, Y naik - vice versa. Selanjutnya, untuk masing-masing
pasangan variabel dinyatakan sebagai pasangan;
Concordant, jika subjek memberikan ranking tinggi pada variabel
X dan Y
Discordant, jika subjek memberikan ranking tinggi pada variabel
X namun memberikan ranking rendah pada Y
Novi Hidayat Pusponegoro
Ukuran Asosiasi Data Ordinal (2)
Ukuran Asosiasi Gamma
dengan estimasi :
ContohP: Agresti, page 57-59
Interpretasi nilai Gamma
Novi Hidayat Pusponegoro
Uji Independensi tabel 2 Arah data ordinal
Novi Hidayat Pusponegoro
• Agresti, page 86-87
Novi Hidayat Pusponegoro
Uji Independensi tabel 2 Arah data ordinal (2)
Ukuran Asosiasi (lanjutan): Cohen’s Kappa
• Digunakan jika variabel kolom dan baris memiliki level/kategori
yang sama, maka asosiasi terhadap variabel tersebut adalah
ukuran kesepakatan.
• Contoh:
– penelitian untuk melihat penilaian terhadap produk
– Penilaian juri kontes X Factor
• Interpretasi nilai Cohen’s Kappa:
– Independent, jika nilainya sama dengan nol
– Akan menunjukkan hubungan jika lebih dari nol
– Menunjukkan hubungan yang kuat jika mendekati 1
Contoh : Azen, page 61
Novi Hidayat Pusponegoro
Tabel Kontingensi 3 Arah
Marginal dan Conditional Association
– Simpson;s Paradox, jika marginal association berbeda arah
dengan cond. Association
Cond. asc
marginal. asc
Novi Hidayat Pusponegoro
Marginal dan Conditional Odds Ratio
– Simpson;s Paradox, juga dapat tergambarkan melalui ukuran
odds
– Conditional Odds Ratio:
– Marginal Odds Ratio:
Dari tabel 2.6 diatas:
• Nilai Odds ratio digunakan untuk memperlihatkan
kecenderungan pemberian hukuman pada pelaku berkulit putih
dan hitam
• Nilai COR untuk Z=White adalah 0.43, dan Z= Black adalah 0 ->
keduanya menunjukkan pelaku kulit hitam lebih cenderung untuk
dihukum
• Nilai MOR (tanpa mempedulikan ras dari korban ), adalah 1,45 ->
menunjukkan pelaku kulit putih lebih cenderung untuk dihukum
Novi Hidayat Pusponegoro
Marginal dan Conditional Independence
Novi Hidayat Pusponegoro
Homogenous Association/ Asosiasi homogen
Hubungan antara variabel X, Y dan Z ,merupakan asosiasi
homogen jika:
Menyatakan:
– Tidak ada efek interaksi antara 2 variable, berdasakan level
pada variabel ke3
– Tidak ada interaksi 3 variabel
– Cond. Indep. merupakan contoh khusus dari asosiasi homogen
– Jika salah satu dari syarat diatas tidak terpenuhi, maka cond.
Odds ratio bergantung pada kategori variabel ke3
Novi Hidayat Pusponegoro
Uji Independensi tabel 3 Arah
Novi Hidayat Pusponegoro
• Azen, page 89-94
Uji Independensi tabel 3 Arah (2)
Novi Hidayat Pusponegoro
• Complete Independence
• Marginal Independence
Uji Independensi tabel 3 Arah (3)
Novi Hidayat Pusponegoro
• Conditional Independence
L
a
t
I
h
a
n
• Suatu penelitian retrospective telah dilakukan
pada semua orang laki-laki yang berumur 50-54
tahun selama periode 1 bulan menunjukkan
bahwa 55 orang yang meninggal karena cardio
vascular disease (CVD), 15 orang pada kelompok
high salt diet sebelum meninggal; sedangkan dari
35 orang meninggal karena penyebab lain, 5
dalam kelompok high salt diet. Buatlah :
– tabel 2x2
– kemudian hitung ukuran keeratan hubungan
antara high salt diet dengan kematian karena
CVD
– hitung 95% interval konfidensi untuk ukuran
keeratan hubungan tsb,
– selanjunya lakukan uji asosiasi apakah ada
hubungan antara high salt diet dengan CVD
Novi Hidayat Pusponegoro
L
a
t
I
h
a
n
• Seorang dokter ingin meneliti apakah penyakit
Cervical Cancer pada wanita disebabkan oleh usia
pada kehamilan pertama. Dari 48 wanita penderita
kanker ternyata ada 36 wanita yang usia kehamilan
pertamanya ≤25 tahun. Sedangkan dari 77 wanita
bukan penderita kanker, ternyata ada 35 wanita
yang usia kehamilan pertamanya>25 tahun.
a) Buatlah tabel kontingensi 2 x 2
b) Kemudian hitung ukuran keeratan hubungan
antara usia perkawinan pertama dengan
Cervical Cancer
c) Hitung 95% interval konfidensi untuk ukuran
keeratan hubungan tsb
d) Lakukan uji asosiasi, apakah ada hubungan
antara cervical cancer dengan usia kehamilan
pertama
Novi Hidayat Pusponegoro

similar documents