Korelasi dan Regresi

Report
Oleh:
Anwar, Dita, Erna
Program Studi Magister Biomedik
Fakultas Kedokteran Universitas Sumatera Utara
2011
Pendahuluan
Beberapa penelitian di bidang kedokteran sering ingin
menilai apakah ada hubungan antara dua variabel
(dependent dan independent) yang numerik.
contoh :
 Hubungan Index Massa Tubuh dengan kadar
kolesterol.
 Hubungan antara KGD dengan Kadar LDL pada pasien
DM.
 Analisis regresi  dapat diketahui bentuk
hubungan antara dua variabel (Prediksi dari data
yang ada).
 Analisis korelasi  untuk mengetahui eratnya
hubungan antara dua variabel.
 Semakin erat hubungannya maka semakin yakin
bahwa hubungan dua variabel tersebut adalah
hubungan sebab akibat.
 Analisis regresi dan korelasi didasarkan atas
hubungan yang terjadi antara dua variabel atau
lebih.
 Variabel yang digunakan untuk meramal
disebut variabel bebas (independen). Dapat
lebih dari satu variabel.
 Variabel yang akan diramal  variabel
respons (dependen). Terdiri dari satu
variabel.
A. Diagram Tebar (Scatter plot)
 Diagram tebar adalah diagram dengan memakai
garis koordinat dengan axis X dan ordinat Y.
 Tiap pengamatan diwakili oleh satu titik.
 Hubungan antara variabel dapat berupa garis lurus
(linier), garis lengkung (kurva linier) atau tdk
terlihat pola tertentu.
 Dapat berupa garis regresi positif atau negatif.
Contoh
 linier positif
 linier negatif
Kekuatan Hubungan
 Bila titik-titik menebar pada satu garis lurus, maka
kekuatan hubungan antara kedua variabel tersebut
sangat sempurna.
 Kekuatan hubungan dapat dikuantifikasi melalui
suatu koefisien yaitu koefisien korelasi (r pearson).
 Koefisien ini akan berkisar antara 0 – 1.
bila r = 0  tidak ada hubungan linier.
r = 1  hubungan linier sempurna.
0-1 = bila mendekati 1 semakin kuat
hubungannya, bila mendekati 0 semakin
lemah hubungannya.
 Lihat tandanya apakah korelasi positif atau negatif.
Interval Koefisien
Tingkat Hubungan
0.000 – 0.199
Sangat rendah
0.200 – 0.399
Rendah
0.400 – 0.599
Sedang
0.600 – 0.799
Kuat
0.800 – 1.000
Sangat kuat
Rumus koefisien korelatif
(Pearson)
n(∑XY) – (∑X) (∑Y)
r=
√[(n∑X2) – (∑X)2] [(n∑Y2) – (∑Y)2]
Ket: n = jumlah sampel
X = nilai pada ordinat X
Y = nilai pada ordinat Y
Contoh..
No
X (SGOT)
Y (HDL)
XY
X2
Y2
1.
2.
3.
4.
5.
6.
7.
12.7
11.3
13.5
15.1
17.9
19.3
15.5
42.2
41.2
42.3
42.8
43.8
44.5
45.5
535.94
465.56
571.05
646.28
784.02
858.85
705.25
161.29
127.69
182.25
228.01
320.41
372.49
240.25
1780.84
1697.84
1789.29
1831.84
1918.44
1980.25
2070.25
∑
105.3
302.3
4566.95
1632.39
13068.35
n(∑XY) – (∑X) (∑Y)
r=
√[(n∑X2) – (∑X) 2] [(n∑Y2) – (∑Y)2]
7 (4566.95) – (105.3) (302.3)
r=
= 0.768
√[(7x1632.39) – (105.3)2] [(7x13068.35) – (302)2]
Scatter Plot
Hubungan Kadar SGOT dengan Kadar HDL
46
45
HDL
44
43
42
41
40
10
12
14
16
SGOT
18
20
Kesimpulan hasil
 Dilihat dari besarnya r yang mendekati 1, maka
hubungan antara SGOT dengan HDL adalah kuat.
 Berpola linier positif
 Maka makin tinggi SGOT maka akan semakin
tinggi kadar HDL.
Koefisien Determinasi
 R = r2
 Yaitu besarnya proporsi variasi Y yang dapat dijelaskan
oleh variabel X.
 Apabila r = 1 maka R = 100%
X memegang peranan dalam perubahan Y. bila terjadi
perubahan X, maka Y akan berubah.
Pada kasus diatas r = 0.768 maka R = r2
R= (0.768)2 = 0.59  59%.
Hal ini berarti HDL dapat dijelaskan oleh Variabel SGOT
sebesar 59%.
Uji Hipotesis koefisien Korelasi
 Pengujian signifikansi Selain menggunakan tabel r, juga
dapat dihitung dengan uji t. rumusnya:
t=
r√(n-2)
√(1-r2)
df= n-2
bila t hitung > t tabel, Ho di tolak
bila t hitung < t tabel, Ho diterima
dk
5%
1%
1
0,887
1,000
2
0,950
3
dk .
5%
1%
24
0,388
0,496
0,999
25
0,381
0,487
0,878
0,959
26
0,374
0,478
4
0,811
0,917
27
0,367
0,470
5
0,754
0,874
28
0,361
0,463
6
0,707
0,834
29
0,355
0,456
7
0,666
0,798
30
0,349
0,449
8
0,632
0,765
35
0,325
0,418
9
0,602
0,735
40
0,304
0,393
10
0,576
0./08
45
0,288
0,372
11
0,553
0,684
50
0,273
0,354
12
0,532
0,661
60
0,250
0,325
13
0,514
0,641
70
0,323
0,302
14
0,497
0,623
80
0,217
0,283
15
0,482
0,606
90
0,205
0,267
16
0,468
0,590
100
0,195
0,254
17
0,456
0.575
125
0,174
0,228
18
0,444
0,561
150
0,159
0,208
19
0.433
0,549
200
0,138
0,148
B. Regresi Linier
 Persamaan garis Linier :
Y = a + bX
 Pada persamaan ini harus jelas dan tentukan mana
variabel Y (dependen) dan variabel X (independen).
Penetapan disesuaikan dengan tujuan analisis.
 Biasanya variabel Y  lebih sulit diukur
 Variabel X  lebih mudah diukur
 Mengapa?
 Karena dari persamaan garis regresi linier, kita dapat
melakukan banyak hal. Contohnya : menduga satu
nilai variabel dependen berdasarkan nilai variabel
bebasnya.
 Dari contoh kasus diatas, SGOT merupakan variabel
bebas dan HDL merupakan variabel terikat. Sehingga:
HDL = a + b SGOT
 Garis linier dapat digambarkan bila koefisien a dan b
diperoleh.
Metode kuadrat terkecil
b=
n(∑XY) – (∑X) (∑Y)
n∑(X)2 – (∑X)2
Koefisien b = besarnya perubahan nilai variabel Y
apakah nilai variabel X berubah sebesar satu unit
(satuannya)
Koefisien a = nilai awal/intercept  besarnya nilai
variabel Y, bila variabel X = 0
a = y - bx
 Maka dari contoh soal diatas dapat dihitung:
n(∑XY) – (∑X) (∑Y)
b=
n∑(X)2 – (∑X)2
b=
7x4566.95 – (105.3x302.3)
7x1632.39 –
(105.3)2
a= y – bX
= (302.3/7) – (0.403)(105.3/7) = 37.123
Maka HDL = 37.123 + 0.403 SGOT
= 0.403
Regresi Linier Ganda
 Contoh kasus diatas adalah Regresi linier sederhana.
 Hubungan 1 variabel dependen biasanya tidak hanya
dengan satu variabel saja.
 Variabel X lebih dari 1.
maka : Y = a + b1X1 + b2X2 + …….+bpXp
 Hasilnya sudah terkontrol koefisien b terhadap
variabel bebas lain yang berada dalam model.
 Dalam hal ini koefisien determinasi (R) cukup
penting. Untuk menjelaskan variabel X yang kita pilih
dapat menjelaskan variasi Y.
soal
 sebuah penelitian untuk mengetahui apakah ada
hubungan antara Hb'ibu hamil dengan berat badan
bayi lahirnya.
 Peneliti mengumpulkan data sebanyak 20 responden,
melalui catatan medik di salah satu rumah sakit di
Jogjakarta.
 Hasil pengumpulan data kemudian di masukkan pada
tabel berikut ini:
No
Hb
BBL
No
Hb
BBL
1
2
3
11.2
11.3
11.5
2500
2450
2500
11
12
13
10.7
10.1
10.3
2700
2560
2600
4
10.6
2450
14
11.9
2700
5
6
7
10.7
10.5
11.6
2470
2490
2510
15
16
17
12.1
12.2
11.9
3200
3400
3000
8
9
11.7
11.3
2570
2600
18
19
12.5
12.3
3200
3400
10
11.4
3000
20
12.4
3400
soal
 Tentukan lah :
 Koefisien korelasi nya dan interpretasi nya
 Korelasi determinasi nya dan interpretasi nya.
 persamaan regresi linier nya
 Berapa perkiraan nilai BBL jika Hb ibu 11,8
No
X
Y
X2.
1
11.2
2500
125.44
' 6250000
28000
2
11.3
2450
127.69
6002500
27685
3
11.5
2500
132.25
' 6250000.
28750
4
10.6
2450
112.36 .
6002500
25970
5
10.7
2470
114.49 •
6100900
26429
6
10.5
2490
110.25
6200100
26145
7
11.6
2510
134.56
6300100
29116
8
11.7
2570
136.89
6604900
30069
9
11.3
2600
127.69 '
6760000
29380
10
11.4
3000
129.96
9000000
34200
11
10.7
2700
114.49
7290000
28890
12
10.1
2560
102.01
6553600
25856
13
10.3
2600
106.09
6760000
26780
14
11.9
2700
141.61
7290000
32130
Y*
X.Y

similar documents