Sunu 2 TIKLA İNDİR

Report
ÖNEMLİLİK TESTLERİ
Elde edilen değerlerin yada varılan sonuçların
istatistiksel olarak önem taşıyıp taşımadığını yada
anlamlı olup olmadığını test etmek için başvurulan
yöntemlerdir.
Önemlilik testlerinden elde edilen sonuçlara göre bazı
kararlara varıldığı için testlerin doğru ve uygun
seçilmesi bilinçli olarak kullanılması ve yorumlanması
gerekir.
Örnekleme yoluyla sağlanan bilgiden hareketle;
Örneğin;
 Kliniklerde hasta hayvanlara uygulanan yeni bir
tedavi yönteminin eskisine kıyasla bir farklılık gösterip
göstermediği;
 Aşı üretiminde kullanılan kimyasal metotta yapılan
bir değişikliğin ürünün kalitesini arttırıp arttırmadığı,
 Yeni geliştirilen bir ilacın hastalığın tedavisinde etkili
olup, olmadığı ve benzeri tip konularda karar
verilmesi istenebilir.
 Hayvanlara
uygulanılan tedavi yöntemleri
 Yeni kimyasal yöntem/ yöntemleri
 Yeni tip ilacın eskisi ilaca göre farklılık
göstermesi olağan olabilir.
Asıl önemli olan ortaya çıkabilecek farkların,
istatistiksel açıdan anlamlı olup, olmadığını
araştırılmasının gerekliliğidir.
Diğer bir deyişle, bu farkların gerçekten mi
yoksa rastgele seçimin sonucu olan
örnekleme
hatalarından
mı
meydana
geldiğinin incelenerek istatistiksel kararın
verilmesi gerekmektedir.

Sözü edilen kararın alınmasında;
istatistik hipotezleri olarak adlandırılan
hipotez testleri kullanılmaktadır.
Önemlilik testleri bir hipotezi test
etmek için yapılır.

HİPOTEZ: Bir önyargıdır.
HİPOTEZ
2 tip hipotez vardır.
Ho hipotezi (Farksızlık/ sıfır/ yokluk Hipotezi)
 HA hipotezi (Alternatif Hipotez)

Ho HİPOTEZİ
Bir testte öne sürülen ve asıl test edilmek
istenen hipotezdir.Örneğin;
Yeni bir konunun eski bir konuya nazaran üstün
olmadığı,
 Gözlemlenen farkın örneklemden ileri geldiği
 Diğer bir ifade ile; rastgele seçiminden oluştuğunun
formülünü veren hipotezdir.
 “H0” ile gösterilir.

HA hipotezi (Alternatif Hipotez)
Ho hipotezine karşı kurulan hipotezdir.
Kitle parametrelerinin genelde aynı kaldığını ve
bütün karar problemlerinde standart bir şekilde
formüle edildiğini veren sıfır hipotezine karşın,
Verilecek kararın niteliğine göre farklı karar
problemlerinde değişik şekillere göre formüle
edilen hipoteze alternatif hipotez denir ve “HA” ile
gösterilir.


H0 :
iki ortalama arasında fark yoktur
iki grup arasında fark yoktur
iki değişken arasında bağ yoktur
ortalama 100’e eşittir
HA: iki ortalama arasında fark vardır
iki grup arasında fark vardır
iki değişken arasında bağ vardır
ortalama 100’den farklıdır/ küçüktür/ büyüktür.
Örnek Hipotezler
Ho: Sakız ve İvesi koyunlarının süt verim
ortalamaları birbirine eşittir.
Ho: Xs=Xi
HA: Sakız ve İvesi koyunlarının süt verim
ortalamaları birbirine eşit değildir.
HA: Xs Xi Xs  Xi veya Xs Xi
Yanılma Düzeyi
Bir hipotez kabul yada red edildiğinde her
zaman doğru sonuca varıldığı yada varılan
kararın doğru olduğu söylenemez. Burada 2
tip hata ortaya çıkabilir.
TİP1 Hata: doğru Ho’ın yanlışlıkla red
edilmesi
 TİP2 Hata: yanlış Ho’ın red edilmemesidir

Yanılma Düzeyi /Hata Tipleri
Karar
Hipotez
Doğru
Kabul etme
Reddetme
Doğru Karar
Tip I Hata

(önemlilik düzeyi,
yanılma olasılığı)
Yanlış
Tip II Hata
ß
Doğru Karar






Hata istenmeyen bir durumdur.
O nedenle, hem ’nın hem ß’nın küçük
olması istenir.
 ile ß arasında yakın bir ilişki vardır. 
büyürken ß küçülür,  küçülürken ß büyür.
N büyüdüğünde hem  hem ß küçülür.
Hipotez testi yapılırken,  önceden seçilir.
Böylece red bölgesi hesaplanır.
 için genellikle 0.01, 0.05 ve 0.10 alınır.
Örnek
Bir peynir üretim sürecinde, üretimin 500 gr.’lık
paketler halinde gerçekleştirilmesi planlanmıştır.
Üretimin planlandığı gibi gerçekleşip
gerçekleşmediğini kontrol amacıyla rastgele 100 paket
seçilmiştir.
Bu paketler için ortalama ağırlık 495 gr., standart
sapma ise 20 gr. olarak hesaplanmıştır.
 = 0.05 önemlilik düzeyi için, üretimin planlandığı gibi
gerçekleştiği söylenebilir mi? Karar veriniz.
1. Adım: Hipotezlerin kurulması
Peynir paketlerinin belirlenen ortalama ağırlığı (500
gr.dır. Bu nedenle, burada sıfır hipotezi, üretilen
peynir paketlerinin ortalama ağırlığının 500 gr.
olduğu yönündedir. Bu iddiayı, 500 gr.’dan hem
küçük, hem de büyük yöndeki anlamlı ağırlık
farklılıkları çürütecektir. Başka bir ifadeyle, bu
anlamlı farklılıklar üretimin planlandığı gibi
gerçekleşmediğini gösterecektir. Buna göre
yapılacak test için hipotezler:
 H0 : m = 500 gr.
 HA : m ≠ 500 gr.
şeklinde kurulmalıdır.
2. Adım: Uygun test istatistiğinin belirlenmesi
3. Adım: Anlamlılık düzeyinin belirlenmesi
4. Adım: Karara varılması
ÖNEMLİLİK TESTLERİ
1. İki ortalama arasındaki farkın önemlilik testi (Student
T Test)
2. İkiden çok ortalamalar arasındaki farkın önemlilik
testi (Varyans Analizi)
3. Ki-Kare testi
4. Korelasyon ve Regresyon Analizi
İki ortalama arasındaki farkın
önemlilik testi (Student T Test)
Ölçümle belirtilen sürekli bir değişken yönünden bağımsız iki grup
arasındaki farkı test etmek için kullanılan önemlilik testidir.
Örnekler:
1. Kandaki hemoglobin miktarı yönünden iki koyun ırkı (sakızakkaraman) karşılaştırmada kullanılır.
2. Kandaki glükoz miktarı yönünden iki cinsiyet (dişi- erkek)
karşılaştırmada kullanılır.
3. Vücut ağırlığı yönünden iki etçi sığır ırkını(angus- şarole)
karşılaştırmada kullanılır.
4. ….
5. ….
6. ….
Test işlemleri
1. Hipotezin kurulması
2. Test işlemleri, Test istatistiğinin (t) hesaplanması
1 Grubun
Varyansı
Formül:
Ortak Varyans
3. Yanılma olasılığının seçilmesi α=0,05
4. Serbestlik derecesinin belirlenmesi SD=n1+n2-2
5. α=0,05 ve n1+n2-2 serbestlik dereceli t Tablo değerinin bulunması
6. Karşılaştırma:
t hesap < t tablo
t hesap > t tablo
7. Karar ve Yorum……
ise H0 kabul edilir.
ise H0 red edilir.
2 Grubun
Varyansı
Örnek: İki farklı rasyonun CA üzerine etkisinin araştırıldığı bir
çalışmada, 60 kuzu 2 eşit grubu ayrılıyor.1 ay sonunda rasyon
gruplarından elde edilen sonuçlar aşağıda verilmiştir.
1. RASYON
2. RASYON
8,860 kg
8,300 kg
S
0,560 kg
0,567 kg
S2
0,3136
0,3215
n
30
30
HA: Xs Xi
1. Hipotezin kurulması : Ho: X1=X2
2. Test işlemleri:
HA: X1 X2
3. α=0,05
4. SD= 30+30-2= 58
5. α=0,05 ve 58 serbestlik dereceli t Tablo= 2.00
6. Karşılaştırma
t hesap =3,85< t tablo =2,00
için H0 red edilir.
7. Karar ve yorum: İki farklı rasyonun CA üzerine etkisi farklılık
göstermektedir. 1. tip rasyonla beslenen kuzular daha çok CA
kazanmışlardır.
İkiden çok ortalamalar arasındaki farkın
önemlilik testi (Varyans Analizi)
Ne Zaman Kullanılır?
Parametrik test varsayımları sağlandığında, 2’den fazla
grubun ortalamasını karşılaştırılmak için kullanılan bir
yöntemdir. Grup ortalamalarının karşılaştırıldığı bir testin
adının neden varyans analizi olduğu, test istatistiğinin
hesaplanmasında, grup ortalamaları ile birlikte grup
varyanslarının da çok önemli olmasına bağlanabilir.
24
Tek yönlü varyans analizi örnekleri:

Anne yaşı <20, 20-29 ve 30+ olarak gruplandığında,
anne yaşının bebek doğum ağırlığı üzerine etkisinin
incelenmesi durumunda,

Otuz farenin tamamen rasgele olarak üç farklı diyet
grubuna dağıtıldığı bir çalışmada, deney sonunda
farelerin serum vitamin A değerleri bakımından diyet
türlerinin karşılaştırıldığı bir çalışmada
 …………

tek yönlü varyans analizi kullanılır.
25
Varyans Analizinin Varsayımları:
Her gruptaki değerler kendi içinde normal dağılım
göstermelidir. Dağılımlar oldukça çarpıksa ve
gruplardaki denek sayıları eşit değilse problemler
ortaya çıkacaktır. Ayrıca gruplardaki denek sayılarının
az olması da önemli bir problem olabilir.
Grup varyansları eşit olmalıdır. Gruplara deneklerin
rasgele atanmış olmaları bu varsayımın sağlanmasına
yardımcı olacaktır.
Gruplar içinde ve gruplar arasında elde edilen
gözlemler bağımsız olmalıdır.
26
Hipotezler:
Ho: Grupların ortalamaları arasında fark yoktur.
H1.:En az bir grup ortalaması diğerlerinden farklıdır.
H 0 : 1   2  ...   k
H1 : En az bir  j farklı
27
VARYANS ANALİZİ İLE İLGİLİ BAZI TERİMLER
1. Genel Ortalama (Grand Mean)
Genel ortalama, elde edilen bütün verilerin toplam
denek sayısına bölünmesi ile elde edilir.
X GO
x


N
28
2. Grup Ortalaması
İncelenen grupların ayrı ayrı
ortalamalarıdır. Her gruptaki bireylerin
aldıkları değerler toplanıp o gruptaki birey
sayısına bölünerek elde edilir.
Genel Kareler Toplamı (GnKT)
 İncelenen bütün bireylerin aldıkalrı değerlerin genel
ortalamadan farklarının kareleri toplanarak elde edilir.
 GnKT, grup içi (GİKT) ve gruplar arası (GAKT)
olarak ikiye bölünür. Varyans analizinin mantığı da
gruplar arası değişimin grup içi değişime oranının
karşılaştırılmasıdır.
 Eğer gruplar arası değişim grup içi değişimden fazla
ise, grup ortalamalarından en az birinin diğerlerinden
farklı olduğu söylenebilir.
GnKT   x 2 
( x ) 2
N
30
3. Gruplar Arası Kareler Toplamı (GAKT)
GAKT, her bir grup ortalamasının genel ortalamadan olan
farklarının kareleri toplanarak elde edilir. Karşılaştırılan grupların
ortalaması birbirine çok yakın ise,
gruplar arası değişim küçük
olacaktır. Grup sayısı k ile gösterildiğinde, gruplar arası değişime
ilişkin serbestlik derecesi k-1 olacaktır.
Gruplar arası değişimin kendi serbestlik derecesine bölünmesi ile
gruplar arası kareler ortalaması elde edilir.
 ( x j ) 2  ( x ) 2

GAKT   
 nj 
n
j 1 

k
31
4. Grup İçi Kareler Toplamı (GİKT):
GİKT, her bir gruptaki bireylerin içinde bulundukları grubun
ortalamasından farklarının kareleri toplanarak elde edilir.
Gruplardaki gözlemler birbirine yakın değerler alıyorsa grup içi
değişim de küçük olacaktır.
Grup içi değişim için serbestlik derecesi :
sd = N – k olarak gösterilebilir. Grup içi değişimin kendi serbestlik
derecesine bölünmesi ile grup içi kareler ortalaması elde edilir.
GİKT=GnKT-GAKT
32
5. Gruplar Arası Kareler Ortalaması (GAKO):
Gruplar Arası Kareler Toplamı
GAKO 
k 1
6. Grup İçi Kareler Ortalaması (GİKO):
Gruplar İçi Kareler Toplamı
GiKO 
N 1
F test istatistiği:
F test istatistiği, gruplar arası kareler ortalamasının
grup içi kareler ortalamasına oranından elde edilir.
Gruplar Arası Kareler Toplamı / k  1
F
 GAKO / GiKO
Gruplar İçi Kareler Toplamı / N  k
34
Varyans Analizi Tablosu:
Değişim Kaynakları
sd
KT
KO
Gruplar arası
k-1
GAKT
GAKT/(k-1)
Grup içi
N-k
GİKT
GİKT/(N-k)
Genel
N-1
GnKT
F
GAKO/GİKO
Hesapla bulunan F değeri, tablodan elde edilen k-1 pay ve N-k payda
serbestlik dereceli F kritik değerinden büyükse H0 hipotezi reddedilir.
35
Örnek: Maymunlarda görülen 4 ayrı hepatit türünde
sedimentasyon değerlerinin farklılık gösterip göstermediğini
inceleyiniz.
Sıra No
Hepatit A
Hepatit B
Non A Non B
Delta Hepatit
1
35
45
75
70
2
50
52
53
62
3
40
80
48
88
4
20
65
50
47
5
26
73
65
78
6
32
44
36
56
7
18
67
57
61
8
45
48
71
76
40
65
9
n
8
8
9
9
j
266
474
495
603
2
j
9774
29412
28649
41639
33,25
59,25
55
67
x
x
xj
N = 34
 x =1838
 x =109474
2
36
Varyans Analizi Çözümü:
Kareler Toplamları:
GnKT   x 
2
( x ) 2
N
2
(1838)
 109474 
 10114
34
k  (  x j ) 2  ( x ) 2 ( 266) 2 (474) 2 (495) 2 (603) 2 (1838) 2

GAKT   






 5195

n
n
8
8
9
9
34
j 
j 1 

GİKT=GnKT-GAKT= 10114-5195=4919
37
Serbestlik Dereceleri:
GnSD (Genel serbestlik derecesi) = N-1 = 33
GASD (Gruplar arası serbestlik derecesi) = k-1 = 3
GİSD (Gruplar içi serbestlik derecesi) = N-k = 30
Kareler Ortalamaları:
GAKT 5195
GAKO 

 1731,7
GASD
3
GIKT 4919
GIKO 

 163,97
GISD
30
38
Varyans Anlaizi Tablosu:
Değişim
Kaynakları
Gruplar arası
sd
k-1= 3
KT
KO
F
5195
5195/3=
1731,7
GAKO/GİKO
4919/30=
163,97
10.56
Grup içi
N-k= 30
4919
Genel
N-1= 33
10114
Test işlemleri:
1. Hipotez: Ho: Gruplar arasında fark yoktur.
Ha: En az bir grup diğerlerinden farklıdır.
2. Test istatistiği: F=GAKO/GiKO= 1731,7/163,97 = 10,56
3. Yanılma Olasılığı: α= 0,05
4. Serbestlik derecesi (sd):
GASD= k-1= 4-1= 3
GiSD= N-k= 34-4= 30
5. Tablo değeri: Ek 3’deki F tablosu kullanılır.
Ftablo=F, GASD; GİSD
F0.05,3;30=2.92
6. Karşılaştırma:
Fhesap=10.56 > Ftablo=2.92 olduğundan Ho hipotezi
reddedilir.
7. Karar: Hepatit türlerindeki sedimantasyon
değerlerinden en az biri diğerlerinden farklıdır.
40
Çoklu Karşılaştırma Testleri
Varyans analizi sonucunda gruplar arasında fark yoksa
işlemler sona erer. Ancak, gruplar arasında fark varsa,
farklılığın hangi grup ya da gruplardan kaynaklandığı
(ya da farklılığın hangi gruplar arasında olduğu) değişik
yöntemlerle
araştırılabilir.
Bu
yöntemlere
çoklu
karşılaştırma yöntemler (multiple comparisons tests) ya
da Post-Hoc testler denir.
41
Çoklu Karşılaştırma Testleri
Bu karşılaştırmalardan Duncan Yöntemi, Tukey HSD
yöntemi ve Student-Newman-Keuls yöntemi daha çok
olası tüm ikili karşılaştırmaların yapılması amacıyla
kullanılmaktadır. Örneğin; varyans analizindeki grup
sayısı 4 ise, tüm olası ikişerli karşılaştırmalar;1-2, 1-3,
1-4, 2-3, 2-4 ve 3-4 gruplarının karşılaştırılmasıdır.
42
Çoklu Karşılaştırma Testleri
En küçük önemli fark yöntemi, her ortalamanın sadece bir kez
kullanıldığı karşılaştırmalar için uygundur. Bu tür karşılaştırmalara
dik (ortogonal) karşılaştırmalar denir. Örneğin, grup sayısı 4
olduğunda herbir ortalamanın bir kez kullanıldığı karşılaştırmalar;
1-2, 3-4, ya da 1-3 ve 2-4 ya da 1-4 ve 2-3’tür.
Dunnet yöntemi ise, çalışmadaki her bir deney grubunu kontrol
grubu ile karşılaştırmak için kullanılır.
43
Kİ-KARE TESTİ


Gözlenen frekanslarla beklenen frekanslar arasındaki farkın
anlamlı olup olmadığı temeline dayanan bir önemlilik testidir.
Ki-Kare analizinde niteliksel olarak belirtilen veriler kullanılır.
Örnek olarak:iyileşti – iyileşmedi, hasta – sağlam,
sosyoekonomik düzeyi iyi, orta, kötü gibi. Ayrıca ölçümle
belirtildiği halde sonradan nitelik haline dönüştürülerek
incelenmesi gereken verilere de ki – kare analizi uygulanabilir.
Örnek olarak: hemoglobin değerinin ölçülmesinden sonra
hemoglobin değeri belirli bir değerden az olanların anemik,
diğerlerinin normal olarak nitelendirilmesi.
KULLANILDIĞI YERLER
İki ya da daha çok grup arasında fark olup
olmadığının testinde
 İki değişken arasında bağ olup olmadığının
testinde
 Gruplar arası homojenlik testinde
 Örneklemden elde edilen dağılımın herhangi bir
teorik dağılıma uyup uymadığının testinde
kullanılır.

Uygulandığı düzenler
Dört gözlü düzen (2x2 düzeni)
Sağlıktan yakınma
Sigara kullanımı
Var
Yok
İçen
İçmeyen
Çok gözlü düzen (2x3 düzeni)
Beslenme
durumu
Yeterli
Yetersiz
Başarı durumu
İyi
Orta
Zayıf

Ki-Kare testinin doğru kullanılabilmesi için 2 temel
varsayımın yerine getirilmesi gerekmektedir.
1. Gruplar birbirinden bağımsız olmalıdır. Bağımlı
gruplara normal ki-kare testi uygulanamaz
2. Ki-kare dağılımı süreklidir. Beklenen
frekanslardan herhangi biri 5’den küçük ise
dağılım kesikli ve çarpık olur. 2x2 düzenlerde bu
gibi durumlarla karşılaşıldığında “Fisher kesin
ki-kare” (Fisher exact) testi uygulanır.
Dört gözlü düzende (2x2) Ki-kare testi
Örnek : Bir ilaç firması A hastalığına karşı yeni bir ilaç
bulmuştur. Bir kısım hastayı bu ilaçla, bir kısım hastayı da
eski ilaçla tedavi altına alarak kendi ilacının etkinliğini
araştırmıştır. İyileşme yönünden eski ilaçla yeni ilaç
arasında fark var mıdır?
İlaç
İyileşen
İyileşmeyen
Toplam
Yeni
21
27
48
Eski
11
29
40
Toplam
32
56
88
1 . Hipotez:
Ho: İyileştirme yönünden eski ilaçla yenisi arasında
fark yoktur.
Ha: İyileştirme yönünden eski ilaçla yenisi arasında
fark vardır.
2. Beklenen frekansların bulunması:
Her bir göz için orantı kurulur.
88 hastadan 32 hasta iyileşirse
48 hastadan x hasta iyileşir.
X= 48x32/88 = 17,5 Bu değer yeni ilaçla iyileşen
gözün beklenen frekansıdır.
İlaç
İyileşen
İyileşmeyen
Toplam
Yeni
21
27
48
( B1= 17,5)
(B2=30,5)
11
29
(B3= 14,5)
(B4=25,5)
32
56
Eski
Toplam
B1= 48 x 32/88= 17,5
B2 = 48 x 58/88= 30,5
B3 = 40 x 32/ 88= 14,5
B4 = 40 x 56/88 = 25,5
40
88
3. Test işlemleri
4. Yanılma olasılığı: α=0,05 seçilir.
5. Serbestlik derecesi:
Sd=(satır sayısı-1)x (sütun sayısı-1)
Sd= (2-1)x(2-1)=1
6. Tablo değerinin bulunması :
α=0,05 düzeyinde Sd=1
X2 tablo değeri 3,841 (Ek:10)
7. Karşılaştırma
X2 tablo değeri = 3,841 > X2 hesap değeri=2,427
Ho kabul edilir.
8. Karar
İyileştirme yönünden eski ilaçla yeni ilaç arasında fark
bulunmamaktadır.
Örnek: İki farklı aşı tipinin sığılarda leukozis hastalığı
üzerine etkisinin araştırldığı bir çalışmada elde edilen
sonuçlar tabloda verilmiştir. Leukozis görülme oranları
bakımından Aşı tipleri arasında fark var mıdır? (X2 tablo
değeri 3,841 )
Aşı tipi
Leukozis
Leukozis
(+)
(-)
Canlı Aşı
13
137
Atenue Aşı
28
122
Toplam
Toplam
KORELASYON ANALİZİ
İki ya da daha çok değişken arasında
ilişki olup olmadığı, ilişki varsa yönü ve
gücü korelasyon analizi ile incelenir.
 İki değişken arasındaki ilişkinin yönü
üç şekilde ortaya çıkabilir.

1.
İki değişken arasında pozitif bir ilişki vardır: Bir
değişken artarken diğeri de artıyorsa ya da biri
azalırken diğeri de azalıyorsa iki değişken
arasında pozitif bir ilişki vardır.
2. İki değişken arasında negatif bir ilişki vardır: Bir
değişken artarken diğeri azalıyorsa ya da biri
azalırken diğeri artıyorsa bu iki değişken arasında
negatif bir ilişki vardır.
3.İki değişken arasında bir ilişki yoktur: İki değişken
birbirinden tamamen bağımsızdır ve birbirini
etkilememektedir.
Korelasyon Katsayısı
İki değişken arasındaki ilişkinin gücünü
gösteren ölçü korelasyon katsayısıdır. “r”
sembolü ile gösterilir.
Değişkenler arasındaki ilişki pozitif ise “+”,
negatif ise “-“ olur. Korelasyon katsayısı 1≤r≤+1 arasında herhangi bir değer alabilir.
Her iki yönde 0’dan 1 ‘e doğru yaklaştıkça
ilişkinin kuvveti artar. 1’den 0’a doğru
yaklaştıkça ilişkinin kuvveti azalır, 0’a gelince
kaybolur.

Korelasyon katsayısı 0,0 – 0,50 arasında ise
ilişkinin zayıf, 0,50 – 1 arasında ise ilişkinin kuvvetli
olduğu kabul edilir.
Formül
r
 XY 
( X )( Y )
n
2
2




(
X
)
(
Y
)


2
2
 X 
  Y 

n  
n 

Örnek: Akkaraman koyunlarında Femur ve Tibia uzunlukları
tabloda verilmiştir. Femur ve Tibia arasındaki ilişkiyi yorumlayınız.
1
(X-Tibia)
2
(Y-Femur)
3
(X2)
4
(Y2)
5
(XY)
24
26
576
676
624
25
27
625
729
675
26
28
676
784
728
28
30
784
900
840
29
31
841
961
899
30
32
900
1024
960
31
33
961
1089
1023
32
34
1024
1156
1088
33
35
1089
1225
1155
34
36
1156
1296
1224
35
37
1225
1369
1295
38
40
1444
1600
1520
39
41
1521
1681
1599
40
42
1600
1764
1680
42
44
1764
1936
1848
 X  486
Y  516
X
2
 16186
Y
2
 18190
 XY  17158
r
r
 XY 
( X )( Y )
n
2
2




(
X
)
(
Y
)


2
2
 X 
  Y 

n  
n 

(486)(516)
15

(486) 2  
(516) 2 
16186
 18190

15  
15 

17158
r= 439.6/439.6=1
Femur ve Tibia Arasında çok güçlü pozitif yönlü bir ilişki
vardır.
Örnek: 10 başlık bir sığır sürüsünde canlı ağırlık ile
göğüs çevresi arasındaki ilişkiyi hesaplayınız.
Sığır
Ağırlık
(kg)
Göğüs
Çevresi
(cm)
1
2
3
4
5
6
7
8
9
10
641 620
633
651
640
666
650
688
680
670
205 212
213
213
213
217
218
219
221
226
REGRESYON ANALİZİ
İki değişken arasında bir ilişki bulunup
bulunmadığı, eğer varsa bu ilişkinin
derecesinin saptanması da istatistiksel
çözümlemelerde sık sık karşılaşılan bir
sorundur.
İstatistiksel
anlamda
iki
değişken arasındaki ilişki, bunların
değerlerinin karşılıklı değişimleri arasında
bir bağlılık şeklinde anlaşılır.
İki değişken arasında bir ilişki olduğunda, bu ilişki
dağılım grafiğindeki noktalar arasından geçen uygun bir
doğru ile tanımlanabilir. Bu doğruya regresyon doğrusu
denir ve matematiksel olarak bir denklem ile
tanımlanabilir. Bu denklemede regresyon denklemi
denir.
İstatistiksel anlamda iki değişken arasındaki ilişki,
bunların değerlerinin karşılıklı değişimleri arasında bir
bağlılık şeklinde anlaşılır. Gerçekten X değişkeninin
değerleri değişirken buna bağlı olarak Y değişkeninin
değerleri de değişiyorsa, bu ikisi arasında bir ilişki
bulunduğu söylenebilir.
Regresyonda değişkenlerin bağımlı değişken ve
bağımsız değişken(ler) olarak iki gruba ayrılması bir
zorunluluktur.
Bağımlı değişken, bağımsız değişken(ler) tarafından
açıklanmaya çalışılan değişkendir.
Regresyonda bağımlı değişken Y ve bağımsız
değişken(ler) de X ile gösterilir.
Regresyon doğrusunun denklemi:
y= a+bx
y: Bağımlı değişken
x: Bağımsız değişken
a: Doğrunun y eksnini kestiği nokta ???
b: Regresyon katsayısı ???
1. Regresyon katsayısı (b) hesaplanır.
b
 xy 
( x)( y )
2
x
 
n
( x ) 2
n
Regresyon katsayısı (b) her değeri alabilir, işareti artı veya eksi olabilir.
2.
x ve y değerlerinin ortalaması hesaplanır.
3. a değerleri hesaplanır.
4. Bulgular denkleme yazılır.
y= a + bx
yˆ
Örnek 1: Köpeklerde kemik kırıklarında kullanılan fiksatör plakların
sertlik(x) ve dayanıklılık(y) bakımından ilişkisi araştırılmaktadır. Bu
amaç için üretilen plaklardan arasından 10 parça seçilmiştir. Sertlik
ve dayanıklılık testi yapılmıştır. Veriler aşağıdaki gibidir. x ve y
arasındaki ilişkiye ait regresyon denklemini bulunuz.
Parça No
1
2
3
4
5
6
7
8
9
10
TOPLAM
x (Sertlik) y (Dayanıklılık)
7
9
5
8
6
9
7
4
8
7
70
10
12
6
9
8
11
10
5
10
9
90
x2
xy
y2
49
81
25
64
36
81
49
16
64
49
514
70
108
30
72
48
99
70
20
80
63
660
100
144
36
81
64
121
100
25
100
81
852
1. Regresyon katsayısı (b) hesaplanır.
b
 xy 
x
( x)( y )
2

n
( x ) 2
n
660  70.90 / 10 6600  6300
b

 1,25
10.517  70 2 / 10 5140  4900
2.
x ve y değerlerinin ortalaması hesaplanır.
10
x
7
70
y
90
9
10
3. a değerleri hesaplanır.
a  y  bx 
90
70
 1,25
 0,25
10
10
y=0,25+1,25x
y
12
10
8
6
4. Bulgular denkleme yazılır.
4
y= 0,25 + 1,25x
2
x
2
4
6
8
10
Örnek 2: Etlik piliç üretimi yapan bir işletme, kümesi ısıtmak
amacıyla yaktığı fuel oil miktarı ve günlük sıcaklık arasındaki
ilişkiyi belirlemek istemiştir. x günlük ortalama sıcaklığı, y (litre
olarak) yakılan fuel oil miktarını göstermek üzere 10 günlük
yakılan fuel oil ile ortalama hava sıcaklığı ile ilgili tablo aşağıda
verilmiştir. x üzerinde y’nin regresyon doğrusunun denklemini
bulunuz ve çiziniz..
Günlük Ortalama Sıcaklık
(x)
-17
-14
-11
-10
-7
-6
-4
-1
3
7
Yakılan fuel oil( litre)
(y)
44
35
33
26
26
19
17
10
8
4

similar documents