Dağılımlar, olasılık ve olasılık dağılımları

Report
BBY 252
ARAŞTIRMA YÖNTEMLERİ
1
DAĞILIMLAR, OLASILIK VE OLASILIK
DAĞILIMLARI
DERS İÇERİĞİ
•
•
•
•
•
•
•
Olasılık, ortaya çıkışı ve anlamı
Örneklem uzayı
Faktörüyel, Permütasyon, Kombinasyon
Koşullu olasılık
Raslantı değişkeni
Bir değişkenin dağılımı
Olasılık dağılımları
• Binom dağılımı
• Poisson dağılımı
• Normal dağılım
• Örneklem dağılımları
2
• Ki-kare dağılımı
• t dağılımı
• F dağılımı
OLASILIK KAVRAMI
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 95
3
• Ortaya çıkışı
• 1654
• Kumarbaz, Fransız Mere Şövalyesi Antonie
Combauld
• Şans oyunlarındaki gerçek olasılığı öğrenme
isteği
• Bu amaçla Pascal ve Fermat ile iletişim
• 1713 – Bernoulli’nin olasılık kuramı ile
ilgilenmeye başlaması
OLASILIK
• Raslantı ve kesin olmayan olaylar
• Rasgele deney: Çeşitli sonuçlar verebilen bir
deneyin herhangi bir tekrarında hangi sonucun
elde edileceği tamamen şansa bağlı ise
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 95
4
• Olasılık böyle durumlarda ortaya çıkan belirsizliği
sayısal olarak ifade etmek için geliştirilmiş bir
düşünce aracı
ÖRNEKLEM UZAYI
•S
• Bir denemenin tüm olası sonuçlarından oluşan
küme
• Bir zar atma denemesinde örneklem uzayı
• S={1, 2, 3, 4, 5, 6}
• Bir paranın bir defa atılması deneyi için örneklem
uzayı
• S={Yazı, Tura}
• Üç paranın bir defa atılması deneyi için örneklem
uzayı
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 96
5
• S={YYY, TYT, YTT, TTY, YYT, YTY, TYY, YYY}
ÖRNEKLEM UZAYI
• Bir zar atma denemesinde,
• Örneklem uzayındaki noktaların olasılıkları
birbirine eşit
• S={1, 2, 3, 4, 5, 6}
• 1/6
• İçinde 7 beyaz, 6 kırmızı, 8 yeşil top bulunan bir
torbadan, bir top çekildiği zaman ,
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 96
6
• S={Beyaz, Kırmızı, Yeşil}
• Örneklem uzayının noktalarının olasılığı
birbirinden farklı
• Beyaz top gelme olasılığı 7/21, kırmızı top gelme
olasılığı 6/21, yeşil top gelme olasılığı 8/21
SORU 1
7
a. İki zarın birlikte atılması durumunda örneklem
uzayı nedir? Örneklem uzayındaki noktaların
olasılıkları nedir?
b. Bir paranın iki defa atılması deneyi için
örneklem uzayındaki noktaların olasılıkları
nedir?
ÖRNEKLEM UZAYI
• Olay: Örneklem uzayındaki noktaların bir alt
kümesi
• Rasgele olay: Gerçekleşmesi raslantıya bağlı
olaylar
• Bir zarın atılmasında, A çift sayı gelme olayı ise,
• A={Çift sayı}={2, 4, 6}
• İki para atma denemesinde,
• S={YY, YT, TY, TT}
• B, en az bir yazı gelmesi olayı ise,
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 96
8
• B={En az bir yazı}={YY, YT, TY}
N FAKTÖRİYEL
n!
1’den n’ye kadar olan pozitif tamsayıların çarpımı
n!=1.2. … .n=n(n-1)(n-2) … 2.1
0!=1
1!=1
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 98
9
•
•
•
•
•
PERMÜTASYON
• Sıra Düzen
• n farklı nesnenin k (k≤n) tanesi sıralanırsa elde
edilecek değişik düzenlerin sayısı
P = n! / (n-k)! , k<n ise,
nPk = n! , k=n ise.
n k
• A, B, C gibi 3 öğrenci bir sırada kaç farklı şekilde
oturabilir?
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 98
10
• 3!=6
• ABC, ACB, BAC, BCA, CAB, CBA
KOMBİNASYON
• Birleşim
• n farklı nesneden düzenleme sırasına bakılmadan
r tanesinin seçimi
C = n! / r!(n-r)!
• n r
• 3 kitap arasından 2’sinin seçilmesi durumunda
• 3!/2!(3-2)!=3
• Kombinasyonlar
• AB, AC, BC
• Permütasyonlar
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 99
11
• AB, BA – AC, CA – BC, CB
OLASILIK
• Bir denemede n tane sonuç varsa, her sonucun
ortaya çıkma olasılığı eşit ve ilgilenilen sonuç
sayısı m ise bu olayın olasılığı,
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 100
12
• P(m)=İlgilenilen olayın sonuç sayısı/Olası tüm
sonuçların sayısı=m/n
• Olasılık daima 0 ile 1 arasında bir değer alır
• 0≤P≤1
• Olasılık uzayı: Olasılık fonksiyonunun belirtildiği
örneklem uzayı
OLASILIK
Çocuk sayısı
Sıklık
0
40
1
80
2
40
3
20
4
20
Toplam
200
• P(4)=20/200=1/10
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 101-102
13
• 200 ailenin çocuk sayısına göre dağılımları
verilmiştir. Rasgele seçilen bir ailenin 4 çocuklu
olma olasılığı nedir?
KOŞULLU OLASILIK
• Bir olayın gerçekleşmesi, başka bir olayın
gerçekleşmesi koşuluna bağlı ise
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 104
14
• P(B/A)=P(A∩B)/P(B)
KOŞULLU OLASILIK
• 80 ailenin ekonomik durumu ve istedikleri çocuk
sayıları verilmiştir. Rasgele seçilen bir ailenin zengin A
olduğu bilindiğine göre, istediği ideal çocuk sayısının
1 olması olasılığı nedir?
B
Ekonomik
durum
İstenen çocuk sayısı
1
2
3
4
Fakir
4
7
8
5
24
Orta
2
7
10
15
34
Zengin
12
5
3
2
22
Toplam
18
19
21
22
80
Toplam
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 104-105
15
• P(A/B) = (12/80) / (22/80) = 12/22
RASLANTI DEĞİŞKENİ
• Gelecekteki bir gözlemde alacağı değer önceden
kesinlikle bilinmeyen bir değişken
• Bir olasılık uzayında her basit rasgele olaya sayısal
değer atayan bir fonksiyon
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 105
16
• Bir kavşağa bir dakikada gelen araba sayısı, bir
yıldaki yağışlı günlerin sayısı, bir noktadaki rüzgar
hızı, bir akarsudaki akımın debisi, belli bir bileşiğin
alkol yüzdesi, belli sayıdaki ailede kız çocuk sayısı,
tüberkülozlu hastaların akciğerlerindeki leke
sayısı, bir zar atma denemesinde çift sayıların
gelmesi
RASLANTI DEĞİŞKENİ
• İki parayı atma denemesinde X raslantı değişkeni
tura sayısını göstersin
• S = {YY, YT, TY, TT}
• X = {0, 1, 2}
• Kesikli raslantı değişkeni: X raslantı değişkeninin
olası değerleri sayısı sonlu ya da sayılabilir
sonsuzlukta ise
• Kız çocuk sayısı, tura sayısı
• Sürekli raslantı değişkeni: X raslantı değişkeninin
tanım bölgesi bir aralık ya da aralıklar kümesi ise
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 105-107
17
• Zaman, ağırlık, yükseklik
SORU 2
18
Bir önceki slayttaki bilgileri dikkate alarak,
a. İki tura gelmesi olasılığı nedir?
b. Bir tura gelmesi olasılığı nedir?
c. Hiç tura gelmemesi olasılığı nedir?
d. En az bir tura gelmesi olasılığı nedir?
OLASILIK DAĞILIMLARI
• Bir torbada bulunan eşit sayıdaki yeşil ve beyaz
toplardan rasgele 3 top seçilsin
• S = {YYY, YYB, YBY, YBB, BYY, BYB, BBY, BBB}
• İlgilenilen sonuç yeşil top sayısı olduğunda X
raslantı değişkeni, Son sütundaki olasılıkların oluşturduğu
Yeşil top sayısı
dağılım «Olasılık Dağılımı»
Örneklem uzayındaki nokta sayısı
Olasılık
0
1
1/8
1
3
3/8
2
3
3/8
3
1
1/8
Toplam
8
1.00
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 108-109
19
• X = {0, 1, 2, 3}
OLASILIK DAĞILIMLARI
• Kesikli raslantı değişkeni
• Olasılık fonksiyonu
• Sürekli raslantı değişkeni
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 108-109
20
• Olasılık yoğunluk fonksiyonu
OLASILIK DAĞILIMLARI
21
• Binom dağılımı
• Poisson dağılımı
• Normal dağılım
BİNOM DAĞILIMI
• Kesikli raslantı değişkenlerinin oluşturdukları bir
dağılım
• İki olası sonuç ile ilgilenir
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 108-109
22
• Erkek-kız, yazı-tura, başarılı-başarısız, sağlambozuk, ölü-canlı, olumlu-olumsuz
BİNOM DAĞILIMI
• Bir para atma deneyinde iki sonuç vardır: yazı ya da
tura
• Paranın ilk atılmasında yazı gelmesi olasılığı 1/2=p
• Birinci atışta yazı ikinci atışta yazı gelmesi olasılığı
1/2.1/2=p²
• Üç atışın üçünde de yazı gelmesi olasılığı
1/2.1/2.1/2=p³
• Bu deney n kez yinelendiğinde yazı sayısı X bir
binom raslantı değişkenidir
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 111
23
• n denemede x tane yazı ve (n-x) tane tura gelmesi
olasılığı    −
• x tane yazı ve (n-x) tane tura n!/(x!(n-x)!) farklı
düzende ortaya çıkar
BİNOM DAĞILIMI
• Sonuç olarak, n denemede x yazı gelmesi (n-x) tura
gelmesi olasılığı,
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 111
24
• ( n!/(x!(n-x)!) ) .    −
POİSSON DAĞILIMI
• Önemli bir kesikli dağılım
• Az raslanan fakat her defasında belirli bir olasılıkla
meydana gelen olaylarının oluş sayılarının dağılımı
• Belli bir zaman aralığında bir telefon kulübesine gelen
konuşma sayısı, bir grup maldan alınan örneklemden
çıkacak bozuk mal sayısı, bir fabrikada dokunan
kumaşlar arasında günlük raslanan hatalı kumaş sayısı
gibi kesikli raslantı değişkenlerinin dağılımı
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 116
25
• Olasılık fonksiyonu  −  /!, x=0,1,2,… (e=2,72)
• , belli bir zaman aralığında ya da belli bir yerde istenen
olayın ortalama ortaya çıkma sayısı, =n.p
POİSSON DAĞILIMI
• Bir kavşakta haftada ortalama kaza sayısı 3’tür. Bir
haftada 5 kaza görülmesi olasılığı nedir?
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 117
26
• =3
•  −3 35 /5! = 0,10
NORMAL DAĞILIM
• Hem uygulamalı hem de teorik istatistikte kullanılan
oldukça önemli bir dağılım
• 18.yy’da ölçüm hatalarının dağılımı olarak ortaya
çıkmış
• İlk olarak 1733 yılında DeMoivre tarafından
matematiksel olarak tanımlanmış
• 1775, Laplace - bu dağılım üzerine çalışmalar
• 1809, Gauss – Normal dağılım ile ilgili ilk basılı eser
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 123
27
• Gauss Dağılımı
NORMAL DAĞILIM
• İstatistikte önemli bir yerinin olmasının nedeni
• Yapılan birçok gözlem sonucunun çan biçiminde
bir dağılım vermesi
• Çoğu dağılımın denek sayısı arttıkça normal
dağılıma yaklaşması
• Sürekli raslantı değişkeni ---olasılık yoğunluk
fonksiyonu
• İki parametresi
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 123-124
28
• Kitle ortalaması 
• Kitle varyansı ² - ortalama etrafındaki yayılmayı
gösterir
29
NORMAL DAĞILIM
NORMAL DAĞILIM
• Ortalamaya göre simetrik
• Bir değişken normal dağılıma sahip ise,
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 124-125; Esin, Ekni ve Gamgam, 2006, s. 250
30
• Aritmetik ortalama = tepe değeri = ortanca
31
NORMAL DAĞILIM
32
NORMAL DAĞILIM
33
NORMAL DAĞILIM
34
NORMAL DAĞILIM
35
NORMAL DAĞILIM
36
NORMAL DAĞILIM
NORMAL DAĞILIM
• Normal dağılıma sahip bir değişkene 1 standart
sapma eklenip, 1 standart sapma çıkarılarak
bulunan iki değer arasında kalanların oranı %68,26
• Normal dağılıma sahip bir değişkene 2 standart
sapma eklenip, 2 standart sapma çıkarılarak
bulunan iki değer arasında kalanların oranı %95,44
Kaynak: Esin, Ekni ve Gamgam, 2006, s. 250-252
37
• Normal dağılıma sahip bir değişkene 1 standart
sapma eklenip, 1 standart sapma çıkarılarak
bulunan iki değer arasında kalanların oranı %99,74
NORMAL DAĞILIM
Kaynak: Esin, Ekni ve Gamgam, 2006, s. 251
38
Soru: hastaların iyileşme süresi ortalama 20 gün ve
varyansı 25 gün olan bir normal dağılım ise, iyileşme
oranı 15 ile 25 gün arasında olan hastaların oranı
nedir?
NORMAL DAĞILIM
Kaynak: Esin, Ekni ve Gamgam, 2006, s. 253
39
• Normal dağılım eğrisinin şekli ortalama ve varyans
parametreleri tarafından belirlenmekte
NORMAL DAĞILIM
40
• Ortalamalar aynı, varyanslar farklı ise
41
NORMAL DAĞILIM
NORMAL DAĞILIM
42
• Ortalamalar farklı, varyanslar aynı ise
STANDART NORMAL DAĞILIM
43
• Ortalaması 1, varyansı 0 olan standart normal
dağılım
ÖRNEKLEM DAĞILIMLARI
• Örneklem üzerinde çalışılıyorsa
• İstatistik
• Farklı örneklemlerden hesaplanabilecek istatistik
değerlerinin dağılımı
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 157
44
• Örneklem dağılımı: Aynı kitleden alınmış aynı
büyüklükteki örneklemlerden bulunan
değerlerin/istatistiklerin olasılık dağılımı
Z DAĞILIMI
Kaynak: Esin, Ekni ve Gamgam, 2006, s. 262
45
• Standart normal dağılıma sahip değişkenlerde alan
hesabı için kullanılmakta
• Normal dağılıma sahip değişkenler aşağıdaki gibi
standart normal dağılıma sahip değişkenlere
dönüştürülerek kullanılır
• (X-Ortalama) / Varyans
Z DAĞILIMI
20
Kaynak: Esin, Ekni ve Gamgam, 2006, s. 262-263
22
46
• İlaçla tedavi edilen hastaların iyileşme süresine göre
dağılım ortalaması 20 gün, varyansı 25 gün olan bir
normal dağılımdır. 22 günden daha kısa sürede
iyileşme olasılığı nedir?
Z DAĞILIMI
P(x<22) = P(Z<0,40) = ?
Z tablosundan Z<0,40 değerinin bulunması gerek
Z tablosu - P(x<22) = P(Z<0,40) =0,6554 = %66
22 günden daha kısa sürede iyileşme olasılığı %66
0
Kaynak: Esin, Ekni ve Gamgam, 2006, s. 262
0,4
47
Standart normal dağılıma
dönüştürme
(22-20) / 5 = 0,40
48
ÖDEV
Aynı soru için aşağıdaki olasılıkları bulunuz.
a. 28 günden daha fazla sürede iyileşme olasılığı?
b. 18 günden daha fazla sürede iyileşme olasılığı?
c. 15 günden daha az sürede iyileşme olasılığı?
d. 21 gün ile 26 gün arasında iyileşme olasılığı?
e. 14 gün ile 23 gün arasında iyileşme olasılığı?
49
Teslim tarihi: 25 Nisan 2013 - Perşembe
Kİ-KARE DAĞILIMI
• 1889, Karl Pearson
• Ki-kare tablosu
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 158
50
• Ortalaması 0, varyansı 1 olan normal dağılıma sahip
raslantı değişkenlerinin toplamı ile elde edilir
Kİ-KARE DAĞILIMI
51
• 1889, Karl Pearson
• Ki-kare tablosu
T DAĞILIMI
• İstatistik değerlendirmelerde kullanılan önemli
dağılımlardan
• 1908, W. S. Gosset
• 1926, R. A. Fisher
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 162
52
• Ortalamaya göre simetrik bir dağılım, normal
dağılımdan daha basık, standart normal dağılıma
benzer
53
F DAĞILIMI
• Aynı kitleden ya da aynı varyanslı iki kitleden rasgele
seçilmiş iki örneklemin varyanslarının eşit olmaları
beklenir
• Her zaman gerçekleşmez
• İki örneklemin varyansları açısından aynı kitleye ait
olup olmadıklarının kontrolü için kullanılan istatistik
Kaynak: Apaydın, Kutsal ve Atakan, 1994, s. 165
54
• Ki-kare dağılımının görünümüne benzer
55

similar documents