آمار و کاربرد آن در مدیریت

Report
‫نام منبع درس ‪ :‬آمار و کاربرد آن در مدیریت ( جلد ‪ 1‬و ‪) 2‬‬
‫مؤلف ‪ :‬عادل آذر ‪ -‬منصور مؤمنی‬
‫تهیه کننده اسالیدها ‪ :‬حسن الوداری‬
‫این درس یکی از دروس اصلی رشته مدیریت بوده و‬
‫هدف آن آشناسازی دانشجویان با علم آمار و نحوه‬
‫بکارگیری آن در دانش مدیریت است‬
‫برای این درس ‪ ،‬کلیه فصل های هشتگانه جلد اول‬
‫و فصل ‪ 18‬جلد دوم کتاب به استثناء برخی‬
‫حذفیات در نظر گرفته شده است‬
‫آشنایی با مفاهیم پایه ای علم آمار و ضرورت‬
‫بکارگیری فنون و تکنیک های آن در دانش مدیریت‬
‫به منظور اداره بهتر سازمان ها‬
‫روش علمی است که برای جمع آوری ‪ ،‬تلخیص ‪،‬‬
‫تجزیه و تحلیل ‪ ،‬تفسیر و بطور کلی برای مطالعه و‬
‫بررس ی مشاهدات بکار گرفته می شود‬
‫‪ -1‬برای تبدیل داده ها به اطالعات‬
‫‪ -2‬برای بررس ی صحت و سقم فرضیات‬
‫‪ -3‬برای تعیین اعتبار و پایایی تحقیقات‬
‫جامعه بزرگترین مجموعه از موجودات است که در‬
‫یک زمان معین ‪ ،‬مطلوب ما قرار می گیرند مثل‬
‫جامعه فرهنگیان ایران و ‪. . .‬‬
‫تعدادی از عناصر مطلوب مورد نظر که حداقل‬
‫دارای یک صفت مشخصه باشند‬
‫صفتی است که بین همه عناصر جامعه آماری‬
‫مشترک و متمایز کننده جامعه آماری از سایر‬
‫جوامع باشد‬
‫‪ -1‬محدود ‪ :‬یعنی جامـعه مقادیر از تعـداد محدود و‬
‫ثابتی تشکیل شده و پایان پذیر باشد‬
‫‪ -2‬نا محدود ‪ :‬یعنی جامعه از یک ردیف بی انتهایی از‬
‫مقادیر تشکیل شده باشد‬
‫نمونه عبارتست از تعداد محدودی از آحاد جامعه‬
‫آماری که بیان کننده ویژگی های اصلی جامعه‬
‫باشد‬
‫‪ -1‬پارامتر ‪ :‬شاخـص هایی که از طریق سرشـماری (‬
‫انـدازه گیری تمامی عناصـر جامعه آماری ) بدست‬
‫می آیند‬
‫‪ -2‬آماره ‪ :‬شاخـص هایی که از طریق نمـونه گیری (‬
‫اندازه گیری بخش ی از جامعه ) بدست می آیند‬
‫آزمون هایی که مشروط به مفروضات آمار‬
‫کالسیک نیستند و کاربرد اصلی آنها در بررس ی‬
‫جوامع آماری غیر نرمال ‪ ،‬جوامع با داده های کیفی‬
‫و نمونه های کوچک آماری می باشد‬
‫‪ -1‬آمار توصیفی‬
‫‪ -2‬آمار استنباطی‬
‫‪ -3‬آمار ناپارامتریک‬
‫یعنی محاسبه مقادیر و شاخص های جامعه آماری‬
‫با استفاده از سرشماری تمامی عناصر آن ‪ ،‬بعبارتی‬
‫توصیف کل جامعه از طریق محاسبه پارامترها‬
‫آماری که در آن محقق ابتدا آماره ها را محاسبه و‬
‫سپس به کمک تخمین و آزمون فرض آماری ‪ ،‬آنها را‬
‫به پارامترهای جامعه تعمیم می دهد‬
‫این نوع آمار در مقابل آمار پارامتریک یعنی آمارهای‬
‫توصیفی و استنباطی دارای توزیع نرمال قرار می‬
‫گیرد و برای مشاهدات فاقد توزیع آماری کاربرد‬
‫دارد‬
‫‪ -1‬مشخص کردن هدف‬
‫‪ -2‬جمع آوری داده ها‬
‫‪ -3‬تجزیه و تحلیل داده ها‬
‫‪ -4‬بیان یافته ها‬
‫‪ -1‬فرضیه های تحقیق‬
‫‪ -2‬متغیرهایی که برای آزمودن آنها بکار گرفته می‬
‫شوند‬
‫متغیرها ‪ ،‬فرضیه ها را بصورتی نشان می دهند که‬
‫محققان رفتاری و مدیریتی بتوانند آنها ( فرضیه ها‬
‫) را مشاهده و اندازه گیری نمایند‬
‫‪ -1‬متغیر خصیصه‬
‫‪ -2‬متغیر مستقل‬
‫‪ -3‬متغیر وابسته‬
‫‪ -4‬متغیر تعدیل کننده ( واسطه ای )‬
‫‪ -5‬متغیر کنترل‬
‫متغیری که مقدار آن از یک فرد به فرد دیگر و یا از‬
‫یک عضو به عضو دیگر جامعه آماری ممکن است‬
‫تغییر کند ‪ .‬مثل اندازه سازمان‬
‫به علت احتمالی یا فرض ی متغیر وابسته ‪ ،‬متغیر‬
‫مستقل یا متغیر درونداد و به عبارتی محرک گفته‬
‫می شود‬
‫به متغیری که به تبع تغییر متغیر مستقل ‪ ،‬مقدارش‬
‫کم و زیاد می شود متغیر وابسته ‪ ،‬متغیر پاسخ و یا‬
‫برونداد اطالق می شود‬
‫یک متغیر ثانوی است که رابطه بین متغیر مستقل و‬
‫متغیر وابسته را تحت تأثیر قرار می دهد‬
‫به متغیرهایی که در موقع انجام پژوهش ‪ ،‬الزم‬
‫است تأثیر آنها خنثی شده و یا از بین برود ‪،‬‬
‫متغیرهای کنترل می گویند‬
‫موقع انجام تحقیق ‪ ،‬پژوهشگر سعی می کند‬
‫تأثیرات متغیر کنترل را از بین ببرد ولی تأثیرات متغیر‬
‫تعدیل کننده را مورد بررس ی قرار می دهد‬
) Nominal scale (
‫ مقیاس اسمی‬-1
) Rank scale (
‫ مقیاس ترتیبی‬-2
) Interval scale (
) Ratio scale (
‫ مقیاس فاصله ای‬-3
‫ مقیاس نسبی‬-4
‫ً‬
‫محققان از این مقیاس ‪ ،‬صرفا برای طبقه بندی‬
‫اشیاء ‪ ،‬اشخاص و یا خصوصیات استفاده می‬
‫کنند ‪ ،‬مثل استفاده از یک سری اعداد یا سمبول‬
‫ها برای نام گذاری سبک های رهبری‬
‫اگر بین اسامی ایجاد شده یا طبقات حاصله ناش ی‬
‫از مقیاس بندی اسمی یک نوع رابطه هم وجود‬
‫داشته باشد پژوهشگران از مقیاس ترتیبی استفاده‬
‫می نمایند‬
‫اگر در مقیاس ترتیبی ‪ ،‬فاصله بین اعداد یا طبقات‬
‫از یک نظم خاص ی پیروی نماید ( فواصل یکسان‬
‫باشند) محققان از مقیاس فاصله ای برای اندازه‬
‫گیری متغیرها استفاده می نمایند‬
‫مقیاس ی است که عالوه بر داشتن همه خصوصیات‬
‫مقیاس فاصله ای ‪ ،‬دارای نقطه صفر واقعی نیز‬
‫هست ‪ ،‬مثل پوند و گرم‬
‫مرات‬
‫ترتیب‬
‫نوع ب‬
‫مقیاس‬
‫اسمی‬
‫ندارد‬
‫فواصل‬
‫مبدأ صفر مبدأ صفر‬
‫قراردادی‬
‫مطلق‬
‫ندارد‬
‫ندارد‬
‫ندارد‬
‫رتبه ای‬
‫دارد‬
‫ندارد‬
‫ندارد‬
‫ندارد‬
‫فاصله ای‬
‫دارد‬
‫دارد‬
‫دارد‬
‫ندارد‬
‫نسبتی‬
‫دارد‬
‫دارد‬
‫دارد‬
‫دارد‬
‫فرضیه حدس ی است زیرکانه در مورد رابطه بین دو‬
‫یا چند متغیر که بصورت دقیق و روشن بیان شده‬
‫و پس از آزمایش ‪ ،‬صحت یا سقم آن مشخص می‬
‫شود‬
‫‪ -1‬واضح و بدون ابهام‬
‫‪ -2‬بیان در قالب جمالت خبری‬
‫‪ -3‬قابل تبیین ( علت یابی )‬
‫‪ -4‬توضیح دهنده رابطه مورد انتظار بین متغیرها‬
‫‪ -5‬قابل آزمون بودن ( آزمون پذیری )‬
‫‪ -1‬توصیفی‬
‫‪ -6‬همبستگی‬
‫‪ -2‬استنباطی‬
‫‪ -7‬تجربی‬
‫‪ -3‬تک متغیره‬
‫‪ -8‬با گروه های جور شده‬
‫‪ -4‬دو متغیره‬
‫‪ -9‬با گروه های مستقل‬
‫‪ -5‬چند متغیره‬
‫‪ -10‬پارامتریک‬
‫‪ -11‬ناپارامتریک‬
‫فرضیه ای است که در مورد کل جامعه آماری‬
‫تدوین شده بعبارتی ادعایی را در مورد کل جامعه‬
‫آماری بیان می نماید‬
‫به فرضیه ای اطالق می شود که در مورد یک‬
‫نمونه انتخابی از کل جامعه آماری تدوین شود و‬
‫صحت و سقم آن تحت تأثیر خطای نمونه گیری‬
‫باشد‬
‫فرضیه هایی که به ظاهر دارای دو متغیر بوده‬
‫(مستقل و وابسته) ولی فرضیه مستقل آن خودش‬
‫از چند متغیر دیگر تشکیل شده است‬
‫به فرضیه ای گفته می شود که پژوهشگر هیچ‬
‫کنترلی بر روی متغیرهای مستقل و وابسته آن ندارد‬
‫ً‬
‫‪ ،‬چرا که اتفاق قبال رخ داده و دیگر قابل دستکاری‬
‫نمی باشد‬
‫فرضیه ای است که محقق در آن بر روی هر دو‬
‫متغیر کنترل دارد یعنی پدیده هنوز روی نداده و‬
‫پژوهشگر می تواند متغیر مستقل را دستکاری نماید‬
‫در این نوع فرضیه سازی ‪ ،‬پژوهشگران یک گروه‬
‫نمونه دارند که در آن هر آزمون شونده را از لحاظ‬
‫یک متغیر واحد دو بار اندازه گیری می کنند‬
‫در این حالت ‪ ،‬محقق برای آزمون ‪ ،‬دو گروه دارد‬
‫که هر کدام از آنها را از لحاظ یک متغیر واحد‬
‫مشابه یک بار بطور جداگانه اندازه گیری می نماید‬
‫فرضیه هایی هستند که در آنها از متغیرهای نسبی یا‬
‫فاصله ای استفاده شده و توزیع جامعه (و یا‬
‫نمونه ) نرمال می باشد‬
‫فرضیه هایی هستند که متغیرهای موجود در آنها‬
‫دارای مقیاس اسمی یا رتبه ای می باشند یا این که‬
‫بر اساس شواهد موجود ‪ ،‬محققان نمی توانند‬
‫فرض نرمال بودن جامعه ( نمونه ) را بپذیرند‬
‫هدف این فصل آشناسازی دانشجویان با‬
‫پارامترهای مرکزی و پراکندگی در جوامع کوچک (‬
‫‪ ) N≥20‬می باشد‬
‫اعدادی هستند که به منظور بیان کمی توزیع‬
‫اندازه ها از آن استفاده می شود ‪ .‬این شاخص ها‬
‫توصیف کننده مجموعه داده ها می باشند‬
‫به هر معیار عددی که معرف مرکز مجموعه داده‬
‫ها باشد ‪ ،‬پارامتر مرکزی اطالق می شود یعنی همان‬
‫مقدار نماینده ای که مشاهدات در اطراف آن‬
‫توزیع شده اند‬
‫‪ -1‬میـانگین ؛ شامـل میانـگین حسـابی ‪ ،‬میانگین‬
‫پیراسـته ‪ ،‬میانگین هندسـی ‪ ،‬میانگین هارمـونیـک‬
‫‪ -2‬مد ( نما )‬
‫‪ -3‬چارکها ؛ شامل چارک اول ‪ ،‬چارک دوم ‪ ،‬چارک‬
‫سوم‬
‫به نقطه تعادل یا مرکز ثقل توزیع ‪ ،‬در داده هایی‬
‫که بصورت منظم بر روی یک محور ردیف شده‬
‫باشند ‪ ،‬میانگین ( ‪ ) Mean‬اطالق می شود‬
‫این میانگین از تقسیم مجموع مشاهدات بر تعداد‬
‫آنها بدست می آید‬
‫‪n‬‬
‫فرمول‬
‫‪i‬‬
‫‪X‬‬
‫‪i 1‬‬
‫‪N‬‬
‫‪‬‬
‫‪x‬‬
‫‪‬‬
‫اگر هر یک از مشاهدات دارای تکرار باشند ‪ ،‬در این‬
‫صورت تعداد تکرارها بعنوان وزن مشاهدات تلقی‬
‫شده و آنها را با ‪ w i‬نشان می دهند‬
k

W X
i

w
i1
k
W
i1
i

W
i
N
i
X
i
‫از این میانگین زمانی استفاده می شود که در توزیع‬
‫مشاهدات ‪ ،‬تعداد اندکی از آنها ‪ ،‬با بقیه داده ها‬
‫همخوانی و تجانس نداشته باشد‬
‫‪ -1‬مرتب کردن صعودی داده ها‬
‫‪ -2‬حذف تمام مشاهدات کوچکتر از ‪ % LN‬پایین و‬
‫بزرگتر از ‪ %LN‬باال‬
‫‪ -3‬محاسبه میانگین برای باقیمانده مشاهدات‬
‫در این میانگین بجای حذف کامل ‪ %LN‬ها ‪،‬‬
‫مقادیر باال و پایین آن بجای مقادیر حذف شده‬
‫مورد استفاده قرار می گیرند و از تعداد داده ها‬
‫کاسته نمی شود‬
‫از این میانگین برای محاسبه اندازه های نسبی‬
‫همانند نسبت ها ‪ ،‬در صدها ‪ ،‬شاخص ها و نرخ‬
‫های رشد استفاده می شود‬
‫میانگین هندس ی یک رشته عدد همانند ‪. . ، X ، X‬‬
‫‪ X ، .‬برابر است با ریشه ‪ N‬ام حاصلضرب آن‬
‫‪1‬اعداد‬
‫‪N‬‬
‫‪‬‬
‫) ‪ G ( X 1 X 2  ... X N‬‬
‫‪1‬‬
‫‪N‬‬
‫‪2‬‬
‫اگر داده ها در میانگین هندس ی دارای وزن باشند ‪،‬‬
‫از این نوع میانگین استفاده می شود‬
‫‪1‬‬
‫فرمول‬
‫‪wK ) N‬‬
‫‪K‬‬
‫‪X‬‬
‫‪w 2  ... ‬‬
‫‪2‬‬
‫‪X‬‬
‫‪w1 ‬‬
‫‪1‬‬
‫‪X‬‬
‫(‪‬‬
‫‪G‬‬
‫‪‬‬
‫از این نوع ‪ ،‬برای محاسبه میانگین مشاهداتی‬
‫استفاده می شود که از مقیاس های ترکیبی همانند‬
‫« کیلو در ساعت » یا « دور در ثانیه » برخوردار‬
‫هستند‬
‫این میانگین برای چند اندازه یا مقدار برابر است با‬
‫عکس میانگین حسابی معکوس آن اندازه ها‬
‫فرمول‬
‫‪N‬‬
‫‪1‬‬
‫‪i‬‬
‫‪x‬‬
‫‪N‬‬
‫‪‬‬
‫‪i 1‬‬
‫‪‬‬
‫‪N‬‬
‫‪1‬‬
‫‪N‬‬
‫‪x‬‬
‫‪1‬‬
‫‪ ... ‬‬
‫‪2‬‬
‫‪x‬‬
‫‪1‬‬
‫‪‬‬
‫‪1‬‬
‫‪x‬‬
‫‪‬‬
‫‪H‬‬
‫‪‬‬
‫در صورت تکرار داده ها ( وزن داشتن آنها ) از‬
‫فرمول زیر استفاده می شود ‪:‬‬
‫‪N‬‬
‫‪k‬‬
‫‪i‬‬
‫‪w‬‬
‫‪‬‬
‫‪x‬‬
‫‪i‬‬
‫‪i1‬‬
‫‪ wi‬‬
‫‪‬‬
‫‪k‬‬
‫‪k‬‬
‫‪w‬‬
‫‪ ... ‬‬
‫‪x‬‬
‫‪2‬‬
‫‪2‬‬
‫‪w‬‬
‫‪‬‬
‫‪x‬‬
‫‪1‬‬
‫‪w‬‬
‫‪x‬‬
‫‪1‬‬
‫‪‬‬
‫‪H‬‬
‫‪‬‬
‫به مقداری گفته می شود که در میان سایر مقادیر‬
‫توزیع ‪ ،‬بیشترین تکرار را داشته باشد ‪ ،‬مد را با‬
‫‪ Mo‬نشان می دهند‬
‫اگر جامعه آماری به چهار قسمت مساوی تقسیم‬
‫شود ‪ ،‬به هر یک از قسمت ها یک چارک گفته می‬
‫شود و آنها را با ‪ Q‬نشان می دهند‬
‫‪ : Q 1‬مقداری که ‪ %25‬مشاهدات ‪ ،‬پایین تر از آن است‬
‫‪ :Q 2‬مقداری که ‪ %50‬مشاهدات ‪ ،‬پایین تر از آن است‬
‫‪ :Q 3‬مقداری که ‪ %75‬مشاهدات ‪ ،‬پایین تر از آن است‬
‫‪ -1‬مرتب نمودن صعودی داده ها‬
‫‪ -2‬کد گذاری کردن آنها از ‪ 1‬تا ‪N‬‬
‫‪ -3‬پیدا نمودن محل چارک مورد نظر‬
‫‪ -4‬تعیین نمودن مقدار چارک مورد نظر به کمک‬
‫محل چارک‬
‫‪1‬‬
‫‪2‬‬
‫‪‬‬
‫‪aN‬‬
‫‪4‬‬
‫‪‬‬
‫‪a‬‬
‫‪CQ‬‬
‫چارک مورد نظر ‪1‬و‪2‬و‪a= 3‬‬
‫تعداد مشاهدات =‪N‬‬
‫شاخص هایی هستند که متوسط میزان دوری و‬
‫نزدیکی داده های توزیع را نسبت به میانگین شان‬
‫نشان می دهند‬
‫‪ -1‬کمک به توصیف واقعی تر یک سری از داده ها‬
‫‪ -2‬کمک به قابلیت مقایسه دو یا چند سری از داده‬
‫ها‬
‫‪ -1‬دامنه تغییرات‬
‫‪ -5‬انحراف معیار‬
‫‪ -2‬دامنه میان چارکی‬
‫‪ -6‬نیمه واریانس‬
‫‪ -3‬انحراف متوسط از میانگین‬
‫‪ -4‬واریانس‬
‫‪ -7‬ضریب پراکندگی‬
‫ساده ترین شاخص پراکندگی است و با کم کردن‬
‫کوچکترین مشاهده از بزرگترین آنها در یک سری‬
‫توزیع بدست می آید‬
‫فرمول‬
‫‪Xi‬‬
‫‪MIN‬‬
‫‪‬‬
‫‪Xi‬‬
‫‪MAX‬‬
‫‪‬‬
‫‪R‬‬
‫این شاخص ‪ ،‬پراکندگی داده ها را در فاصله چارک‬
‫اول و چارک سوم نشان می دهد و کاری به مقادیر‬
‫کوچکتر از ‪ Q‬و بزرگتر ‪ Q‬ندارد‬
‫‪1‬‬
‫‪3‬‬
‫برای محاسبه این شاخص ‪ ،‬کافیست که مقادیر‪Q‬‬
‫و‬
‫‪3‬‬
‫‪1‬‬
‫‪Q‬‬
‫را بدست آورده و از هم کم کنیم ‪.‬‬
‫‪1‬‬
‫‪Q‬‬
‫‪3‬‬
‫‪Q‬‬
‫‪IQR ‬‬
‫برای بدست آوردن این شاخص ‪ ،‬که به انحراف‬
‫چارکی نیز معروف است ‪ ،‬کافیست ‪ ،‬مقدار دامنه‬
‫میان چارکی را بر عدد ‪ 2‬تقسیم نماییم‬
‫‪1‬‬
‫‪Q‬‬
‫‪2‬‬
‫‪3‬‬
‫‪Q‬‬
‫‪SIQR ‬‬
‫‪ -1‬استفاده از میانه بعنوان بهترین شاخص مرکزی‬
‫‪ -2‬استفاده از انحراف چارکی بعنوان بهترین شاخص‬
‫پراکندگی‬
‫این شاخـص از تقسیم مجموع قدر مطلـق انحـرافات‬
‫تک تک مشاهدات از میانگین شان بر تعداد‬
‫مشاهدات بدست‬
‫‪X‬‬
‫‪X ‬‬
‫‪N‬‬
‫‪‬‬
‫‪i‬‬
‫‪‬‬
‫‪D ‬‬
‫‪A‬‬
‫‪A D ‬‬
‫محاسن ‪ :‬در نظر گرفتن تغییرات کل داده ها‬
‫معایب ‪ -1 :‬نشان ندادن تأثیر انحرافات بزرگ‬
‫‪ -2‬بی بهره بودن از بعض ی از خواص مطلوب‬
‫میانگین حسابی‬
‫در این شاخص پراکندگی ‪ ،‬بر خالف شاخص انحراف‬
‫متوسط از میانگین بجای قدر مطلق از مجذور (توان‬
‫‪ )2‬انحرافات استفاده می شود‬
‫فرمول‬
‫) ‪( X i   x‬‬
‫‪N‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪X‬‬
‫‪‬‬
‫این شاخص به منظور برطرف کردن عیوب‬
‫شاخص های قبلی است یعنی همان نشان ندادن‬
‫و افزایش دادن‬
‫توسط‪A‬‬
‫تأثیر انحراف بزرگ ‪D‬‬
‫تأثیر این انحراف توسط‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪X‬‬

X

‫و یا‬

X


(
2
X
X i  x )
N
2
‫‪ -1‬اگر تمام مشاهدات با عدد ثابت ‪b‬‬
‫واریانس جدید تغییر نمی کند‬
‫جمع شوند ‪،‬‬
‫‪ -2‬اگر تمام مشاهدات ‪ ،‬به عدد ثابت‪ b‬ضرب‬
‫شوند ‪ ،‬واریانس‪b‬جدید برابر افزایش می یابد‬
‫‪2‬‬
‫‪2‬‬
‫‪k‬‬
‫) ‪ ( X i  x‬‬
‫یعنی متوسط مجذور مقادیر نامطلوب‬
‫‪i 1‬‬
‫‪K‬‬
‫=‪S.V‬‬
‫تعداد مشاهدات جامعه =‪N‬‬
‫تعداد مقادیر نامطلوب =‪K‬‬
‫میانگین کل مشاهدات = ‪‬‬
‫‪X‬‬
‫در داده های مربوط به سود و در آمد مقادیر‬
‫کوچک تر از میانگین و در داده های مربوط به زیان‬
‫و هزینه مقادیر بزرگتر از میانگین ‪ ،‬نامطلوب‬
‫قلمداد می شوند‬
‫ضریب پراکندگی یکی از معیارهای پراکندگی نسبی‬
‫ل‬
‫شود‬
‫می‬
‫بیان‬
‫یر‬
‫فرمو‬
‫با‬
‫که‬
‫است‬
‫ز‬
‫‪‬‬
‫‪C V ‬‬
‫‪‬‬
‫‪X‬‬
‫‪X‬‬
‫انحراف معیار مشاهدات =‬
‫‪X‬‬
‫‪‬‬
‫میانگین مشاهدات =‬
‫‪X‬‬
‫‪‬‬
‫برای مقایسه دو جامعه در مواردی که ‪:‬‬
‫‪ -1‬مقیاس ها یکسان نیستند‬
‫‪ -2‬مقیاس یکسان ولی تفاوت زیادی در بزرگی‬
‫مشاهدات وجود دارد‬
‫‪ -3‬واریانسهای جوامع یکسان ولی میانگین هایشان‬
‫متفاوت است‬
‫هدف این فصل آشنایی دانشجویان با طبقه بندی‬
‫و سازماندهی مشاهدات و استفاده از نمودارهای‬
‫مختلف برای توصیف داده هاست‬
‫یعنی جدول مرتب و خالصه شده از داده ها و‬
‫مشاهدات که تکرار وقوع هر داده ها در آن‬
‫مشخص شده است‬
‫‪ -1‬مرتب کردن داده ها و محاسبه دامنه تغییرات ( ‪) R‬‬
‫‪ -2‬مشخص کردن تعداد طبقات ( ‪) K‬‬
‫‪ -3‬محاسبه نمودن فاصله طبقات ( ‪) I‬‬
‫‪ -4‬سازماندهی طبقات‬
‫‪ -1‬فرمول تجربی استورجس‬
‫‪K  1  3 / 32 LogN‬‬
‫‪ -2‬روش تقریبی‬
‫( ‪ N‬تعداد مشاهدات می باشد )‬
‫‪N‬‬
‫‪K ‬‬
‫فاصله طبقات از تقسیم مقدار ‪ ( R‬دامنه تغییرات‬
‫) بر مقدار محـاسبه شـده برای تعـداد طـبقـات ( ‪) K‬‬
‫به شکل زیر بدست می آید‬
‫‪R‬‬
‫‪K‬‬
‫‪I ‬‬
‫پس از مشخص شدن ‪ K‬و ‪ I‬سازماندهی یعنی‬
‫تعیین نوع جدول و شیوه طبقه بندی داده ها‬
‫شروع می شود که این بستگی به نوع داده های‬
‫جمع آوری شده دارد‬
‫‪ -1‬طبقه بندی پیوسته ‪ :‬برای داده های اعشاری ‪ ،‬یعنی‬
‫مساوی بودن طول ‪ ،‬عرض و فاصله طبقات‬
‫‪ -2‬طبقه بندی گسسته ‪ :‬برای داده های غیر اعشاری ‪،‬‬
‫یعنی برابر نبودن طول و عرض طبقات‬
‫‪ -1‬تقریب ‪1/0‬‬
‫‪ -2‬تقریب ‪5/0‬‬
‫‪ -3‬تقریب ‪ ( 1‬واحد )‬
‫تقریب ‪ ،‬اختالف طول و عرض طبقات یا فاصله‬
‫بین حد باالی یک طبقه با حد پایین طبقه بعدی‬
‫است ‪.‬‬
‫تعریف مشاهدات گسسته بصورت فاصله طبقات‬
‫بی معناست لذا برای تشکیل توزیع فراوانی آنها‬
‫کافیست یک ستون برای مشاهدات و ستون دیگری‬
‫برای فراوانی آنها تنظیم شود‬
‫چنانچه در جدول طبقه بندی داده ها بجای‬
‫نسبی ( ) استفاده‬
‫مطلق ( ) از فراوانی ‪f‬‬
‫فراوانی ‪F‬‬
‫شود ‪ ،‬به آن توزیع فراوانی نسبی گویند‬
‫‪i‬‬
‫‪i‬‬
‫‪i‬‬
‫‪F‬‬
‫‪N‬‬
‫فراوانی مطلق آن طبقه‬
‫‪‬‬
‫‪i‬‬
‫‪f‬‬
‫= فراوانی‬
‫نسبی هر طبقه‬
‫تعداد کل مشاهدات (فراوانی ها)‬
‫به کمک این فراوانی می توان در صد تراکم داده ها‬
‫را در هر طبقه مشخص نمود بعبارتی از ‪ f‬جهت‬
‫یافتن محل تمرکز داده ها استفاده می شود‬
‫‪i‬‬
‫(حد باال ‪ +‬حد پایین ) طبقه مورد نظر‬
‫= متوسط یا‬
‫نماینده هر طبقه‬
‫‪2‬‬
‫اگر در جدول طبقه داده ها ‪ ،‬بجای فراوانی های‬
‫مطلق و نسبی از فراوانی تجمعی استفاده شود ‪ ،‬به‬
‫جدول بدست آمده ‪ ،‬توزیع فراوانی تجمعی گویند‬
‫فـراوانی تجـمعی هر طـبقه ‪ ،‬عـبارتست از مجموع‬
‫فراوانی های مطلق از اولین طبقه تا طبقه مورد‬
‫‪ FC‬نشان می دهند‬
‫نظر که آن را با‬
‫‪i‬‬
‫‪i‬‬
‫‪i‬‬
‫‪F‬‬
‫‪i 1‬‬
‫‪‬‬
‫‪i‬‬
‫‪Fc‬‬
‫این فراوانی از تقسیم فراوانی تجمعی هر طبقه بر‬
‫تعداد مشاهدات بدست می آید‬
‫یعنی‬
‫‪i‬‬
‫‪Fc‬‬
‫‪N‬‬
‫‪‬‬
‫‪i‬‬
‫‪fc‬‬
‫این فراوانی بیانگر در صد داده ها و مشاهدات‬
‫واقع شده بین حد پایین اولین طبقه تا حد باالی‬
‫طبقه مورد نظر است‬
‫استفاده از نمودارها در گزارش نویس ی باعث می‬
‫شود که خوانندگان با صرف کمترین زمان و با‬
‫ساده ترین بیان ‪ ،‬گزارش را بفهمند و تصویری‬
‫روشن از توزیع داشته باشند‬
‫‪ -1‬نمودارهای کمی ‪ :‬مخصوص داده هایی با مقیاس‬
‫فاصله ای و نسبی‬
‫‪ -2‬نمودارهای وصفی ‪ :‬مخصوص داده هایی با مقیاس‬
‫اسمی و یا رتبه ای‬
‫‪ -1‬بافت نگار (هیستوگرام)‬
‫‪ -4‬تحلیل اکتشافی داده‬
‫ها‬
‫‪ -2‬چند ضلعی (پلی گون)‬
‫‪ 4-1‬نمودار‬
‫شاخه و برگ‬
‫‪ -3‬فراوانی تجمعی ( ُاجایو)‬
‫جعبه ای‬
‫‪ 3-1‬پلی گون فراوانی تجمعی‬
‫‪ 4-2‬نمودار‬
‫بافت نگار نموداریست در دستگاه مختصات که‬
‫محور افقی آن با حدود واقعی طبقات و محور‬
‫عمودی آن با فراوانی مطلق یا نسبی درجه بندی‬
‫می شود‬
‫پس از مدرج کردن محورها بر روی حدود واقعی‬
‫(کرانه های هر طبقه) مستطیلی عمودی رسم می‬
‫شود که مساحت آن مساوی با فراوانی نسبی آن‬
‫طبقه می باشد‬
‫نموداریست که متناظر با هر نماینده طبقه در‬
‫محور افقی و فراوانی آن در محور عمودی ‪ ،‬یک‬
‫نقطه در صفحه مختصات ایجاد و به هم وصل می‬
‫شوند‬
‫برای ترسیم این نمودار ‪ ،‬از نماینده طبقات در‬
‫محور افقی و فراوانی تجمعی در محور عمودی‬
‫استفاده می شود ‪ ،‬سپس نقاط ایجاد شده به‬
‫ترتیب به هم وصل می شوند‬
‫تنها فرق این نمودار با نمودار پلی گون فراوانی‬
‫تجمعی در این است که در این نمودار بجای‬
‫نماینده طبقات از حد باالی کرانه ها استفاده می‬
‫شود‬
‫‪ -1‬برای محاسبه چندکها (چارکها ‪ ،‬دهکها ‪،‬‬
‫صدکها)‬
‫‪ -2‬برای مقایسه پدیده ها (مثل میزان رشد تورم در‬
‫کشورها)‬
‫در بر گیرنده نمودار های جدیدی است که در‬
‫مراحل اولیه تحلیل داده ها مفید هستند و‬
‫اطالعات بیشتری را در مورد تک تک داده ها به‬
‫معرض نمایش می گذارند‬
‫برای تهیه این نمودار ‪ ،‬ارقام مشاهدات به دو بخش‬
‫شاخه و برگ تقسیم می شوند‪ ،‬شاخه شامل یک‬
‫یا چند رقم اولیه و برگ شامل ارقام باقی مانده‬
‫در این نمودار بر خالف بافت نگار ‪ ،‬اعداد اصلی از‬
‫بین نمی روند و محاسبه چندکها هم با استفاده از‬
‫آن براحتی امکان پذیر است‬
‫این نمودار نشان دهنده چارکها و حداقل و حداکثر‬
‫مشاهدات است و برای مقایسه دو یا چند جامعه‬
‫آماری مورد استفاده قرار می گیرد‬
‫الف – پیدا کردن حداقل و حداکثر داده ها‬
‫ب – پیدا کردن چارکهای اول ‪ ،‬دوم و سوم‬
‫حداکثر داده ها‬
‫‪3‬‬
‫‪Q‬‬
‫‪Q‬‬
‫‪Q‬‬
‫حداقل داده ها‬
‫‪2‬‬
‫‪1‬‬
‫این دسته از نمودارها برای نمایش هندس ی داده‬
‫های کیفی بکار می روند‪ ،‬در این نمودارها هر یک از‬
‫مقادیر بعنوان یک طبقه در نظر گرفته می شوند‬
‫‪ -1‬نمودار ستونی‬
‫‪ -2‬نمودار دایره ای‬
‫‪ -3‬نمودار پاره تو‬
‫این نمودار در یک دستگاه مختصات که محور‬
‫افقی نشان دهنده کیفیت مشاهدات و محور‬
‫عمودیش نشان دهنده فراوانی مطلق یا نسبی هر‬
‫گروه است ترسیم می شود‬
‫این نمودار ابزار مناسبی برای تجسم مشاهدات‬
‫ً‬
‫بوده و معموال بر حسب در صد تهیه می شود و به‬
‫نمودار کلوچه ای نیز معروف است‬
‫‪ -1‬تبدیل فراوانی مطلق به نسبی‬
‫‪ -2‬پیدا کردن مساحت هر قطاع از دایره‬
‫حسب‬
‫بر‬
‫دایره‬
‫مساحت‬
‫تقسیم‬
‫‬‫‪3‬‬
‫‪Si‬‬
‫ها‬
‫‪ -4‬نوشتن نوع و درصد مشاهدات بر روی دایره‬
‫برای پیدا کردن مساحت هر قطاع از دایره از‬
‫فرمول زیر استفاده می شود‬
‫‪i‬‬
‫‪f‬‬
‫‪‬‬
‫‪ 36 0 ‬‬
‫یعنی فراوانی نسبی هر مشاهده‬
‫به عدد ‪ 360‬ضرب می شود‬
‫‪i‬‬
‫‪S‬‬
‫این نمودار دارای سه محور است ‪:‬‬
‫‪ -1‬محورافقی ‪ :‬نوع موضوعات‬
‫‪ -2‬محور عمودی ‪ :‬فراوانی مطلق موضوعات‬
‫‪ -3‬محور سوم (روبروی محور عمودی) ‪ :‬فراوانی‬
‫نسبی تجمعی موضوعات‬
‫یعنی این که در این نمودار پر وقوع ترین موضوعات‬
‫در سمت چپ نمودار قرار گرفته ‪ ،‬سپس‬
‫موضوعات با فراوانی کمتر در سمت راست آنها قرار‬
‫می گیرند‬
‫‪ -1‬در تحلیل موجودیهای جنس ی انبارها‬
‫‪ -2‬در بررس ی نواقص سیستم ها‬
‫‪ -3‬و در بررس ی نحوه توزیع درآمد و توزیع پرسنل‬
‫مؤسسات‬
‫هدف اصلی این فصل آشنا ساختن دانشجویان با‬
‫پارامترهای مرکزی ‪ ،‬پراکندگی و تعیین انحراف از‬
‫قرینگی و کشیدگی در داده های طبقه بندی شده‬
‫می باشد‬
‫‪ -1‬مرکز توزیع کجاست ؟‬
‫‪ -2‬پراکندگی آن چقدر است ؟‬
‫‪ -3‬تمایل داده به کدام سمت است ؟‬
‫‪ -4‬پراکندگی توزیع در مقایسه با توزیع های مشابه‬
‫چگونه است ؟‬
‫‪ -1‬میانگین ؛ که به روش های مستقیم و‬
‫غیرمستقیم قابل محاسبه است‬
‫‪ -2‬مد ؛ که نشان دهنده بیشترین تکرار می باشد‬
‫‪ -3‬چندکها ؛ شامل چارکها ‪ ،‬دهکها و صدکها‬
‫این فرمول برای داده های طبقه بندی شده به شرح ذیل‬
‫‪:‬‬
‫است‬
‫‪‬‬
‫‪i‬‬
‫‪F X‬‬
‫‪N‬‬
‫‪i‬‬
‫‪‬‬
‫‪x‬‬
‫‪‬‬
‫فراوانی مطلق = ‪F‬‬
‫‪i‬‬
‫متوسط طبقات = ‪X‬‬
‫‪i‬‬
‫کل مشاهدات = ‪N‬‬
‫‪‬‬
‫‪d‬‬
‫‪F‬‬
‫‪)I‬‬
‫(‪A ‬‬
‫‪N‬‬
‫‪i‬‬
‫عدد دلخـواه =‪A‬‬
‫کد هر طـبقه =‪d‬‬
‫‪i‬‬
‫=‬
‫فاصله طبقات ‪I‬‬
‫‪i‬‬
‫‪‬‬
‫‪x‬‬
‫‪‬‬
‫این عدد بعنوان میانگین تقریبی از وسط ستون‬
‫نماینده طبقات انتخاب شده و موجب تسهیل‬
‫ً‬
‫عملیات ریاض ی در پیدا کردن میانگین تقریبا واقعی‬
‫می شود‬
‫‪i‬‬
‫‪d‬‬
‫‪ d i‬که کد هر طبقه است ‪ ،‬به شکل زیر قابل می‬
‫باشد‬
‫‪‬‬
‫‪X‬‬
‫‪A‬‬
‫‪i‬‬
‫‪‬‬
‫‪di‬‬
‫‪I‬‬
‫زمانی که مشاهدات حالت اعشار داشته یا این که‬
‫به گونه ای تعریف شوند که محاسبه میانگین به‬
‫روش مستقیم وقت گیر و مشکل آفرین باشد‬
‫برای روش غیر مستقیم میانگین این ستون ها ضروری هستند ‪:‬‬
‫‪ -1‬حدود طبقات‬
‫طبقه‬
‫‪ -4‬حاصلضرب فراوانی در نماینده‬
‫‪ -2‬فراوانی مطلق‬
‫‪ -5‬کد طبقات‬
‫‪ -3‬نماینده طبقات‬
‫‪ -6‬حاصلضرب فراوانی در کد طبقه‬
‫‪‬‬
‫ً‬
‫از عالمت ‪( ‬تقریبا مساوی) در فرمول های‬
‫میانگین بدین جهت استفاده می شود که پارامترها‬
‫به واسطه طبقه بندی مشاهدات (استفاده از‬
‫نماینده طبقات) دقیق نمی باشند‬
‫تعریف مد بصورت بیشترین تکرار برای داده های‬
‫پیوسته و طبقه بندی شده بخوبی گویا و رسا نیست‬
‫و رسایی آن فقط در مورد طبقه مددار می باشد‬
Mo

L
Mo
(
d

d1
1
d
)I
2
‫=‬
‫دار‬
‫مد‬
‫طبقه‬
‫واقعی‬
‫پایین‬
‫حد‬
‫‪L Mo‬‬
‫فراوانی مطلق طبقه مدار منهای فراوانی طبقه ماقبل=‬
‫‪1‬‬
‫‪d‬‬
‫فراوانی مطلق طبقه مدار منهای فراوانی طبقه ما بعد=‬
‫‪2‬‬
‫‪d‬‬
‫با تقسیم دامنه تغییرات به چهار قسمت مساوی به‬
‫چارکها‪ ،‬به ده قسمت مساوی به دهکها و به صد‬
‫قسمت مساوی به صدکها خواهیم رسید‬
‫‪ -1‬در کنترل کیفیت آماری‬
‫‪-2‬در مدیریت‬
‫‪-3‬در اقتصاد کالن و سایر علوم مشابه‬
‫‪ -1‬اضافه کردن ستون فراوانی تجمعی به جدول‬
‫‪ -2‬پیدا کردن محل چارک مورد نظر با استفاده از فرمول‬
‫مربوطه‬
‫‪ -3‬پیدا کردن طبقه چارک دار و استفاده از فرمول چارک‬
‫‪aN‬‬
‫‪‬‬
‫‪4‬‬
‫‪a‬‬
‫‪a‬‬
‫= شماره چارک (‪ 2،1‬یا ‪)3‬‬
‫‪ = N‬تعداد کل مشاهدات‬
‫‪CQ‬‬
aN
Q

a
LQ
4
(
a

Fc
F
i
i 1
)I
‫مقدار چارک = ‪Q‬‬
‫‪a‬‬
‫حد پایین واقعی طبقه چارک دار = ‪L Q‬‬
‫‪a‬‬
‫فراوانی تجمعی طبقه ما قبل طبقه چارک دار =‬
‫‪i 1‬‬
‫‪Fc‬‬
‫فراوانی مطلق طبقه چارک دار = ‪F‬‬
‫‪i‬‬
‫) ‪( Da‬‬
‫‪ -1‬اضافه کردن ‪ F‬به جدول‬
‫‪C‬‬
‫‪ -2‬پیدا کردن محل دهک با استفاده از‬
‫‪aN‬‬
‫‪10‬‬
‫‪‬‬
‫‪ -3‬محاسبه دهک با استفاده از مراحل قبلی و‬
‫فرمول چارک‬
‫‪a‬‬
‫‪CD‬‬
aN
D
a

LD
4
(
a

Fc
F
i
i 1
)I
‫حد پایین واقعی طبقه دهک دار = ‪L D‬‬
‫‪a‬‬
‫فراوانی مطلق طبقه دهک دار = ‪F‬‬
‫‪i‬‬
‫فراوانی تجمعی طبقه ما قبل طبقه دهک دار =‬
‫‪i 1‬‬
‫فاصله طبقات = ‪I‬‬
‫‪Fc‬‬
‫صدکها را با ‪ P a‬نشان می دهند و مراحل محاسبه‬
‫ً‬
‫آن تقریبا مشابه دهکها و چارکها است و مقدار‬
‫محاسبه شده نیز همانند سایر پارامترهای مربوط به‬
‫جداول تقریبی است‬
‫‪i 1‬‬
‫‪)I‬‬
‫‪Fc‬‬
‫‪i‬‬
‫‪aN‬‬
‫از‬
‫‪100‬‬
‫‪‬‬
‫‪a‬‬
‫‪CP‬‬
‫‪‬‬
‫‪F‬‬
‫‪aN‬‬
‫‪100‬‬
‫(‪‬‬
‫‪a‬‬
‫‪LP‬‬
‫‪‬‬
‫‪a‬‬
‫‪P‬‬
‫برای پیدا کردن محل صدک‬
‫استفاده می شود‬
‫اگر در توزیع فراوانی طول و عرض طبقات مساوی‬
‫نباشد در این صورت ‪ ،‬باید کرانه ها را محاسبه‬
‫نموده و از حد پایین آنها استفاده نمود‬
‫‪ -1‬انحراف متوسط از میانگین) ‪A D ‬‬
‫‪ -2‬دامنه میان چارکی ) ‪( IQR‬‬
‫‪ -3‬انحراف چارکی‬
‫‪ -4‬واریانس‬
‫‪2‬‬
‫)‬
‫‪x‬‬
‫(‬
‫) ‪( SIQR‬‬
‫‪( ‬و واریانس تصحیح‬
‫شده ) ‪(  c‬‬
‫‪2‬‬
‫این فرمول در داده های طبقه بندی به شکل زیر می‬
‫باشد در این فرمول‪ F‬فراوانی طبقه ‪ i‬ام می‬
‫باشد‬
‫‪ Fi X i x‬‬
‫‪‬‬
‫‪AD ‬‬
‫‪i‬‬
‫‪‬‬
‫‪N‬‬
‫از این پارامترهای پراکندگی زمانی استفاده می شود‬
‫که دنباله های توزیع نا معین و باز باشد ( در این‬
‫حالت محاسبه میانگین و واریانس امکان پذیر نیست‬
‫)‬
 F ( X i  x )
N
2



2

x
2
x

‫فرمول‬
‫ روش مستقیم اول‬-1
i
F Xi
N
2
i

2
2 


x
I 

F d
N
i


2
i
2
X
‫فرمول‬

 F i d i ‫دوم‬

(
‫مستقیم‬
‫ روش غیر‬-2
)
2
N

‫اگر جامعه آماری از ترکیب چند جامعه مستقل با‬
‫میانگین ها و واریانس های مشخص تشکیل شده‬
‫باشد ‪ ،‬می توان میانگین و واریانس جامعه کل را‬
‫بدست آورد‬
‫‪i‬‬
‫‪N ‬‬
‫‪‬‬
‫‪N‬‬
‫‪i‬‬
‫‪K‬‬
‫‪  N   ...  N ‬‬
‫‪N‬‬
‫‪ ‬‬
‫‪‬‬
‫‪‬‬
‫‪...‬‬
‫‪‬‬
‫‪N N‬‬
‫‪N‬‬
‫‪K‬‬
‫‪2‬‬
‫‪2‬‬
‫‪K‬‬
‫‪ = N‬تعداد مشاهدات هر‬
‫جامعه‬
‫‪ = µ‬میانگین هر جامعه‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬

2

N
N
i
 N (  i  )

N
2
2
i
i
‫‪2‬‬
‫‪i‬‬
‫‪ = ‬واریانس جامعه ‪ i‬ام‬
‫‪ = N‬تعداد مشاهدات جامعه کل‬
‫‪ = N i‬تعداد مشاهدات جامعه ‪ i‬ام‬
‫‪µ‬‬
‫‪ = µ‬میانگین جامعه ‪ i‬ام‬
‫= میانگین جامعه کل‬
‫‪i‬‬
‫در هنگام مقایسه دو یا چند جامعه ‪ ،‬در صورت‬
‫مساوی بودن پارامترهای مرکزی و پراکندگی ‪ ،‬این‬
‫پارامترها با بهره گیری از ضریب چولگی کارساز‬
‫خواهند بود‬
‫‪ -1‬متقارن ( نرمال ) ‪:‬‬
‫‪ -2‬چـولـه به راسـت ‪:‬‬
‫‪ -3‬چـولـه بـه چــپ ‪:‬‬
‫مد = میانه = میانگین‬
‫مد < میانه < میانگین‬
‫مد > میانه > میانگین‬
‫‪ -1‬صفر ‪ :‬در صورت متقارن بودن توزیع جامعه‬
‫‪ -2‬مثبت ‪ :‬در صورت چوله به راست بودن توزیع جامعه‬
‫‪ -3‬منفی ‪ :‬در صورت چوله به چپ بودن توزیع جامعه‬
‫اگر دم توزیع جامعه به سمت راست باشد ‪،‬‬
‫توزیع را چوله به راست و در صورت‬
‫عکـس ‪ ،‬آن را چوله به چپ می نامند‬
‫چوله به‬
‫چپ‬
‫چوله به‬
‫راست‬
‫ً‬
‫جامعه تقریبا نرمال‬
‫‪SK ،  0 / 1 -1‬‬
‫تفاوت‪0‬اندک با توزیع نرمال‬
‫‪/ 1 ، SK  0 / 5 -2‬‬
‫تفاوت فاحش با توزیع نرمال‬
‫‪SK ،  0 / 5 -3‬‬
‫‪ -1‬ضریب چولگی گشتاوری‬
‫‪ -2‬ضریب های چولگی پیرسون‬
‫‪ -3‬ضریب های چولگی چندکی‬
‫‪3‬‬
‫‪3‬‬
‫‪x‬‬
‫) ‪ F ( X i  x‬‬
‫‪N‬‬
‫‪r‬‬
‫‪‬‬
‫‪‬‬
‫‪SK‬‬
‫‪3‬‬
‫‪i‬‬
‫‪‬‬
‫‪r3‬‬
‫‪x‬‬
‫گشتاور مرتبه سوم به مبدأ میانگین‬
‫‪ ‬انحراف معیار‬
S K
S K
2
1


(
 Mo )
X

3( 
x
‫فرمول شماره‬
1
 Md )
X

x
‫فرمول شماره‬
2
‫ضریب چولگی‬
‫چارکی‬
‫‪‬‬
‫‪1‬‬
‫‪2Q  Q‬‬
‫‪Q Q‬‬
‫‪1‬‬
‫‪10‬‬
‫ضریب چولگی‬
‫صدکی‬
‫‪2‬‬
‫‪P‬‬
‫‪3‬‬
‫‪Q‬‬
‫‪‬‬
‫‪Q‬‬
‫‪SK‬‬
‫‪3‬‬
‫‪ 2 P 50 ‬‬
‫‪10‬‬
‫‪P‬‬
‫‪‬‬
‫‪90‬‬
‫‪P‬‬
‫‪90‬‬
‫‪P‬‬
‫‪‬‬
‫‪P‬‬
‫‪SK‬‬
‫این پارامترها برای مقایسه توزیع جوامع مورد نظر با‬
‫توزیع جامعه نرمال به لحاظ کشیدگی ( کوتاهی و‬
‫بلندی توزیع ) مورد استفاده قرار می گیرد‬
‫‪ -1‬مساوی توزیع نرمال ( ‪) E=0‬‬
‫‪ -2‬بلندتر از توزیع نرمال ( ‪) E>0‬‬
‫‪ -3‬کوتاه تر از توزیع نرمال ( ‪) E<0‬‬
‫توزیع کشیده تر ‪E>0‬‬
‫توزیع نرمال ‪E=0‬‬
‫توزیع پراکنده تر ‪E<0‬‬
‫‪ Md  Mo‬‬
‫‪x‬‬
‫‪‬‬
‫‪ -1‬توزیع نرمال‪E  0 / 1‬‬
‫‪ -2‬توزیع نسبت ًا بلندتر از‬
‫نرمال‬
‫‪0/1 E 0/5‬‬
‫‪ -3‬توزیع کام ً‬
‫ال کشیده تر از‬
‫نرمال‬
‫‪E 0/5‬‬
‫‪ -1‬ضریب کشیدگی گشتاوری ؛ با استفاده از‬
‫گشتاور مرتبه چهارم به مبدأ میانگین‬
‫‪ -2‬ضریب کشیدگی چندکی ؛ با استفاده از‬
‫انحراف چارکی و صدکهای دهم و نودم‬
 F ( X i  x )
N
4
E

r

4
4
x
3
r
4

i
3 = ‫عدد ثابت‬
‫مخصـوص توزیـع‬
‫هایی که باالجبار ‪ 0 / 263‬‬
‫با استـفاده از‬
‫چـندکها تـوصـیف‬
‫می شـوند‬
‫‪SIQR‬‬
‫‪10‬‬
‫‪P‬‬
‫‪‬‬
‫‪90‬‬
‫‪‬‬
‫‪P‬‬
‫‪P‬‬
‫‪E‬‬
‫در این فصل دانشجو با برخی از مفاهیم احتمال و‬
‫انواع احتماالت آشنا می شود‬
‫احتمال یعنی شانس وقوع یک پیشامد خاص و‬
‫احتمال وقوع یک پیشامد برابر است با نسبت‬
‫دفعاتی که پیشامد خاص ی در تکرارهای زیاد رخ می‬
‫دهد‬
‫ احتمال ذهنی ‪ ،‬متغیر و وابسته به نظر اشخاص است‬‫ احتمال عینی ‪ ،‬ثابت و مقدار آن از قبل مشخص‬‫است و به عقاید اشخاص بستگی ندارد‬
‫فعالیتی که نتیجه آن از قبل مشخص نیست ولی کل‬
‫حاالت ممکن آن معلوم است ‪ ،‬مثل پرتاب یک سکه‬
‫ً‬
‫‪ ،‬که معلوم نیست دقیقا شیر خواهد آمد یا خط‬
‫مجموعه پیامدهای ممکن یک آزمایش را فضای‬
‫نمونه آن آزمایش می گویند ‪.‬‬
‫فضای نمونه را با ‪ S‬نشان می دهند‬
‫محدود ‪ -‬یعنی این که فضای نمونه تعداد کمی‬
‫عضو داشته باشد‬
‫نامحـدود ‪ -‬یعنی اینکه فضـای نمونه آزمایش ( تعداد‬
‫اعضاء آن ) نامتناهی است‬
‫اگر اعضای فضای نمونه آزمایش قابل شمارش‬
‫باشد ‪ ،‬آن را فضای نمونه گسسته ولی اگر فضای‬
‫نمونه آزمایش ی بصورت اعداد اعشاری باشند آن را‬
‫پیوسته می نامند‬
‫به هر یک از زیر مجموعه های فضای نمونه ‪ ،‬یک‬
‫پیشامد گفته می شود هر پیشامد را با یکی از‬
‫حروف بزرگ انگلیس ی مثل ‪ A‬و ‪ B‬و ‪ C‬و ‪ . . .‬نشان‬
‫می دهند‬
‫پیامدهای مقدماتی یا پیشامدهای اولیه هم شانس‬
‫یعنی این که تمام پیشامدهای اولیه در آزمایش ی‬
‫دارای شانس وقوع برابر باشند یعنی وجود نوعی‬
‫تقارن در آزمایش‬
‫احتمال وقوع پیشامدی مثل ‪ A‬برابر می شود با‬
‫تعدادهای عضو های پیشامد ‪ A‬به تعداد عضوهای‬
‫فضای نمونه‬
‫) ‪n( A‬‬
‫) ‪n( S‬‬
‫‪P( A ) ‬‬
‫برای پیشامدی مثل ‪A‬‬
‫فراوانی نسبی پیشامد ‪ A‬در‪N‬تکرار = )‪P(A‬‬
‫بشرطی که ‪ N‬به سمت بی نهایت میل کند‬
‫برای هر پیشامدی مثل ‪ A‬چه‬
‫‪0  P( A )  1‬‬
‫‪1‬‬
‫هم شانس و چه غیر هم شانس‬
‫‪P( S )  1‬‬
‫‪2‬‬
‫این قواعد عبارتند از ‪:‬‬
‫‪ -1‬قاعده ضرب ‪ -2‬جایگشت (ترتیب)‬
‫‪ -3‬ترکیب‬
‫‪ -4‬افرازهای (تفکیک های) مرتب‬
‫از این قواعد در وضعیت هایی استفاده می شود که‬
‫فهرست نمودن تمام حاالت ممکن آزمایش مقدور‬
‫نمی باشد ‪ ،‬لذا فقط به ذکر تعداد حاالت ممکن و‬
‫مختلف اکتفا می شود‬
‫اساس ی ترین اصل در شمارش « قاعده ضرب »‬
‫است و این اصل مختص آزمایش هایی است که در‬
‫ً‬
‫آنها عملیات در چند مرحله ( مثال ‪ ) K‬مرحله انجام‬
‫می پذیرد‬
‫طرق ممکن انجام عمل در آزمایش ی که مرحله اول‬
‫آن به ‪ n‬طریق و ‪ . . .‬مرحله ‪ K‬ام آن به ‪ n‬طریق‬
‫انجام میگیرد ‪ ،‬عبارت خواهد بود از ‪:‬‬
‫‪1‬‬
‫‪K‬‬
‫‪‬‬
‫‪‬‬
‫‪...‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪nK‬‬
‫این نمودار روش ی است منظم برای نشان کل حاالت‬
‫ممکن در آزمایشاتی که عملیات در آنها طی چندین‬
‫مرحله انجام می پذیرد ( مکمل قاعده ضرب )‬
‫یعنی تعداد طرقی که می توان ‪ r‬ش ی را از بین ‪ n‬ش ی‬
‫انتخاب نمود بطوریکه ‪ r  n‬و ترتیب قرار گرفتن‬
‫اشیاء نیز مهم باشد‬
‫‪ -1‬تعداد کل جایگشت های ‪ N‬ش ی متمایز‬
‫‪ -2‬تعداد کل جایگشت های ‪ N‬ش ی نامتمایز‬
‫‪ -3‬تعداد جایگشت های ‪ r‬ش ی انتخابی از بین ‪ N‬ش ی‬
‫متمایز‬
‫‪ -1‬در صورت ردیفی بودن بشکل‬
‫‪n!=n×(n-1)×…3×2×1‬‬
‫‪ -2‬در صورت دایره ای بودن ‪(n-1)!=(n-1)(n-2)×…3×2×1‬‬
‫!‪n‬‬
‫شروط‬
‫‪ -1‬از ‪ n‬شی ‪n،‬‬
‫‪1‬‬
‫‪2‬‬
‫‪n = n -2‬‬
‫‪K‬‬
‫‪n‬‬
‫‪n‬‬
‫…!‬
‫‪K‬‬
‫تای آنها از یک نوع‬
‫‪2‬‬
‫!‬
‫تای آنها از نوع دیگر و ‪...‬‬
‫‪+ n + n. . . +‬‬
‫‪2‬‬
‫‪1‬‬
‫!‪n n‬‬
‫‪1‬‬
‫شروط ‪-1 :‬‬
‫‪-2‬‬
‫!‪n‬‬
‫متمایز‬
‫دو‬
‫هر‬
‫‪r‬و‪n‬‬
‫!) ‪( n  r‬‬
‫‪r<n‬‬
‫‪‬‬
‫‪n‬‬
‫‪r‬‬
‫‪P‬‬
‫‪ -1‬توجه به تعداد اشیاء و حجم انتخابی از بین آنها‬
‫‪ -2‬توجه به ردیفی یا دایره ای بودن اشیاء‬
‫‪ -3‬توجه به متمایز یا نامتمایز بودن اشیاء‬
‫تعداد طرق انتخـاب ‪ r‬ش ی متمـایز از بین ‪ n‬شـی‬
‫بشرطی که ترتیب قرار گرفتن اشیاء باعث افزایش‬
‫تعداد طرق نگردد‬
‫فرمول‬
‫!‪n‬‬
‫!) ‪( n  r‬‬
‫‪)‬‬
‫‪n‬‬
‫(‬
‫‪r‬‬
‫‪ n1 ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ r1 ‬‬
‫ترکیب دوم‬
‫اگر ترکیب اول به شکل‬
‫بصورت‬
‫‪n ‬‬
‫‪ n2 ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ r2 ‬‬
‫‪K‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ rK ‬‬
‫و ‪ . . .‬ترکیب آخر به شکل‬
‫‪n ‬‬
‫صورت ‪:‬‬
‫‪K‬‬
‫تعداد کل طرق‬
‫‪‬‬
‫‪‬‬
‫‪K ‬‬
‫باشد در آن‬
‫‪. . ‬‬
‫‪r‬‬
‫‪.‬‬
‫‪ n1   n 2 ‬‬
‫‪  ‬‬
‫‪  ‬‬
‫‪ r1   r2 ‬‬
‫فرمول‬
‫ویژگی ها ‪:‬‬
‫‪‬‬
‫!‪n‬‬
‫=‪‬‬
‫‪ n1 n‬‬
‫‪nK‬‬
‫… ! ‪!2‬‬
‫‪nK ‬‬
‫‪,‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪ ,‬‬
‫‪, ...‬‬
‫‪n‬‬
‫‪n‬‬
‫‪1‬‬
‫‪2‬‬
‫‪‬‬
‫!‬
‫‪ -1‬تفکیک ‪ n‬شی به گونه ای خاص‬
‫‪ -2‬در حکم یک مجموعه بودن هر ترکیب‬
‫‪ -3‬مهم نبودن ترتیب اشیاء در هر زیر مجموعه‬
‫در این نمودار به منظور نشان دادن پیشامد ها‬
‫‪،‬کل فضای نمونه در قالب مستطیلی ارائه‬
‫شده و هر پیشامدی قسمتی از این مستطیل را‬
‫به خود اختصاص می دهد‬
‫این احتمال برابر است با سطحی که پیشامد ‪A‬‬
‫از ‪( S‬فضای نمونه) اشغال کرده است‬
‫‪S‬‬
‫‪A‬‬
‫دو پیشامد را در صورتی « نا سازگار »‬
‫گویند که امکان وقوع همزمان نداشته باشند‬
‫یعنی با وقوع یکی ‪ ،‬دیگری امکان وقوع‬
‫نداشته باشد مثل شب و روز‬
‫نمودار نشان می دهد که پیشامدهای ‪ A‬و ‪B‬‬
‫هیچ وجه اشتراکی با هم ندارند‬
‫‪S‬‬
‫‪B‬‬
‫‪A‬‬
‫دو پیشامدی را گویند که وقوع یکی مانع‬
‫وقوع دیگری نیست بعبارتی این دو پیشامد‬
‫دارای حداقل یک عضو مشترک هستند‬
‫محل تالقی دو پیشامد ‪ ،‬نقطه مشترک آنهاست‬
‫(جائیکه دو بار هاشور خورده است)‬
‫‪S‬‬
‫‪B‬‬
‫‪A‬‬
‫اجتماع دو پیشامدی مثل ‪ A‬و ‪ ، B‬مجموعه‬
‫تمام عضوهایی است که در ‪ A‬یا در ‪ B‬یا هم‬
‫در ‪ A‬و هم در ‪ B‬قرار دارند‬
‫اجتماع دو پیشامد ‪ A‬و ‪ B‬را با‪ A B‬نشان‬
‫می دهند ‪ .‬‬
‫وقوع ‪ A B‬یعنی این که حد اقل‬
‫یکی از دو پیشامد مذبور رخ داده است‬
A B
S
A
B
‫اشتراک دو پیشامدی مثل ‪ A‬و ‪ B‬را با ∩ ‪A‬‬
‫‪B‬نشان می دهند ‪ .‬وقوع ‪ A ∩ B‬یعنی این که‬
‫هر دو پیشامد ‪ A‬و ‪ B‬رخ داده است‬
‫یعنی این که هم پیشامد ‪ A‬و هم پیشامد ‪ B‬رخ‬
‫داده است‬
‫‪S‬‬
‫‪B‬‬
‫‪A‬‬
‫‪C‬‬
‫متمم پیشامدی مثل ‪ A‬که با‪ A‬نشان داده می‬
‫شود مجموعه تمام عضوهایی است که در‬
‫فضای نمونه است ولی در خود پیشامد ‪A‬‬
‫نیست‬
‫‪C‬‬
‫‪C‬‬
‫وقوع متمم ‪A( A‬‬
‫‪A‬‬
‫) به معنی عدم وقوع‬
‫پیشامد ‪ A‬می باشد‬
‫‪S‬‬
‫‪C‬‬
‫‪A‬‬
‫‪A‬‬
A A
 P( A
C
C

S
 P( S )  1  P( A )  P(
)  1  P( A ) , P( A )  1  P(
A
A
C
)
C
)1
‫) ‪1  P( A  B )  P( A )  P( B )  P( A  B‬‬
‫برای دوپیشامد سازگار‬
‫) ‪2  P( A  B )  P( A )  P( B‬‬
‫برای دوپیشامد ناسازگار‬
‫) ‪P( A  B‬‬
‫‪P( A / B ) ‬‬
‫) ‪P( B‬‬
‫شروط ‪ -1 :‬وقوع ‪ A‬به ‪ B‬مربوط بوده‬
‫‪ B -2‬قب ً‬
‫ال رخ داده‬
‫‪P ( B )  0-3‬‬
P( B / A ) 
P( A  B )
P( A )
ً ‫ قب‬A -1 : ‫شروط‬
‫ال رخ داده‬
P ( A )  0-2
‫با استفاده از احتمـال شرطی می توان قانـون‬
‫ضرب را برای محاسبه احتمال اشتراک‬
‫پیشامدها بشرح زیر بیان نمود‬
‫) ‪P( A  B )  P( A )P( B / A‬‬
‫یا‬
‫) ‪P( A  B )  P( B )P( A / B‬‬
‫دو پیشامد را « مستقل » می گوییم ‪ ،‬در‬
‫صورتی که وقوع یا عدم وقوع یکی در وقوع‬
‫و یا عدم وقوع دیگری هیچ تأثیری نداشته‬
‫باشد‬
‫چون ‪ A‬و ‪ B‬هیچ تأثیری بر روی هم ندارند‬
‫برای محاسبه احتمال اشتراک آنها بشکل زیر‬
‫عمل می شود ‪:‬‬
‫) ‪P( A  B )  P( A )P( B‬‬
‫شرط ناسازگار بودن دو پیشامد‬
‫‪A  B    P( A  B )  0‬‬
‫شرط مستقل بودن دو پیشامد‬
‫) ‪P( A  B )  P( A )P( B‬‬
‫پیشامدها نسبت به هم می تواند ‪ ،‬حالت‬
‫سازگار و مستقل ‪ ،‬سازگار و غیر مستقل ‪،‬‬
‫ناسازگار و غیر مستقل و ‪ . . .‬داشته باشند‬
‫این قضیه پژوهشگران را در تجدید نظر‬
‫احتماالت ‪ ،‬در صورت دسترسی به اطالعات‬
‫جدید ‪ ،‬کمک می کند‬
‫فرمول‬
‫) ‪P( A )P( B / A‬‬
‫) ‪P( B‬‬
‫‪P( A / B ) ‬‬
‫به احتمال وقوع پیشامدی قبل از کسب‬
‫اطالعات جدید « احتمال پیشین » و به احتمال‬
‫وقوع آن پیشامد بعد از کسب اطالعات جدید «‬
‫احتمال پسین » می گویند‬
‫هدف این فصل آشناسازی دانشجویان با‬
‫متغیرهای تصادفی گسسته ‪ ،‬توابع احتمال و توزیع‬
‫های مربوط به آنهاست‬
‫تابعی است که روی فضای نمونه تعریف می‬
‫شود و هر یک از مقادیر آن ‪ ،‬متناظر با یک‬
‫یا چند عضو از اعضای فضای نمونه است‬
‫با توجه به این که هر تابع دارای دامنه و‬
‫حوزه می باشد دامنه یک متغیر تصادفی نیز‬
‫فضای نمونه ( ‪ ) S‬و حوزه اش مجموعه اعداد‬
‫حقیقی است‬
‫‪ -1‬متغیر تصادفی گسسته ؛ با تعداد مقادیر‬
‫متناهی یا شمارش پذیر‬
‫‪ -2‬متغـیر تصادفی پیوسـته ؛ با تعداد مقادیر‬
‫ممـکن نامتناهی و غیر قابل شمارش‬
‫متغیرهای تصادفی را با حروف بزرگ التین‬
‫مثل ‪ Z‬و ‪ Y‬و ‪ X‬و هر یک از مقادیر انتخابی‬
‫آنها را با حروف کوچک ‪ z‬و ‪ y‬و ‪ x‬نشان می‬
‫دهند‬
‫به تابعی که بتوان با استفاده از آن احتمال هر‬
‫یک از مقادیر ممکن متغیر تصادفی را‬
‫مشخص کرد « تابع احتمال » یا « توزیع‬
‫احتمال » گویند‬
‫تابع احتمال تابعی است که دامنه آن مقادیر‬
‫ممکن متغیر تصادفی و حوزه آن احتماالت‬
‫مربوط به هر مقدار از متغیر تصادفی است‬
‫تابع توزیع ‪ ،‬تابعی است که به ازای جمیع‬
‫مقادیر ممکن متغیر تصادفی ‪ ، X‬احتمال وقوع‬
‫مقداری کوچکتر یا مساوی با ‪ X‬را نشان می‬
‫دهد‬
‫امید ریاضی متغیر تصادفی ‪ X‬که )‪ E(X‬نشان‬
‫داده می شود همان میانگین موزون است که‬
‫احتماالت در آن ‪ ،‬نقش ضرایب ( وزن ها )‬
‫را ایفاء می کنند‬
‫امید ریاضی یک متغیر تصادفی از حاصل‬
‫جمع ضرب هر متغیر تصادفی در مقدار‬
‫احتمال خودش بدست می آید‬
‫) ‪X  f(X‬‬
‫‪‬‬
‫‪E( X ) ‬‬
‫این واریانس با )‪ V(X‬نشان داده شده و میزان‬
‫پراکندگی را حول میانگین ( امید ریاضی )‬
‫نشان می دهد‬
1
2
V( X )

V( X )
( X  ) f ( X )
2

E( X
2
) 

2
  E( X )
‫تابع احتمال توأم عبارتست از فهرستی از‬
‫های‬
‫زوج‬
‫‪X , Y ‬‬
‫‪f X , Y ‬‬
‫و احتمال های متناظر با آنها ‪ ،‬یعنی‬
‫‪j‬‬
‫‪i‬‬
‫‪j‬‬
‫‪i‬‬
‫هر گاه پژوهشگر بخواهد رفتار متغیری مثل‬
‫‪ X‬را در ارتباط با رفتار متغیر دیگری مثل ‪Y‬‬
‫بررسی نماید ‪ ،‬از این تابع استفاده می کند‬
‫‪ -1‬احتماالت حاشیه ای ‪ : X‬برای پیدا کردن‬
‫تابع احتمال متغیر تصادفی ‪X‬‬
‫‪ -2‬احتماالت حاشیه ای ‪ : Y‬برای پیدا کردن‬
‫تابع احتمال متغیر تصادفی ‪Y‬‬
‫معیار عددی است که نوع و شدت رابطه‬
‫خطی بین دو متغیر تصادفی را نشان می دهد‬
‫و عبارتست از امید ریاضی تغییرات دو متغیر‬
‫بر حسب میانگین شان‬
‫‪ -1‬رابطه مستقیم ‪ :‬حرکت هم جهت متغیرها‬
‫‪ -2‬رابطه معکوس ‪ :‬حرکت بصورت خالف‬
‫جهت هم‬
‫‪ -3‬عدم وجود رابطه ‪ :‬عدم تأثیر متغیرها بر‬
‫هم‬
‫‪ -1‬مثبت ‪ :‬در صورت وجود رابطه مستقیم بین‬
‫متغیرها‬
‫‪ -2‬منفی ‪ :‬در صورت وجود رابطه معکوس‬
‫بین متغیرها‬
‫‪ -3‬صفر ‪ :‬در صورت عدم وجود رابطه بین‬
1  COV ( X ,Y )  E ( X 

)( Y 
X

)
Y
‫یا‬
2  COV ( X ,Y )  E ( XY )  E ( X ) E ( Y )
‫و‬
E ( XY )   
i
j
x y
i
f
j
 X Y x ‫در صورت گسسته بودن‬
i
j
y‫و‬
‫دو متغیر تصادفی ‪ X‬و ‪ Y‬در صورتی مستقل‬
‫ازای ‪ X‬‬
‫اند که به‪, Y ‬‬
‫تمام زوج های‬
‫رابطه روبرو برقرار باشد‬
‫) ‪f ( xi , y )  f ( xi )  f ( y‬‬
‫‪j‬‬
‫‪j‬‬
‫‪i‬‬
‫‪j‬‬
‫‪ x‬و ‪ y‬مستقل‬
‫اند‬
‫اگر ‪ x‬و ‪ y‬مستقل باشند ‪ ،‬کواریانشان‬
‫حتم ًا صفر است ولی عکس قضیه‬
‫همیشه صادق نیست‬
‫‪COV ( X ,Y )  0‬‬
‫ویژگی ها ‪:‬‬
‫‪ -1‬آزمایش فقط یک بار صورت می گیرد‬
‫‪ -2‬فقط دو پیامد ممکن دارد‬
‫‪ -3‬احتمال موفقیت و شکست ثابت است ( البته در‬
‫صورت تکرار آزمایش )‬
‫‪ -4‬آزمایش ها مستقل از یکدیگر انجام می شوند‬
‫‪ P‬یعنی احتمال موفقیت ( احتمال وقوع پیشامد‬‫مورد نظر )‬
‫ ‪ q‬یعنی احتمال شکست ( احتمال عدم وقوع‬‫پیشامد مورد نظر )‬
‫‪ p‬و ‪ q‬مکمل یکدیگر هستند‬
‫نمونه گیری های بدون جایگزینی از جامعه‬
‫باعث متغیر شدن احتمال موفقیت و شکست در‬
‫آزمایش ها شده و توزیع را از حالت برنولی‬
‫خارج می کند‬
‫نمونه گیری با جایگزینی از کلیه جوامع‬
‫آماری و نمونه گیری بدون جایگزینی صرف ًا‬
‫از جوامع خیلی بزرگ ‪ ،‬می تواند به برنولی‬
‫بودن توزیع کمک نماید‬
‫ویژگیها‪:‬‬
‫‪ -1‬تکرار آزمایش ( ‪ n‬بار )‬
‫‪ -2‬هر آزمایشی فقط دو پیامد دارد‬
‫‪ -3‬ثابت بودن ‪ p‬و ‪ q‬در هر آزمایش‬
‫‪ -4‬مستقل بودن آزمایش ها از همدیگر‬
 
P( X  x )   
x
n
x  0 ,1 ,2 ,..., n
x
p q
n x
‫تعداد آزمایش ها = ‪n‬‬
‫تعداد موفقیت های مورد نظر =‬
‫‪x‬‬
‫احتمال موفقیت در هر آزمایش‬
‫=‪p‬‬
‫‪ -1‬اگر ‪ p = 0/5‬باشد ‪ ،‬توزیع متقارن‬
‫‪ -2‬اگر ‪ p > 0/5‬باشد ‪ ،‬توزیع چوله به چپ‬
‫‪ -3‬و اگر ‪ p < 0/5‬باشد ‪ ،‬توزیع چوله به‬
‫راست است‬
‫وقتی که ‪ n‬نسبت ًا بزرگ است ‪ ،‬محاسبه احتمال‬
‫از طریق فرمول کار خسته کننده ای می شود‬
‫‪ ،‬لذا برای رفع این مشکل از جدول های‬
‫مخصوصی استفاده می شود‬
‫‪1- E(X) = np‬‬
‫‪2- V(X) = npq‬‬
‫‪ n‬و ‪ p‬و ‪ q‬پارامترهای توزیع دو جمله ای‬
‫هستند‬
‫پیدا کردن احتمال این که ‪ ،‬از بین ‪ N‬شی که‬
‫‪ K‬تای آنها واجد شرایط است ‪ n ،‬شی را‬
‫برگزینیم بطوریکه ‪ X‬تای آن واجد شرایط‬
‫باشد‬
N k
 

 

 x  n x 
P( X  x ) 
,
x

0
,
1
,...,
k
N
 
 
n
k
‫اگر ‪ n < %5N‬باشد می توان در محاسبه‬
‫میزان احتماالت توزیع فوق هندسی از توزیع‬
‫دوجمله ای کمک گرفت‬
‫توزیع فوق هندسی برای نمونه گیری های‬
‫بدون جایگذاری است ولی وقتی ‪ N‬بزرگ و ‪n‬‬
‫‪k‬‬
‫کوچک است ‪ p‬تقریب ًا‪p ‬‬
‫ثابت می ماند (‬
‫‪N‬‬
‫) و حالت توزیع دو جمله ای بخود می گیرد‬
‫اگر ‪ n‬به سمت بی نهایت و ‪ p‬به سمت صفر‬
‫میل کند و در عین حال مقدار ‪ np‬ثابت بماند ‪،‬‬
‫می توان بجای توزیع دو جمله ای از توزیع‬
‫پواسون استفاده نمود‬
P( X  x ) 
e


x!
  np ‫بعنوان پارامتر‬
‫توزیع‬
‫ و‬e  2 / 718
x
, x  0 ,1 ,2 ,...
‫از بین کلیه توزیع های رایج ‪ ،‬توزیع پواسون‬
‫تنها توزیعی است که میانگین و واریانس آن با‬
‫هم برابرند‬
‫‪E( X )  ‬‬
‫‪V( X ) ‬‬
‫‪ -1‬بعنوان تقریب یا برآورد کننده میزان‬
‫احتمال توزیع های دو جمله ای تحت شرایط‬
‫خاص‬
‫‪‬‬
‫محاسـبه احتماالت مربـوط به تعـداد‬
‫‪-2‬‬
‫مراجعات به سیستم با در واحد زمان ( ‪) t‬‬
‫‪x‬‬
‫فرمول‬
‫) ‪e ( t‬‬
‫‪ t‬‬
‫‪P( X  x ) ‬‬
‫!‪x‬‬
‫‪x  0 ,1 ,2 ,...‬‬
‫میانگین مراجعات در واحد زمانی ‪ t ‬‬
‫معین‬
‫هدف اصلی این فصل آشنا ساختن دانشجویان با‬
‫متغیرهای تصادفی پیوسته و تعدادی از توابع مهم‬
‫آنهاست‬
‫بخاطر این که میزان احتمال در توابع پیوسته‬
‫در یک نقطه معین مساوی صفر است ‪ ،‬لذا در‬
‫این گونه توابع ‪ ،‬احتمال همیشه در قالب یک‬
‫فاصله تعیین می شود‬
‫احتمال این که متغیر تصادفی پیوسته ‪x‬‬
‫مقداری بین دو نقطه ‪ a‬و ‪ b‬را بگیرد برابر‬
‫است با‬
‫‪f ( X ) dx‬‬
‫‪b‬‬
‫‪‬‬
‫‪a‬‬
‫‪P( a  X  b ) ‬‬
‫) ‪P( a  X  b )  P( a  X  b )  P( a  x  b )  P( a  X  b‬‬
‫پس عالمت مساوی در این توزیع ها نقشی‬
‫ایفاء نمی کند‬
‫یعنی ضرب متغیر تصادفی در تابع چگالی‬
‫خود و سپس انتگرال گیری به ازای مقادیر‬
‫متغیر‬
‫ممکن‬
‫‪‬‬
‫‪E ( X )   X  f ( X ) dx‬‬
‫‪‬‬
‫یعنی کسر متغـیر تصادفـی از میانگین خود ‪،‬‬
‫به توان ‪ 2‬رساندن نتیجه و ضرب نتیجه‬
‫حاصله به تابع چگالی و انتگرال گیری‬
‫‪2‬‬
‫‪f ( x ) dx‬‬
‫‪ X  E ( X )‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪V( X )‬‬
‫در این فصل دانشجویان با مهم ترین و کاربردی‬
‫ترین نوع توزیع از زیر مجموعه توزیع های پیوسته‬
‫آشنا می شوند‬
‫متغیر تصادفی پیوسته ‪ x‬در صورت داشتن‬
‫تابع چگالی زیر دارای توزیع نرمال است‬
‫‪‬‬
‫‪‬‬
‫(‬
‫‪X‬‬
‫‪‬‬
‫‪‬‬
‫)‬
‫‪/‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪1‬‬
‫‪‬‬
‫‪1‬‬
‫‪e‬‬
‫‪2‬‬
‫‪2‬‬
‫‪f(X )‬‬
‫)‪X ≈ N ( µ , δ‬‬
‫‪ ( µ‬میانگین ) و ‪ ( δ‬انحراف معیار ) دو‬
‫پارامتر توزیع نرمال بوده و با مشخص بودن‬
‫آنها ‪ ،‬منحنی توزیع قابل ترسیم می باشد‬
‫در یک توزیع نرمال هر قدر میانگین افزایش یابد ‪ ،‬باعث‬
‫می شود که منحنی آن بیشتر به سمت راست انتقال یابد )‪f(x‬‬
‫‪x‬‬
‫‪2‬‬
‫‪‬‬
‫‪1‬‬
‫‪‬‬
‫‪ ‬‬
‫‪‬‬
‫‪1‬‬
‫‪ ‬‬
‫‪2‬‬
‫هر قدر انحراف معیار افزایش یابد ‪ ،‬منحنی توزیع‬
‫نرمال کوتاه تر (بعبارتی پهن تر) می شود‬
‫)‪f(x‬‬
‫‪1‬‬
‫‪S>S‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪S‬‬
‫‪x‬‬
‫‪2‬‬
‫‪‬‬
‫=‬
‫‪1‬‬
‫‪‬‬
‫‪S‬‬
‫‪ -1‬سطح زیر منحنی همیشه برابر یک است‬
‫‪ f(x) -2‬همیشه بزرگتر یا مساوی صفر است‬
‫‪ -3‬حداکثر مقدار تابع در ‪ X = µ‬می باشد‬
‫‪ -4‬تابع حول میانگین ‪ ،‬متقارن است‬
‫‪ -5‬میانگین و واریانس ‪ X‬به ترتیب ‪ µ‬و‬
‫می باشد‬
‫‪2‬‬
‫‪ -6‬منحنی در محور ‪ X‬ها ‪ ،‬هیچ گاه به صفر‬
‫نمی رسد‬
‫‪ -7‬میانگین ‪ ،‬میانه و مد با هم برابرند‬
‫‪ -8‬احتمال ‪ x‬با توجه به انحراف معیارهای‬
‫مختلف بشرح ذیل است ‪:‬‬
‫‪P (     x     )  0 / 683‬‬
‫‪P (   2   x    2  )  0 / 954‬‬
‫‪P (   3   x    3  )  0 / 997‬‬
‫یعنی استاندارد کردن متغیر ) ‪ X ≈ N ( µ , δ‬با‬
‫استفاده از متغیر نرمالی که میانگین آن صفر‬
‫و واریانس اش یک است و سپس استفاده از‬
‫جدول مربوطه‬
‫با کم کردن میانگین از متغیر ‪ x‬و تقسیم نتیجه‬
‫آن بر انحراف معیار ‪ z ،‬بدست می آید‬
‫‪X ‬‬
‫‪‬‬
‫‪z‬‬
‫‪ -1‬استفاده مستقیم ‪ :‬مقدار ‪ Z‬مشخص است و‬
‫احتمال آن را بدست می آوریم‬
‫‪ -2‬استفاده معکوس ‪ :‬احتمال ‪ Z‬مشخص است‬
‫و مقدار آن را بدست می آوریم‬
‫پس از پیدا کردن ‪ Z‬با توجه به میزان احتمال‬
‫اعالم شده ‪ ،‬مقدار ‪ X‬را با استفاده از این‬
‫رابطه پیدا می کنیم‬
‫‪X    z‬‬
‫اگر ‪ n‬بزرگ و ‪ p‬در نزدیکی های صفر یا‬
‫یک نباشد ‪ ،‬تقریب ‪ np‬‬
‫نرمال ‪‬با ‪  npq‬‬
‫پارامترهای‬
‫تقریب خوبی برای توزیع دو جمله‬
‫و‬
‫ای است‬
‫چون توزیع دو جمله ای ‪ ،‬توزیعی گسسته و‬
‫توزیع نرمال ‪ ،‬توزیعی پیوسته است بنابراین‬
‫هنگام استفاده از تقریب نرمال باید تصحیح‬
‫پیوستگی صورت پذیرد (افزایش دامنه)‬
‫وقتی که میانگین توزیع پواسون نسبت ًا بزرگ‬
‫(‪ ) λ≥10‬می شود ‪ ،‬می توان بجای توزیع‬
‫پواسون از فرمول توزیع نرمال استفاده کرد‬
‫میانگین ( ‪ ) µ‬و انحراف معیار ( ‪ ) δ‬عبارت‬
‫خواهند بود از ‪:‬‬
‫‪‬‬
‫‪  ,  ‬‬
‫ضمن ًا استفاده از تصحیح پیوستگی نیز الزم‬
‫است‬
‫در این فصل دانشجویان با فرآیند تصمیم ‪ ،‬انواع‬
‫شرایط تصمیم گیری و معیارهای مختلف اخذ‬
‫تصمیم در شرایط عدم اطمینان آشنا می شوند‬
‫‪ -1‬تعریف روشن مسأله‬
‫هر ترکیب‬
‫‪ -4‬تعیین بازده ناشی از‬
‫‪ -2‬تعیین گزینه های ممکن‬
‫‪ -5‬انتخاب یک مدل کمی‬
‫‪ -3‬تعیین پیامدهای ممکن‬
‫تصمیم‬
‫‪ -6‬بکارگیری مدل و اتخاذ‬
‫حاالت‬
‫طبیعت‬
‫گزینه ها‬
a
a
1
2
S
M
M


a
M
K
1
11
21
S
M
M
2
12
22

K1
M
K2



S
M
M



M
H
1H
2H
KH
‫‪ -1‬تصمیم گیری تحت شرایط اطمینان کامل‬
‫‪ -2‬تصمیم گیری در شرایط عدم اطمینان‬
‫‪ -3‬تصمیم گیری در شرایط ریسک‬
‫در این شرایط تصمیم گیرندگان با اطمینان ‪،‬‬
‫پیامدهای هر گزینه یا تصمیمی را می دانند ‪،‬‬
‫بنابرین گزینه ای را انتخاب می کنند که منافع‬
‫آنها را حداکثر نماید‬
‫در این نوع تصمیم گیری ‪ ،‬تصمیم گیرنده نمی‬
‫داند کدامیک از حاالت طبیعت رخ می دهد در‬
‫ضمن نمی تواند احتمال وقوع هر یک را‬
‫مشخص کند‬
‫در این شرایط تصمیم گیرنده نمی داند کدام یک‬
‫از حاالت طبیعت واقع می شود ‪ ،‬ولی می تواند‬
‫احتمال وقوع هر یک را مشخص کند‬
‫افزایش دانش‬
‫اطمینان‬
‫کامل‬
‫ریسک‬
‫کاهش دانش‬
‫عدم‬
‫اطمینان‬
‫‪ -1‬حداکثر حداکثر‬
‫‪ -2‬حداکثر حداقل‬
‫‪ -3‬احتماالت مساوی‬
‫‪ -4‬واقعگرایی‬
‫‪ -5‬حداقل حداکثر غبن‬
‫معیار خوش بینانه ای است و تصمیم گیرنده تصور‬
‫می کند که همه گزینه ها بیشترین بازدهی خود را‬
‫خواهند داشت ‪ ،‬لذا سعی می کند از بین بهترها ‪،‬‬
‫بهترین را انتخاب نماید‬
‫به معیار بد بینانه معروف است و تصمیم گیرنده ‪،‬‬
‫ابتدا بدترین ( حداقل ترین ) حالت هر گزینه را‬
‫انتخاب و سپس از بین آنها بهترین ( بازدهی حداکثر ) را‬
‫بر می گزیند‬
‫این معیار شانس حاالت مختلف طبیعت را یکسان‬
‫فرض کرده و بدین سبب بدنبال گزینه ای می گردد‬
‫که متوسط بازده آن از بقیه گزینه ها بیشتر باشد‬
‫بر اساس این معیار یک تصمیم گیرنده منطقی نه زیاد‬
‫خوش بین و نه زیاد بد بین است و سعی می کند‬
‫تعادلی بین معیارهای خوشبنیانه و بد بنیانه ایجاد‬
‫نماید‬
‫= معیار واقع گرایی گزینه ‪i‬‬
‫(حداقل بازده گزینه ‪( + )1- α()i‬حداکثر بازده گزینه ‪α )i‬‬
‫جدولی بنام « جدول غبن » تشکیل و حداکثر هر سطر‬
‫را مشخص می کنیم سپس حداقل آنها را تعیین و‬
‫گزینه متناظر با آن را انتخاب می نماییم‬
‫در صورتی که تصمیم گیرنده بتواند احتمال وقوع‬
‫حاالت مختلف طبیعت را برای مسأله تصمیم ‪ ،‬تعیین‬
‫کند ‪ ،‬تصمیم گیری از نوع ریسک خواهد بود‬
‫مهم ترین معیار در این شرایط ‪ « ،‬معیار ارزش پولی‬
‫مورد انتظار » یا همان ‪ EMV‬است ‪ .‬ارزش پولی‬
‫مورد انتظار همان امید ریاض ی بازده است‬
‫زمانی استفاده می شود که در مسأله ای باید‬
‫تصمیمات « پیچیده » و « متوالی » اتخاذ شود و در آن‬
‫از معیار ‪ EMV‬و نمادهایی مثل دایره و مربع استفاده‬
‫می شود‬
‫در اغلب موارد تصمیم گیرنده ‪ ،‬موقع استفاده از‬
‫معیار ‪ ، EMV‬درباره بازده ها و احتماالت نامطمئن‬
‫است ‪ ،‬لذا از تحلیل حساسیت برای تعیین دامنه‬
‫مطلوب برای بهترین گزینه استفاده می کند‬
‫‪ EVPI‬بازده مورد انتظار است اگر اطالعات کامل ‪،‬‬
‫قبل از اخذ تصمیم موجود باشند‬
‫تفاوت بین ارزش مورد انتظار با اطالعات کامل و‬
‫ارزش مورد انتظار بهترین گزینه است ‪ ،‬بعبارتی ‪:‬‬
‫‪ = EVPI - EMVmax‬ارزش مورد انتظار اطالعات کامل‬

similar documents