حق نسخه‌برداری (کپی رایت)

----------------------توجه: استفاده از مطالب این وبلاگ با ذکر منبع مجاز است.

۱۳۹۰ فروردین ۸, دوشنبه

قضیه‌ی حد مرکزی

فرض کنید می‌خواهیم نتیجه‌ی یک انتخابات را پیشبینی کنیم. از افرادی مختلف که ارتباطی به هم ندارند، نظر سنجی می‌کنیم و تعداد رای‌های به نفع هر کاندیدا را در این نمونه می شماریم و از روی آن نتایج را تخمین می‌زنیم. اما از کجا معلوم که نتیجه‌ای که از این نمونه می‌گیریم به نتیجه‌ی واقعی نزدیک است؟
پیش از پاسخ به این سوال، یادآوری می کنیم که قانون اعداد بزرگ می‌گوید که اگر یک مجموعه نمونه‌ی مستقل (بی ارتباط به هم) از یک کمیت را با هم جمع کنیم، و حاصل را بر تعداد نمونه‌ها تقسیم کنیم، عدد حاصل به میانگین نمونه‌ها نزدیک است. به این شکل اگر در یک نمونه‌ی ۷۰۰ نفری، ۷۰ نفر به یک کاندیدای خاص رای دهند، درصد آرای آن کاندیدا ۱۰٪ تخمین زده می‌شود.
قضیه‌ی حد مرکزی تا حدی به این سوال جواب می‌دهد. طبق قانون اعداد بزرگ، اگر یک مجموعه نمونه‌ی مستقل (بی ارتباط به هم) از یک کمیت را با هم جمع کنیم، سپس آن را بر تعداد نمونه تقسیم کنیم، حاصل تقریبا میانگین می‌شود. اما قضیه‌ی حد مرکزی می‌گوید، تخمین حاصل همان قدر از میانگین دور است که توزیع نرمال با میانگین صفر و واریانس  متناسب با واریانس نمونه تقسیم بر تعداد نمونه ()، از صفر.
به عبارت دیگر، اگر دو نامزد انتخاباتی داشته باشیم و نمونه‌ی ما ۷۰۰ نفری باشد که ۷۰ نفر از آن به کاندیدای یک رای داده اند، احتمال این که یک درصد خطا داشته باشیم، یعنی درصد واقعی یک درصد از تخمین ۱۰٪ی ما فاصله داشته باشد،  تقریبا برابر صفر (دو به توان منفی بیست) است!

پ.ن.: لازم به تاکید است که تمام این محاسبات بر مبنای یک نمونه‌ی مستقل انجام شده است. اگر در نمونه‌گیری خطاهای بزرگی مرتکب شویم. تمام این نتایجی که به دست می‌آوریم از اساس غلط است. نمونه‌های تاریخی این نوع اشتباهات هم رخ داده است. یک نمونه‌ی این اشتباه نمونه‌گیری با استفاده از تلفن یا نمونه‌گیری در خیابان است. دقت در نمونه‌گیری شاید پرهزینه‌ترین بخش یک کار آماری است، هم به لحاظ عملیاتی و هم به لحاظ بررسی‌های بعدی برای تایید نتایج.

هیچ نظری موجود نیست:

ارسال یک نظر