حق نسخه‌برداری (کپی رایت)

----------------------توجه: استفاده از مطالب این وبلاگ با ذکر منبع مجاز است.

۱۳۸۹ شهریور ۱۴, یکشنبه

میانگین یا میانه؟

سال گذشته همین روزها بود که در مرکز تحصیلات تکمیلی زنجان، برای بچه های مالی کلاس آمار برگزار شد. مدرسین کلاس آمار کسری علیشاهی استاد ریاضی دانشگاه صنعتی شریف و دستیارشان احمد احیایی دانشجوی دکتری ریاضی بودند. این کلاس یکی از بهترین کلاس های آماری بود که من شرکت کرده بودم، چرا که هم مدرسین آن بسیار در شیوه ی ارائه ی مطالب، ذوق وسلیقه به خرج می دادند، و هم مفاهیمی را که معمولا در کلاس های آمار ارائه نمی شود،  ارائه می دادند.
در یکی از کلاس ها بحث آماره های مرکزی و بحث بین این که میانگین و میانه، کدام آماره ی مناسب تری هستند، مطرح شد. امروز در یکی از روزنامه های محلی منطقه ی واترلو، آماری از خرید فروش مسکن در هشت ماه اول سال و مقایسه ی آن با هشت ماه سال گذشته دیدم. این گزارش روزنامه، مرا به یاد آن کلاس و بحث های آن روز انداخت. قصد دارم در این پست، با چند مثال، آن مطالب را باز تولید کنم.
مثال اول همان مثال روزنامه است. ارقام ارائه شده در روزنامه را دقیقا به خاطر ندارم. برای همین ارقام ارائه شده در این جا کاملا دقیق نستند، اما در بحث ما خللی ایجاد نمی کنند.
در این آمار، میانگین قیمت خانه های فروش رفته در سال فعلی رقمی در حدود ۲۸۰،۰۰۰ دلار ارائه شده بود.می توان گفت که اگر یک نفر از طبقه ی متوسط این عدد را ببیند، نتیجه گیری می کند که خانه خریدن برای او سخت است. اما در ادامه اشاره می کند که خانه های بسیار گران فروش رفته، این میانگین را تا حدی به یک سمت اریب نموده است و میانه ی قیمت خانه حدود ۲۵۰،۰۰۰ دلار است. به نظر من، در این شرایط، میانه برای نتیجه گیری یک فرد از طبقه ی متوسط، در مورد توان خرید خانه معیار بهتری از میانگین است. چرا که خانه های مدرن و با امکانات خاص، که اصلا مورد نظر یک خریدار متوسط نیست، با قیمتی بالای یک میلیون دلار، میانگین را جا به جا کردند. حال آن که همین داده ها در میانه، تغییر کمتری ایجاد می کنند، چون فراوانی بسیار کمتری دارند. به بیان دیگر، داده های پرت میانگین را بیشتر از  میانه تغییر می دهند.
به عنوان مثال دیگر، یک کلاس شش نفره را در نظر بگیرید که یک دانشجوی بسیار قوی دارد و سایر دانشجوها معمولی هستند. در یک امتحان یک است دانشجویان نمره ی کامل ۲۰ می گیرد. در حالی که سایرین، نمره نزدیک به ۱۳ می گیرند. میانگین نمره ها بدون دانشجوی خوب، همان ۱۳است. اگر یک دانشجوی متوسط بخواهد بر اساس میانگین راجع به نمره دادن استاد درس ایده ای بگیرد، احتمالا تخمینی اریب به سمت بالا خواهد زد (مثلا ۱۴). در حالی که میانه این داده چیزی در حدود همان ۱۳ خواهد بود. حال اگر تعداد دانشجویان قوی دو نفر و تعداد دانشجویان متوسط پنج نفر باشد، باز هم اریبی این تخمین بیشتر خواهد بود (مثلا ۱۵).
مثال بالا برای یک دانشجوی قوی کاملا متفاوت خواهد بود. شاید آماره ای که یک دانشجوی قوی بهتر است به کار گیرد، ماگزیمم نمرات باشد.
بنابراین، می توان نتیجه گرفت که انتخاب آماره ی مناسب، وابسته به چیزی است که خواهان درک آن هستیم. قبل از هر استنتاجی،  باید از داده ها، کمیتی  استخراج شود که معیار خوبی برای اندازه گیری مفاهیم مورد استنتاج است.

پ.س.: توجه مهم: این جا اریبی به معنی اریبی در آمار نیست!

۳ نظر:

  1. سلام

    من هم این نکته رو اضافه کنم که میانگین روباست نیست ولی‌ میان هست

    پاسخحذف
  2. هیربد عزیز، به نکته ی خوبی اشاره کردی. من اضافه می کنم که به آماره ای روباست می گوییم که نسبت به داده های پرت یا تغییرات کم نسبت به مدل، تغییرات نابه جا نداشته باشد.

    پاسخحذف
  3. سلام.
    در مورد دکتر علیشاهی دقیقا و دقیقا درست گفتی آرش عزیز.

    من ترم گذشته این درس رو تو شریف باهاشون داشتم و واقعا لذت بردم. گر چه اذیت شدیم ولی واقعا مفید بود.
    واقعا.
    راستی من فاینال (95/100) شدم:)) این درس رو ولی مهمتر از اون سبک درس دادن کسری بود... که کاملا فرق داشت و دانشجو ها رو هم تو درس دادن شریک میکرد...

    پاسخحذف