داده های مفقوده

داده های مفقود Missing data

داده های مفقود MISSING DATA

هر کیس قسمتی از اطلاعات جمعیت مورد مطالعه را دارد و وجود داده های مفقود به معنی از دست رفتن قسمتی از اطلاعات است. بنابراین رابطه ی معکوسی بین میزان کیس های مفقود و تعمیم پذیری نتایج وجود دارد. به نحوی که با زیاد شدن کیس های مفقود تعمیم پذیری نتایج بدست آمده به کل جامعه آماری مورد مطالعه کاهش می یابد. علاوه بر آن داده های مفقود یا گمشده از قدرت آماری آزمون های آماری می کاهد و خطای اندازه گیری را افزایش می دهد.

این مقادیر به دلایلی مختلفی از جمله سهل انگاری و خطای انسانی در ورود داده ها، خطا در تجهیزات اندازه گیری، اندازه گیری نادرست، امتناع در پاسخ گویی اعضای نمونه در پاسخ برخی فیلد های پرسش نامه در یک مجموعه داده پدید می آید. بنابراین جهت جلوگیری از بایاس ایجاد شده توسط داده های مفقود در تجزیه و تحلیل ما، باید این موارد شناسایی شده و مورد مدیریت قرار گیرد.

مدیریت این موارد در مقالات بعدی مورد بررسی قرار خواهد گرفت.

1 دیدگاه

  • فریدون / مهر ۲۲, ۱۳۹۷ در تاریخ ۱۱:۰۷ ق.ظ

    با سلام ممنون از ارائه مقالات

    پاسخ دادن

پاسخ دهید

Protected with IP Blacklist CloudIP Blacklist Cloud