ضریب تعیین و ارزیابی آن
ضریب تعیین یکی از مفاهیم اصلی و اولیه ای است که در دوره های آکادمی تحلیل آماری ایران بشدت روی آن تکیه می شود. چرا که متاسفانه دانشجویان و اساتید به شدت از ارزیابی آن غفلت می کنند این در حالی است که به گفته دکتر هایر این ضریب و برازش مدل مهمترین مباحث طرح شده در این حوزه در نظر گرفته می شود.
ضریب تعیین به مجذور ضریب همبستگی چند گانه اطلاق می شود و آن را R square یا R2 می خوانند. این ضریب میزان تبیین واریانس یا تغییرات متغیر وابسته توسط مجموعه متغیر های مستقل را نشان می دهد. مقدار این ضریب بین صفر و یک در نوسان است. هرچه مقدار این ضریب به یک نزدیک باشد نشان از این دارد که متغیر های مستقل توانسته اند میزان زیادی از واریانس یا به زبان ساده تر رفتار متغیر وابسته را پیش بینی کنند و هر چه این مقدار به صفر نزدیک باشد یعنی این توضیح تغییرات متغیر وابسته کمتر بوده است و محقق انتخاب مناسبی در متغیر های مستقل خویش از ادبیات پژوهشی نداشته است.
همانطور که در ابتدای بحث خدمت شما عرض کردم متاسفانه غفلت فوق العاده عجیبی پیرامون این شاخص در تحقیقات ما و حتی بدتر در داوری های اساتید از کارهای پژوهشی دانشجویان وجود دارد. یعنی اگر جامع تر به کار نگاه کنیم یک محقق وقتی صاحب مدل و فرضیات علی در پژوهش خود است در حقیقت هدفش رسیدن به یک پیش بینی با کیفیت از متغیر های وابسته است و اگر در پایان کار به این مهم نرسد به گفته پروفسور هایر محقق بهتر است در پژوهش خود از ابتدای کار تجدید نظر نماید.
اما گاها محققین نمیدانند از چه معیار و شاخصی برای ارزیابی ضریب تعیین کار خود بهره ببرند. اولین بار در سال 1998 چن و همکارانش سه مقدار 0.19 و 0.33 و 0.67 درصد را به عنوان مقادیر ضعیف و متوسط و قوی برای بررسی مقدار R2ارائه نمودند که بعد ها توسط هنسلر در سال 2009 و پروفسور هایر در سال 2011 مورد تایید و استناد مجدد قرار گرفت. یعنی اگر کاری دارای ضریب تعیین کمتر از 0.19 درصد باشد باید در مورد کل روابط و روش پیمایش تجدید نظر نمود. اما متاسفانه در ایران می بینیم پژوهش های بسیاری که حتی این شاخص گزارش نشده و یا در صورت گزارش مقدار بسیار ضعیفی دارد و به راحتی از بوته داوری اساتید بدون ذره ای توجه خارج می شود(مرادی، 1395)
از طرفی هایر و همکارانش در سال 2011 بیان کردند که این ضریب با تعداد متغیر های مستقل بهبود می یابد بنابراین آن ها در این موارد این سه مقدار را برای پیش بینی ضعیف، متوسط و قوی ارائه نمودند یعنی 0.25 و 0.50 و 0.75.
محققین دیگر این اشکال ضریب تعیین را که میزان موفقیت مدل را بیش از اندازه برآورد می کند و متاسفانه حجم نمونه و درجات آزادی را در محاسبات خود در نظر نمی گیرد با اصلاح این ضریب و ارائه شکل تعدیل شده آن برطرف نمودند. یعنی از ضریب تعیین تعدیل یافته یا R2adj استفاده نمودند. در حقیقت ضریب تعیین برای نمونه گزارش می شود و ضریب تعیین تعدیل یافته برای جامعه آماری است. در حقیقت این ضریب مقدار ضریب تعیین معمولی را به منظور انعکاس بیشتر میزان نیکویی برازش مدل تصحیح میکند.
محسن مرادی
کپی مطالب سایت و کانال بدون ذکر سایت منبع مجاز نیست.