رگرسیون ترتیبی
در دورههای آکادمی تحلیل آماری ایران با انواع رگرسیون و مدلهای آن آشنا شدیم و در روز چهارم کلاس spss با کلیهی پیشفرضهای لازم جهت استفاده از رگرسیونهای ساده خطی و چندگانه آشنا شدیم. از طرفی بیان کردیم که چگونه از شاخصهایی مثل تورش واریانس و تلورانس و …… در بررسی این شروط استفاده کنید.
اما میدانیم که در برخی از پژوهشها و بهخصوص پژوهشهای پیمایشی، ممکن است که متغیر وابسته در سطح سنجش ترتیبی باشد. یعنی شرط اول اجرای رگرسیونهای چندگانه که همانا کمی بودن(فاصلهای یا نسبی بودن) است را نداشته باشد. یعنی ما میتوانیم که به طبقات این متغیر رتبه دهیم اما هرگز نمیتوانیم فاصلهی بین رتبهها را مشخص نماییم.
مثلاً متغیر رضایت بجای اینکه توسط یکسری شاخص و سؤال در پرسشنامه سنجیده شده باشد که در انتها بتوان این سؤالات را با فرایند compute به سمت یک متغیر کمی پیوسته حرکت داد، خود شامل یک طیف سه گزینهای رضایت بالا، متوسط یا پایین جهت سنجش است.
در اینجا روش بدیل رگرسیون ترتیبی است که ممکن است محققان عزیز در زبان دستوری یا همان پنجره syntax آن را با عبارت PLUM مشاهده کرده باشند. در حقیقت رگرسیون ترتیبی روش بسط یافته مدل خطی عمومی هست که در مورد دادههای ترتیبی مورداستفاده قرار میگیرد.
براین در کتاب خود به نقلقول از مک کولاگ 1998 بیان میکند که در حقیقت این شرایط نوعی رگرسیون لجستیک است یعنی متغیر وابسته بجای اینکه در سطح سنجش اسمی باشد در سطح سنجش یا مقیاس رتبهای قرار دارد. بنابراین این نوع رگرسیون لجستیک ترتیبی که بهاختصار OLR نیز خوانده میشود در تحقیقات پیمایشی اهمیت بسیاری دارد. چراکه ما میتوانیم مدلی را تدوین نماییم که در آن یکسری متغیر مستقل رفتار یک متغیر وابسته ترتیبی را پیشبینی نمایند.
روش تخمین ضرایب رگرسیونی در این روش حداقل مربعات وزنی است یعنی محاسبات بهگونهای است که مجموع مجذورات بین یک متغیر وابسته ترتیبی وزن دادهشده از متغیرهای مستقل به حداقل میزان خود کاهش یابد(مرادی، 1395)
برای انجام این تحلیل در نرمافزارهای آماری باید توابع پیوند را بشناسیم. در کلاسهای آکادمی تحلیل آماری ایران بارها و بارها از برازش مدلهای رگرسیونی صحبت شده و بیانشده این مدلهای به دو دلیل به قول هایر راهی سطل زباله میشوند. دلی اول ضریب تعیین ضعیف و دلیلی دوم شاخص برازش است. پس اکنون برای محققان عزیز بیان میکنیم که این توابع برای ایجاد برازش مناسب برای مدل است. یعنی انتخاب تابع پیوند مناسب برای ایجاد برازش مناسب مدل رگرسیون ترتیبی است(مرادی، 1395)
اگر توزیع دادههای طبقات نرمال باشد و شکل توزیع نرمال باشد از تابع پیوند probit استفاده میشود. در صورت یک توزیع تصادفی تابع logit. اگر متغیر وابسته ما دو مقدار ابتدایی و انتهایی آن زیاد باشد یعنی دو حد آن دارای فراوانی بالایی باشد تابع پیوند cauchit است. حال هر چه طبقات بالاتر باشد احتمال بیشتر است و تابع پیوند complementary log-log است و درنهایت هر چه طبقات پایینتر باشد احتمال بیشتر است و تابع آن negative log-log است.
خوب اکنون تصور کنید عنوان تحقیق شما این است:
عوامل مؤثر بر تبلیغات شفاهی کلاسهای آکادمی تحلیل آماری ایران
اما در این تحقیق پرسشنامهای وجود دارد که بعد از سنجش متغیرهای پنهان مستقل از طریق سؤالات متناظرشان، متغیر وابسته تحقیق یعنی تبلیغات شفاهی را اینگونه سنجیده است.
سؤال: من بعد از شرکت در دورههای آکادمی تحلیل آماری ایران برای آن تبلیغات شفاهی انجام میدهم الف)کم ب)متوسط ج)زیاد
این نکته را در نظر داشته باشید که برای متغیر تبلیغات شفاهی پرسشنامههای چند شاخصی متنوعی وجود دارد اما محقق موردنظر با فرض اینکه پاسخدهندگان کاملاً این متغیر را میشناسند و نیازی به سنجش آن از زوایای مختلف نیست آن را اینگونه اندازهگیری کرده است.
خوب بعد از جمعآوری دادهها و ورود آن به spss باید پیشپردازشهای گفتهشده در کلاس را روی سؤالات و متغیرها انجام داد و سپس برای انجام تحلیل رگرسیون ترتیبی به آدرس زیر مراجعه نمود.
Analyze > Regression > ordinal
خوب اکنون یک پنجرهای دیالوگ باز میشود. متغیر وابسته رتبهای را وارد بخش متغیر وابسته میکنیم. دو پنجرهی دیگر وجود دارد که میتوان متغیرهای مستقل خود را وارد آنها کرد. باید دقت نمود که factor یا عاملها باید حتماً کیفی(اسمی یا ترتیبی) باشند و covariate یا کوریت ها حتماً باید کمی(scale) باشند.(مرادی، 1395)
در مقالات آینده نحوه تفسیر جداول خروجی و چگونگی بیان آن در تحقیقات بحث خواهد شد.
محسن مرادی
مقالات این سایت توسط خود سایت تولیدشده و بنابراین از استفاده از آن بدون ذکر سایت منبع خودداری شود
بسیار خوب و دقیق توضیح داده شده بود. آیا مقاله ای در مورد نحوه تفسیر جداول خروجی هم ارائه شده است؟ چه طور می توانیم تهیه کنیم؟