آیا تا به حال پس از ساعتها کار روی یک مدل ساختاری، با این سوال فلجکننده مواجه شدهاید که: «آیا مدل من واقعاً خوب است؟». ارزیابی نیکویی برازش (Goodness of Fit) یکی از حیاتیترین و در عین حال گیجکنندهترین مراحل در تحلیلهای آماری پیشرفته مانند مدلسازی معادلات ساختاری (SEM) است. تکیه بر یک شاخص به تنهایی یا درک نادرست از معیارهای برش، میتواند کل نتایج پژوهش شما را زیر سوال ببرد.
این راهنما، یک مرجع کامل و عمیق است که شما را از سطح مبتدی به یک تحلیلگر ماهر در زمینه ارزیابی مدل تبدیل میکند. در اینجا، ما نه تنها به شما میگوییم که هر شاخص چیست، بلکه منطق پشت آن، محدودیتها و نحوه تفسیر صحیح آن را بر اساس معتبرترین منابع آکادمیک به شما آموزش میدههیم.
نویسندگان: آیدا میرالماسی و محسن مرادی
سال: 2025
بخش اول: چرا ارزیابی برازش مدل حیاتی است؟
ارزیابی برازش مدل، فرآیندی است که مشخص میکند آیا مدل نظری که شما طراحی کردهاید، به اندازه کافی الگوهای موجود در دادههای واقعی شما را بازتولید میکند یا خیر (West, Taylor, & Wu, 2012). در گذشته، محققان به یک آزمون واحد به نام کای-اسکوئر تکیه میکردند، اما امروزه میدانیم که هیچ شاخص جادویی واحدی وجود ندارد (Schermelleh-Engel, Moosbrugger, & Müller, 2003).
یک ارزیابی حرفهای، نیازمند بررسی همزمان سه جنبه از برازش مدل است (Marsh, Hau, & Wen, 2004):
- برازش مطلق: مدل شما به خودی خود چقدر خوب است؟
- برازش تطبیقی (افزایشی): مدل شما در مقایسه با یک مدل بسیار ضعیف (پایه) چقدر بهتر است؟
- برازش مقتصدانه: آیا مدل شما در عین سادگی، برازش خوبی ارائه میدهد؟ (Moradi & et al, 2022).
بخش دوم: آزمون کای-اسکوئر (χ²) – نقطه شروع سنتی
آزمون کای-اسکوئر، سنگ بنای آماری ارزیابی مدل است که فرضیه صفر «برابری کامل» ماتریس کوواریانس مدل شما با ماتریس کوواریانس دادهها را میآزماید (Bollen, 1989). معنادار شدن این آزمون (p < 0.05) به طور سنتی نشاندهنده عدم برازش مدل است (Jöreskog & Sörbom, 1993).
چرا کای-اسکوئر به تنهایی کافی نیست؟ محدودیتهای کلیدی
با وجود اهمیت نظری، این آزمون دارای محدودیتهای جدی است که استفاده از آن را به تنهایی غیرممکن میسازد (Hu & Bentler, 1998):
- حساسیت شدید به حجم نمونه: این بزرگترین ضعف کای-اسکوئر است. در نمونههای بزرگ، حتی کوچکترین و بیاهمیتترین تفاوتها باعث معنادار شدن آزمون و رد شدن یک مدل کاملاً معقول میشود (MacCallum, Browne, & Sugawara, 1996).
- فرض غیرواقعی “برازش دقیق”: در علوم اجتماعی، هیچ مدلی ۱۰۰٪ کامل نیست. مدلها همیشه سادهسازیهایی از واقعیت پیچیده هستند. بنابراین، آزمودن فرضیه “برازش دقیق” اساساً غیرمنطقی است (Browne & Cudeck, 1993).
- اطلاعات محدود: این آزمون فقط یک پاسخ دوتایی (بله/خیر) میدهد و هیچ اطلاعاتی در مورد میزان یا علت عدم برازش ارائه نمیکند (Steiger, 2007).
رویکرد مدرن: امروزه، به جای استفاده از مقدار p کای-اسکوئر، از نسبت آن به درجه آزادی (χ²/df) به عنوان یک شاخص توصیفی استفاده میشود. مقادیر زیر ۳ (و گاهی زیر ۲) به عنوان نشانه اولیه از برازش قابل قبول در نظر گرفته میشود، هرچند این یک قانون قطعی نیست (Marsh & Hocevar, 1985).
بخش سوم: شاخصهای برازش مطلق (Absolute Fit Indices)
این شاخصها میزان توانایی مدل شما در بازتولید دادههای مشاهدهشده را به طور مستقیم اندازهگیری میکنند.
۱. ریشه میانگین مربعات خطای تقریب (RMSEA)
(Steiger & Lind, 1980).به عنوان پرکاربردترین و از نظر نظری قویترین شاخص برازش مطلق شناخته میشود. این شاخص به جای تست برازش کامل، میزان “خطای تقریب” مدل در جامعه را به ازای هر درجه آزادی میسنجد RMSEA
- تفسیر مقادیر:
- کمتر از 0.05: برازش عالی (Close Fit)
- بین 0.05 تا 0.08: برازش قابل قبول و معقول (Reasonable Fit)
- بین 0.08 تا 0.10: برازش متوسط (Mediocre Fit)
- بالاتر از 0.10: برازش ضعیف و غیرقابل قبول (Poor Fit)
- نکات کلیدی:
- این شاخص مدلهای سادهتر (مقتصدانه) را ترجیح میدهد.
- همیشه فاصله اطمینان (Confidence Interval) آن را گزارش کنید. یک فاصله اطمینان باریک در محدوده مقادیر خوب (مثلاً 0.02 تا 0.06) بسیار بهتر از یک فاصله اطمینان وسیع (مثلاً 0.04 تا 0.11) است (Maydeu-Olivares, Shi, & Rosseel, 2018).
۲. ریشه میانگین مربعات ماندههای استانداردشده (SRMR)
(Hu & Bentler, 1999).میانگین اختلاف بین ماتریس همبستگی پیشبینیشده توسط مدل و ماتریس همبستگی واقعی دادهها را نشان میدهد. تفسیر آن بسیار ساده است: هر چه به صفر نزدیکتر باشد، بهتر است SRMR
- نقطه برش پیشنهادی: مقادیر کمتر از 0.08 عموماً نشاندهنده برازش قابل قبول است (Browne & Cudeck, 1993).
۳. شاخص نیکویی برازش (GFI) و شاخص تعدیلشده آن (AGFI)
این دو از قدیمیترین شاخصهای برازش هستند که میزان واریانس تبیینشده توسط مدل را میسنجند (Jöreskog & Sörbom, 1981). با این حال، به دلیل معایب فنی متعدد از جمله حساسیت به حجم نمونه، امروزه استفاده از آنها به شدت کاهش یافته و شاخصهای مدرنتر ترجیح داده میشوند (Sharma et al., 2005).
بخش چهارم: شاخصهای برازش تطبیقی (Incremental Fit Indices)
این شاخصها عملکرد مدل شما را با یک مدل پایه (Baseline Model) مقایسه میکنند. مدل پایه معمولاً مدل استقلال (Independence Model) است که فرض میکند هیچ رابطهای بین متغیرهای شما وجود ندارد. در واقع این شاخصها میگویند: «مدل شما چقدر از یک مدل کاملاً بیربط بهتر است؟» (Bentler & Bonett, 1980).
۱. شاخص برازش تطبیقی (CFI)
(Bentler, 1990).پراستفادهترین و قابل اعتمادترین شاخص این دسته است. مزیت بزرگ آن، عدم حساسیت نسبی به حجم نمونه و جریمه کردن مدلهای پیچیده است CFI
- تفسیر مقادیر: این شاخص بین ۰ تا ۱ متغیر است. مقادیر بالاتر از 0.95 نشاندهنده برازش بسیار خوب در نظر گرفته میشود (Hu & Bentler, 1999).
۲. شاخص تاکر-لوئیس (TLI یا NNFI)
(Tucker & Lewis, 1973).است اما یک تفاوت کلیدی دارد: بین ۰ و ۱ محدود نیست. این ویژگی به آن اجازه میدهد تا قدرت تمایز بیشتری داشته باشد، زیرا میتواند مقادیر بالای ۱ (برای برازش عالی) یا حتی منفی (برای برازش افتضاح) بگیردTLI شبیه به CFI
- تفسیر مقادیر: مانند CFI، مقادیر نزدیک به 0.95 یا بالاتر مطلوب است.
توصیه استاندارد در گزارشدهی: همیشه CFI و TLI را در کنار هم گزارش دهید. عملکرد خوب هر دو شاخص، شواهد محکمی برای برازش مدل شما فراهم میکند. این دو به دلیل عملکرد قوی در شبیهسازیهای متعدد، به عنوان بهترین شاخصهای تطبیقی شناخته میشوند (Hu & Bentler, 1998).
بخش پنجم: بحران نقاط برش – آیا باید به قواعد سرانگشتی اعتماد کرد؟
یکی از بزرگترین بحثها در دنیای SEM، استفاده از نقاط برش ثابت (Rules of Thumb) است.
ماجرای مطالعه هو و بنتلر (۱۹۹۹)
تأثیرگذارترین نقاط برش (CFI > .95, TLI > .95, RMSEA < .06, SRMR < .08) از یک مطالعه شبیهسازی بسیار معروف توسط هو و بنتلر در سال ۱۹۹۹ به دست آمد (Hu & Bentler, 1999). این مطالعه یک پیشرفت بزرگ بود، اما مشکل اینجاست که بسیاری از محققان این مقادیر را به عنوان “قوانین طلایی” و غیرقابل تغییر در نظر گرفتند.
چرا نباید کورکورانه از نقاط برش استفاده کرد؟
تحقیقات بعدی به طور قاطع نشان دادند که این نقاط برش جهانی نیستند و عملکرد آنها به شدت تحت تأثیر عوامل زیر است (Marsh, Hau, & Wen, 2004):
- پیچیدگی مدل: مدلهای پیچیدهتر به طور طبیعی برازش کمتری دارند.
- حجم نمونه: تأثیر حجم نمونه بر شاخصها متفاوت است.
- میزان نرمال بودن دادهها: در دادههای غیرنرمال، عملکرد شاخصها تغییر میکند.
- نوع خطای مدل: این نقاط برش برای شناسایی انواع خاصی از خطا (مثلاً بارهای عاملی حذفشده) بهینه شدهاند و ممکن است در شناسایی خطاهای دیگر ضعیف عمل کنند.
هشدار کلیدی: استفاده خشک و مکانیکی از نقاط برش، یک اشتباه بزرگ روششناختی است. ارزیابی مدل یک فرآیند قضاوت حرفهای است، نه یک چکلیست ساده (McNeish, An, & Hancock, 2018).
نتیجهگیری: چکلیست نهایی برای یک ارزیابی برازش حرفهای
حال که با تمام جزئیات آشنا شدید، چگونه باید در عمل یک مدل را ارزیابی کنید؟
- هرگز به یک شاخص تکیه نکنید. یک رویکرد جامع و چندوجهی داشته باشید.2. مجموعه طلایی را گزارش دهید. همیشه ترکیبی از شاخصهای کلیدی را گزارش کنید:
- آزمون کای-اسکوئر به همراه درجه آزادی (χ² و df)
- RMSEA به همراه فاصله اطمینان ۹۰٪
- SRMR
- CFI
- TLI
- به زمینه توجه کنید. تفسیر خود را بر اساس پیچیدگی مدل، حجم نمونه و مبانی نظری پژوهش خود تنظیم کنید.
- تئوری پادشاه است. حتی یک مدل با برازش آماری کامل، اگر از نظر تئوری بیمعنا باشد، ارزشی ندارد.
- هدف، مدل مفید است، نه مدل کامل. به یاد داشته باشید که همه مدلها تقریبی از واقعیت هستند. هدف شما پیدا کردن یک مدل مفید است که به درک پدیده مورد مطالعه کمک کند، نه اثبات یک حقیقت مطلق (Moradi & et al, 2022).آدرس کانال یوتیوب برای عضویت (مشترک شدن) و دنبال کردن ویدئو ها از لینک زیر می باشد.
لینک کانال یوتیوب آکادمی تحلیل آماری ایران
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
اطلاعات کتاب شناسی مطالب
Moradi, M., & Miralmasi, A. (2020). Pragmatic research method (E. T. of the A. Academy (ed.); First edit). School of quantitative and qualitative research, Published in MPT Academy of Austrian. https://analysisacademy.com/
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
Dr. Aida Miralmasi ✔️
Dr. Mohsen Moradi ✔️
مشاهده مطالب زیر به محققین توصیه می شود.
- فیلم آموزش تحلیل متغیر میانجی در مدلسازی معادلات ساختاری: جامع و کاربردی (بخش 2)
- فیلم آموزش تحلیل متغیر میانجی در مدلسازی معادلات ساختاری: جامع و کاربردی (بخش 1)
- آموزش کامل 6 افزونه قدرتمند برای استفاده حرفه ای از google scholar
- آموزش تصویری سرچ و گرفتن خروجی از پایگاه های علمی Scopus و Web of science (زبان ساده)
- آموزش تصویری جامع سرچ مقالات علمی معتبر با استفاده از نرم افزار Publish or Perish
- ضریب امگا مک دونالد (McDonald’s omega) جایگزین ضریب آلفا کرونباخ (Cronbach’s alpha) آموزش نصب و اجرا
- مقالات بسیار مهم reference نرم افزار SMART PLS
- محاسبه گر حجم نمونه برای مدل سازی معادلات ساختاری (SEM)
- پیدا کردن منابع با کیفیت برای پژوهش
- آموزش تحلیل متغیر میانجی در مدل
- محاسبه گر خودکار متغیر میانجی با روش سوبل
- 150 ابزار آنلاین بسیار ضروری برای هر پژوهشگر
- آشنایی با فراترکیب (meta synthesis) و مراحل آن
- تحقیق انتقادی چیست؟
- مطالعات اولیه و ثانویه
- آیا باید از نرم افزار های تحلیل داده های کیفی استفاده کرد؟
- دانلود رایگان کتاب مهم Grounded Theory and Grounded Theorizing
- نکات مهم برای نوشتن مقاله با رویکرد کیفی
آدرس سایت و کانال تلگرام و اینستاگرام
-
از کپی کردن مطالب سایت یا کانال بدون ذکر منبع خودداری شود.
آدرس کانال تلگرام: https://telegram.me/analysisacademy
آدرس پیج اینستاگرام https://www.instagram.com/analysisacademy