p value در نرم افزار لیزرل

p value در نرم افزار لیزرل

بعد از اجرای مدل در نرم افزار لیزرل( اعم از مدل اندازه گیری یا ساختاری)، در قسمت پایین نرم افزار دو شاخص برازش chi square  و RMSEA توسط نرم افزار گزارش می شود. همچنین مقدار df درجه آزادی و نیز p value برای مقدار chi square گزارش می گردد. p value همان سطح معناداری یا خطایی است که محقق در رد فرض H0 مرتکب می شود و آن را در آژمون های آماری با sig نیز نمایش می دهند که اگر این مقدار کوچکتر از 0.05 باشد در سطح اطمینان 95 درصد و اگر کمتر از 0.01 باشد در سطح اطمینان 99 درصد فرض H0 رد و فرض H1 پذیرفته می شود.

اما هدف از این مطلب بیان این نکات مقدماتی که همه عزیزان آکادمی تحلیل آماری ایران به آن وافق هستند نیست. اگر به فرض آماری آزمون chi square که مهمترین آزمون نیکویی برازش در مدل سازی معادلات ساختاری است توجه نماییم، می بینیم که:

 

H0: توزیع فراروانی مشاهده شده = توزیع فراوانی مورد نظر

H1: توزیع فراروانی مورد نظرتوزیع فراروانی مشاهده شده 

 

بطور کلی نیز برازش مدل به این معنا است که تا چه اندازه مدل تخمین زده شده ما در نمونه آماری بر اساس مشاهدات با مدل مورد انتظار در جامعه تطابق دارد. بنابراین همانطور که از مفهوم برازش بر می آید بر خلاف اکثر آزمون های آماری که در آن آنچه محقق به دنبال آن است در فرض H1 قرار دارد، در آزمون chi square چیزی که محقق به دنبال آن است این است که مدل برازش داشته باشد.

 

یعنی توزیع فراروانی مشاهده شده = توزیع فراوانی مورد نظر

 

که این جمله در فرض H0 قرار دارد. بنابراین در اینجا بر خلاف بسیاری از آزمون ها ایده آل این است که p value یا همان sig بزرگتر از 0.05 باشد و نه کوچکتر از آن.

اما دقیقا مسئله اینجاست که در بسیاری از مواقع مقدار p value کمتر از 0.05 می شود و دوستان توجه نمی کنند که در حقیقت در این هنگام فرض H1 پذیرفته شده است و مؤید این امر است که بین مدل مشاهده شده در نمونه و مدل مورد انتظار در جامعه اختلاف معناداری وجود دارد. چگونه به این سوال باید در جلسات دفاع و یا در طرح های پژوهشی پاسخ داد؟

کلاین در سال 2005 در کتاب خود بیان نمود که نتایج آزمون chi square به حجم نمونه ها و نرمال بودن توزیع داده ها بسیار حساس است و زمانی که حجم نمونه ها چندان بزرگ نباشد اغلب عدم اختلاف بین مدل مشاهده شده در نمونه و مدل مورد انتظار در جامعه را حتی اگر انطباق بسیار بالایی وجود داشته باشد تشخیص نمی دهد و همچنین برعکس اگر نمونه ها بسیار بزرگ باشد اختلاف بین مدل مشاهده شده در نمونه و مدل مورد انتظار در جامعه را حتی اگر انطباق بسیار پایین وجود داشته باشد را تشخیص نمی دهد.

اساسا بخاطر همین مشکل بوده این شاخص توسط درجه آزادی تعدیل شده تا اثر حجم نمونه در آن کاسته شود و ما بجای خود کای دو شاخصی تحت عنوان کای دو به درجه آزادی را گزارش می کنیم. همچنین سایر شاخص های برازش در مدل سازی معادلات ساختاری اساسا بخاطر همین موضوع پدید آمدند.

محسن مرادی

بعد از خواندن مقاله بالا خواندن مطالب زیر توصیه می شود:

مطالب سایت و کانال بدون ذکر منبع استفاده نشود.

 

 

پاسخ دهید