روایی محتوا در پرسشنامه: آموزش کامل محاسبه CVR و CVI (با فرمولها، جداول و مثال عددی)
این راهنما با هدف استفاده در پایاننامههای دکتری، مقالات Q1 و دورههای آموزش روش تحقیق کمی در
آکادمی تحلیل آماری ایران و مدرسه پژوهش کمی و کیفی تدوین شده است. در این مطلب،
روایی محتوا (Content Validity) را به صورت گامبهگام و با تمرکز بر دو شاخص
کلیدی CVR (نسبت روایی محتوا) و CVI (شاخص روایی محتوا) توضیح میدهیم؛
همراه با فرمولها، جداول تصمیمگیری و مثالهای عددی قابل استفاده در مقالات.
۱. روایی در پژوهش چیست و روایی محتوا چه جایگاهی دارد؟
روایی (Validity) به زبان دقیق روششناسی، ویژگی خود ابزار نیست؛
بلکه ویژگی «تفسیر نمرهها» است. یعنی این پرسش که: آیا تفسیر ما از نمرههای بهدستآمده، با
شواهد نظری و تجربی پشتیبانی میشود یا نه؟ (Messick, 1995).
در ادبیات کلاسیک، معمولاً از انواع روایی زیر صحبت میشود:
- روایی محتوا (Content Validity): کفایت پوشش دامنه محتوایی سازه.
- روایی سازه (Construct Validity): سازگاری ساختار عاملی و روابط نظری با دادهها.
- روایی ملاکی (Criterion-related Validity): ارتباط نمرهها با ملاک بیرونی معتبر.
از منظر عملی، روایی محتوا اولین فیلتر جدی کیفیت پرسشنامه است. اگر آیتمها از نظر محتوا
ضعیف طراحی شده باشند، هیچگونه تحلیل عاملی تأییدی، مدلیابی معادلات ساختاری یا آلفای کرونباخ قوی،
ضعف اولیه ابزار را جبران نخواهد کرد (Hair et al., 2019).
این استدلال از نظر روششناسی مردود است؛ روایی باید در بافت (Context)، جمعیت هدف و هدف استفاده جدید
دوباره ارزیابی و مستند شود.
۲. روایی محتوا (Content Validity) چیست؟
روایی محتوا به زبان ساده یعنی: آیا مجموعه آیتمهای شما، دامنه مفهومی سازه را بهطور کافی و مناسب پوشش میدهند؟
(Sireci, 1998). برای مثال، اگر سازهای مانند «رضایت شغلی» را اندازه میگیرید، آیا ابعاد مختلف آن مانند
حقوق، روابط همکاران، پیشرفت شغلی و محیط کار، بهطور معنادار در آیتمها بازتاب یافتهاند یا خیر؟
۱) کیفی: بازبینی نگارشی، شفافیت، تناسب فرهنگی، ابهام زبانی.
۲) کمی: محاسبه شاخصهای عددی مانند CVR و CVI با استفاده از نظر خبرگان.
۳. طراحی پنل خبرگان برای سنجش روایی محتوا
قلب فرایند روایی محتوا، پنل خبرگان (Expert Panel) است. کیفیت خبرگان، مستقیماً بر اعتبار
CVR و CVI تأثیر میگذارد. پیشنهاد میشود در گزارش مقاله، ویژگیهای پنل خبرگان را شفاف بیان کنید.
۳.۱. معیارهای انتخاب خبرگان
- حداقل مدرک دکتری یا دکترای حرفهای در حوزه مرتبط با سازه.
- سابقه انتشار مقاله یا تجربه پژوهش در موضوع مورد بررسی.
- ترجیحاً سابقه تدریس یا راهنمایی پایاننامه در همان حوزه.
- آشنایی با روش تحقیق و ابزارسازی (برای فهم دقیقتر مقیاسها).
۳.۲. تعداد مناسب خبرگان
در عمل، برای محاسبه CVR و CVI معمولاً از ۸ تا ۱۵ خبره استفاده میشود. تعداد بسیار کم (مثلاً ۳ یا ۴ نفر)
موجب میشود شاخصها بهصورت تصادفی بالا به نظر برسند و از نظر آماری قابل اتکا نباشند.
بین الزامات آماری و محدودیتهای اجرایی است.
۴. نسبت روایی محتوا (CVR) بر اساس جدول لاوشه
شاخص CVR یا Content Validity Ratio توسط
Lawshe (1975) برای سنجش «ضرورت» هر آیتم پیشنهاد شد. سؤال اصلی در CVR این است:
آیا این آیتم برای سنجش سازه، واقعاً ضروری است یا میتوان بدون آن نیز سازه را سنجید؟
۴.۱. نحوه امتیازدهی خبرگان در CVR
هر خبره، هر آیتم را بر اساس سه گزینه زیر قضاوت میکند:
- ضروری است (Essential)
- مفید است ولی ضروری نیست (Useful but not essential)
- ضروری نیست (Not necessary)
۴.۲. فرمول محاسبه CVR
که در آن:
ne: تعداد خبرگانی که گزینه «ضروری است» را انتخاب کردهاند.
N: تعداد کل خبرگان پنل.
۴.۳. جدول لاوشه (مقادیر بحرانی CVR)
پس از محاسبه CVR برای هر آیتم، مقدار بهدستآمده با جدول لاوشه مقایسه میشود. اگر CVR
محاسبهشده کمتر از مقدار جدول باشد، آیتم از نظر روایی محتوا پذیرفته نمیشود.
| تعداد خبرگان (N) | حداقل مقدار قابل قبول CVR |
|---|---|
| 5 | 0.99 |
| 6 | 0.99 |
| 7 | 0.99 |
| 8 | 0.75 |
| 9 | 0.78 |
| 10 | 0.62 |
| 15 | 0.49 |
| 20 | 0.42 |
| 40 | 0.29 |
مثال عددی CVR
فرض کنید ۱۰ خبره در پنل شما حضور دارند و برای یک آیتم خاص، توزیع پاسخها چنین است:
- ۷ نفر: «ضروری است»
- ۲ نفر: «مفید است ولی ضروری نیست»
- ۱ نفر: «ضروری نیست»
در این حالت: ne = 7 و N = 10 است. بنابراین:
بر اساس جدول لاوشه، حداقل مقدار قابل قبول برای N = 10، عدد 0.62 است.
بنابراین CVR = 0.40 < 0.62 و این آیتم از نظر روایی محتوا (ضرورت)
پذیرفته نمیشود و باید حذف یا بازطراحی شود.
۵. شاخص روایی محتوا (CVI): I-CVI و S-CVI
پس از حذف آیتمهای غیرضروری با استفاده از CVR، نوبت به بررسی کیفیت و ارتباط آیتمهای باقیمانده است.
این کار با استفاده از شاخص Content Validity Index (CVI) انجام میشود که نخستینبار توسط
Waltz & Bausell (1981) معرفی شد و بعداً Polit & Beck (2006, 2007) آن را بسط و نقد کردند.
۵.۱. مقیاس امتیازدهی در CVI
هر خبره، هر آیتم را بر اساس مقیاس ۴ درجهای زیر ارزیابی میکند:
- غیر مرتبط (Not relevant)
- تا حدودی مرتبط (Somewhat relevant)
- مرتبط (Quite relevant)
- کاملاً مرتبط (Highly relevant)
در محاسبه CVI، معمولاً فقط نمرههای ۳ و ۴ بهعنوان «توافق بر ارتباط» در نظر گرفته میشوند.
۵.۲. I-CVI: شاخص روایی محتوای هر آیتم
تفسیر پیشنهادی Polit & Beck (2006):
- I-CVI ≥ 0.79 → آیتم پذیرفته میشود.
- 0.70 ≤ I-CVI < 0.79 → آیتم نیاز به بازنگری دارد.
- I-CVI < 0.70 → آیتم رد میشود (حذف یا بازطراحی اساسی).
۵.۳. S-CVI/Ave: شاخص روایی محتوای کل مقیاس
برای ارزیابی روایی محتوای کل پرسشنامه، از میانگین I-CVI همه آیتمها استفاده میشود:
مقدار 0.90 یا بالاتر برای S-CVI/Ave بهعنوان روایی محتوای عالی برای کل مقیاس در نظر گرفته میشود (Polit et al., 2007).
مثال عددی CVI (I-CVI و S-CVI)
فرض کنید ۸ خبره، ۴ آیتم پرسشنامه را در مقیاس ۴ درجهای ارزیابی کردهاند و تعداد خبرگانی که به هر آیتم نمره ۳ یا ۴ دادهاند به صورت زیر است:
| آیتم | تعداد خبرگان با نمره ۳ یا ۴ | N | I-CVI | تفسیر |
|---|---|---|---|---|
| آیتم ۱ | 8 | 8 | 8/8 = 1.00 | پذیرفته میشود |
| آیتم ۲ | 7 | 8 | 7/8 = 0.87 | پذیرفته میشود |
| آیتم ۳ | 6 | 8 | 6/8 = 0.75 | نیازمند بازنگری |
| آیتم ۴ | 5 | 8 | 5/8 = 0.62 | رد میشود |
حال S-CVI/Ave را برای این ۴ آیتم محاسبه میکنیم:
مقدار 0.81 کمتر از 0.90 است؛ بنابراین روایی محتوای کل مقیاس در سطح مطلوب عالی قرار ندارد و
لازم است آیتمهای ضعیف (مانند آیتم ۳ و ۴) حذف یا بازطراحی شوند تا S-CVI/Ave به بالای 0.90 برسد.
۶. تفاوتهای کلیدی CVR و CVI در یک نگاه
| ویژگی | CVR (Lawshe) | CVI (Waltz & Bausell / Polit & Beck) |
|---|---|---|
| سؤال اصلی | آیا آیتم ضروری است؟ | آیا آیتم مرتبط و مناسب است؟ |
| نوع طیف | ۳ گزینهای (ضروری / مفید / غیرضروری) | ۴ گزینهای (از غیرمرتبط تا کاملاً مرتبط) |
| خروجی | یک عدد بین −۱ تا +۱ برای هر آیتم | I-CVI برای هر آیتم و S-CVI/Ave برای کل مقیاس |
| نقطه برش | وابسته به جدول لاوشه و تعداد خبرگان | معمولاً I-CVI ≥ 0.79 و S-CVI/Ave ≥ 0.90 |
| مرحله استفاده | غربالگری اولیه و حذف آیتمهای غیرضروری | بهبود کیفیت محتوایی و شفافیت آیتمهای باقیمانده |
۷. نقدها و محدودیتهای CVR و CVI
اگرچه CVR و CVI به استاندارد عملی در بسیاری از رشتهها تبدیل شدهاند، اما بدون توجه به محدودیتها
میتوانند پژوهشگر را به «احساس کاذب روایی» دچار کنند.
-
تعداد کم خبرگان: وقتی N بسیار کوچک است (مثلاً ۳ یا ۴ نفر)، احتمال کسب مقادیر بالا
برای CVR و CVI صرفاً بهدلیل شانس افزایش مییابد. Polit & Beck توصیه میکنند تا حد امکان از
حداقل ۶ تا ۸ خبره استفاده شود. -
نادیده گرفتن توافق تصادفی: CVI خام، احتمال توافق تصادفی بین خبرگان را در نظر نمیگیرد.
در برخی حوزهها استفاده از شاخصهای تعدیلشده مانند modified kappa پیشنهاد شده است. -
تمرکز صرف بر اعداد: تصمیمگیری درباره حذف آیتمها نباید فقط بر اساس یک عدد (مثلاً I-CVI)
باشد؛ بلکه باید با قضاوت نظری، اهمیت محتوایی و ساختار مفهومی سازه ترکیب شود.
۸. نحوه گزارش CVR و CVI در مقاله و پایاننامه
بسیاری از داوران ژورنالهای Q1 نسبت به گزارشهای مبهم روایی محتوا حساس هستند. پیشنهاد میشود حداقل
عناصر زیر را در بخش روش و نتایج ذکر کنید.
۸.۱. نمونه متن برای بخش روش (Methods)
نمونه پاراگراف:
«بهمنظور بررسی روایی محتوای ابزار، از نظر ۱۰ نفر از خبرگان حوزه مدیریت و روش تحقیق بهره گرفته شد.
در گام نخست، ضرورت هر آیتم بر اساس روش لاوشه در مقیاس سهدرجهای (ضروری، مفید ولی غیرضروری،
غیرضروری) ارزیابی و نسبت روایی محتوا (CVR) محاسبه گردید. آیتمهایی که مقدار CVR آنها کمتر از
مقدار بحرانی جدول لاوشه برای N = 10 (یعنی 0.62) بود، حذف شدند. در گام دوم، ارتباط هر آیتم با سازه
در مقیاس چهاردرجهای (از غیرمرتبط تا کاملاً مرتبط) بررسی و شاخص روایی محتوای آیتم (I-CVI) و کل مقیاس
(S-CVI/Ave) بر اساس توصیههای Polit و Beck محاسبه شد.»
۸.۲. نمونه گزارش در بخش نتایج
نمونه متن:
«مقادیر CVR محاسبهشده برای آیتمها در بازه 0.40 تا 1.00 قرار داشت. بر اساس جدول لاوشه، ۳ آیتم که
مقدار CVR آنها کمتر از 0.62 بود حذف گردید. برای آیتمهای باقیمانده، شاخص I-CVI بین 0.75 تا 1.00
بهدست آمد؛ بهطوریکه ۱۸ آیتم دارای I-CVI ≥ 0.79 (پذیرفتهشده)، ۲ آیتم در بازه 0.70 تا 0.78
(نیازمند بازنگری) و ۱ آیتم دارای I-CVI < 0.70 (حذفشده) بودند. شاخص روایی محتوای کل مقیاس
(S-CVI/Ave) برابر با 0.92 محاسبه شد که نشاندهنده روایی محتوای مناسب پرسشنامه است.»
۹. خطاهای رایج پژوهشگران در استفاده از CVR و CVI
-
استفاده از عبارت کلی «روایی محتوای پرسشنامه توسط چند تن از اساتید محترم تأیید شد»
بدون هیچ عدد و روش. - اشتباه گرفتن CVI با روایی سازه و ادعای «چون CVI بالاست، پس سازه از روایی سازه برخوردار است».
-
استفاده از جدول لاوشه بدون توجه به تعداد واقعی خبرگان یا استفاده از جداول ناقص/غلطی
که در برخی وبسایتها منتشر شده است. - گزارش CVI بدون توضیح مقیاس ۴ درجهای، معیار برش و تعداد خبرگان.
۱۰. جمعبندی: جایگاه CVR و CVI در ابزارسازی حرفهای
CVR و CVI دو ابزار کلیدی برای کمیسازی روایی محتوا هستند و در کنار قضاوت نظری خبرگان،
چارچوبی شفاف و تکرارپذیر برای تصمیمگیری درباره کیفیت آیتمها فراهم میکنند.
استفاده صحیح از این شاخصها، بهویژه در رسالههای دکتری و مقالات ISI، نهتنها داوران را قانع میکند،
بلکه احتمال پذیرش مقاله را در ژورنالهای سطح بالا بهطور معناداری افزایش میدهد.
مدرسه بین المللی پژوهش کمی و کیفی اولین و بزرگترین مرکز بین المللی برگزارکننده دوره های روش پژوهش و نرم افزارهای پژوهش کمی، کیفی، آمیخته و مروری در ایران