مناهج الموثوقية في الاختبارات النفسية

اقرأ في هذا المقال


الموثوقية هي قياس ما إذا كان شيء ما يبقى كما هو، إنّ نتائج التحقيقات النفسية موثوقة إذا كانت متشابهة في كل مرة يتم إجراؤها باستخدام نفس التصميم والقياسات، يمكن تقسيم الموثوقية إلى فرعين هما الموثوقية الداخلية والخارجية، الموثوقية الداخلية تصف الاتساق الداخلي للمقياس مثل ما إذا كانت الأسئلة المختلفة في الاستبيان تقيس جميعها نفس الشيء، أمّا الموثوقية الخارجية فيقّم هذا الاتساق عند مقارنة مقاييس مختلفة لنفس الشيء، أي هل يتطابق مقياس واحد مع مقاييس أخرى؟

مناهج الموثوقية في الاختبارات النفسية:

الاستقرار الزمني:

يستخدم هذا النوع من الموثوقية نفس شكل الاختبار النفسي في مناسبتين منفصلتين أو أكثر لنفس مجموعة الممتحنين، في كثير من الأحيان لا يكون هذا النهج عملي؛ لأنّ سلوكيات الممتحنين يمكن أن تتأثر بالقياسات المتكررة.

على سبيل المثال قد يكون الممتحنون متكيفين مع شكل الاختبار وبالتالي يميلون إلى الحصول على درجات أعلى في الاختبارات اللاحقة، تُعرف هذه النتيجة باسم التأثير المرحل ومن ثميوصى بشدةب التنفيذ الدقيق لنهج الاختبار وإعادة الاختبار.

تكافؤ النموذج:

يتطلب هذا النهج شكلين مختلفين للاختبار يعتمدان على نفس المحتوى، بعد تطوير النماذج البديلة والتحقق من صحتها عن طريق معادلة الاختبار، يمكن استخدامها لمختلف الممتحنين، من الشائع جداً في الاختبارات ذات المخاطر العالية استخدام هذه الطريقة لاستباق الغش، نظراً لأنّ النموذجين لهما عناصر مختلفة، فإنّ الممتحن الذي أخذ النموذج A سابقًا لا يمكنه مساعدة طالب آخر يأخذ النموذج B لاحقاً

الاتساق الداخلي:

يستخدم هذا النوع من تقدير الموثوقية معامل درجات الاختبار النفسي التي تم الحصول عليها من اختبار أو مسح فردي، يجب أن نضع في اعتبارنا أنه يُطلب من المستجيبين على سبيل المثال تقييم العبارات في استطلاع المواقف حول قلق الكمبيوتر عبارة واحدة هي “أشعر بسلبية شديدة تجاه أجهزة الكمبيوتر”، كذلك بيان آخر هو “أنا أستمتع باستخدام الكمبيوتر”.

يجب أن يختلف الأشخاص الذين يتفقون بشدة مع العبارة الأولى بشدة مع العبارة الثانية والعكس صحيح، إذا كان تصنيف كلا العبارتين مرتفع أو منخفض بين العديد من المستجيبين، يُقال إنّ الردود غير متسقة وغير نمطية يمكن تطبيق نفس المبدأ على الاختبار، عندما لا يتم العثور على نمط في استجابات الطلاب.

الموثوقية بين المقيمين:

هذا مقياس للاتفاق بين اثنين من المقيمين أو المبرمجين أو المراقبين، يُعرف أيضاً باسم موثوقية المبرمج، يكون تقدير الموثوقية هذا مفيد عندما يكون الموضوع الخاضع للحكم ذاتي بدرجة عالية، إذا كان مقياس التصنيف مستمر يكون معامل ارتباط عزم الإنتاج مناسبً، إذا كان المقياس ترتيبياً بطبيعته فإنّ معامل سبيرمان هو النهج الأنسب، بالنسبة للتصنيف الفئوي يجب استخدام معامل كوهين كابا.

وجهات النظر التقليدية حول الموثوقية:

الموثوقية ليست خاصية للاختبار بل يتم ربطها بملكية البيانات، بالتالي فإنّ علم النفس النفسي هو مقاييس بيانات، كما أنّ الاختبارات غير موثوقة، من المهم استكشاف الموثوقية في جميع الدراسات تقريباً، كما يجب تنفيذ تعميم الموثوقية والذي يشبه التحليل التلوي لتقييم التباين في خطأ القياس عبر العديد من الدراسات.

في مقال نشر في عام 2004 استعرض لي كرونباخ مخترع كرونباخ ألفا كوسيلة لقياس الموثوقية، التطور التاريخي لـ (Cronbach Alpha)، حيث أكّد أنه لم يعد يعتبر أن صيغة (كرونباخ ألفا) هي الطريقة الأنسب لفحص معظم البيانات، على مر السنين طوّر نظرية القابلية العامة المعقدة، مع ذلك لم يعترض (Cronbach) على استخدام (Cronbach Alpha)، لكنّه أوصى بأن يأخذ الباحثون في الاعتبار عدة أمور عند استخدام هذا النهج.

عل سبيل المثال الخطأ المعياري في القياس، هو أهم جزء من المعلومات التي يجب الإبلاغ عنها فيما يتعلق بالأداة وليس المعامل، كذلك استقلالية أخذ العينات وعدم تجانس المحتوى وكيف سيتم استخدام القياس، قرّر ما إذا كان من المحتمل أن تكون الاستخدامات المستقبلية للأداة حصرية للقرارات المطلقة أو القرارات التفاضلية أو كليهما.

  • الاستنساخ على أنه توحيد:  قد يتم الخلط بين المستخدمين بسبب تنوع مؤشرات الموثوقية، مع ذلك هناك أنواع مختلفة من مقاييس الموثوقية تشترك في خيط مشترك، ما الذي يشكل تكراراً لإجراء القياس؟ فلنأخذ الاتساق الداخلي كمثال، يتم استخدام هذا المقياس لأنّه من الملائم حساب مؤشر الموثوقية بناءً على البيانات التي تمّ جمعها من مناسبة واحدة، مع ذلك يجب أن يتجاوز الاستنتاج النهائي فرصة اختبار واحدة للآخرين.
  • بناء التحقق من الصحة كتوحيد: يميل المعيار ونماذج المحتوى إلى أن تكون ذات توجه تجريبي، بينما يميل نموذج الإنشاء إلى أن يكون نظري، مع ذلك تتطلب جميع نماذج الموثوقية شكل من أشكال التفسير وقياس الاختبار، في التحقيقات العلمية القياسية من المهم صياغة إطار تفسيري بشكل صريح ومن ثمّ إخضاعه للتحديات التجريبية، في هذا المعنى يعتبر التحقق من صحة البناء النظري بمثابة إطار عمل موحد للموثوقية.
  • عرض معدل للموثوقية: يمكن أن تكون هناك صلاحية بدون موثوقية إذا تمّ تعريف الموثوقية على أنّها اتساق بين التدابير المستقلة، فالموثوقية هي جانب من جوانب صحة البناء، نظراً لأنّ التقييم أصبح أقل توحيد، فإنّ الفروق بين الموثوقية والصلاحية ضبابية، في العديد من المواقف مثل البحث عن مرشح هيئة التدريس ومنح درجة الدراسات العليا، لا يتم تدريب أعضاء اللجنة على الاتفاق على مجموعة مشتركة من المعايير والمعايير

نظرة نقدية حول الموثوقية:

يجب تعريف تعريف الموثوقية من حيث نظرية الاختبار الكلاسيكية، أنّها الارتباط التربيعي بين الدرجات التيى تُرصد والحقيقية أو نسبة التباين الحقيقي في درجات الاختبار النفسي التي تمّ الحصول عليها، الموثوقية هي مقياس بلا وحدة وبالتالي فهي بالفعل خالية من النماذج أو خالية من المعايير، لقد كان تقليد إدخال عوامل متعددة في اختبار لتحسين الصلاحية ولكن تقليل الموثوقية الداخلية المتسقة.

موثوقية المحتوى ليست نوع من الموثوقية على الإطلاق؛ لأنّ الموثوقية تشير إلى الاستنتاجات التي تمّ إجراؤها حول الدرجات وليس إلى تقييم محتوى الأداة، كما أنّ التعريف ذاته للبناء يعني مجال المحتوى ولا يوجد فرق حاد بين محتوى الاختبار وبناء الاختبار.

تكون طريقة العرض التقليدية مثل المحتوى والمعيار والبناء مجزأة؛ لأنّها لا تأخذ في الاعتبار كلاً من الدليل على الآثار المترتبة على قيمة معنى الدرجة كأساس للعناصر القابلة للتنفيذ والعواقب الاجتماعية لاستخدام درجات الاختبار، فالموثوقية ليست خاصية للاختبار أو التقييم ولكنها تتعلق بمعنى درجات الاختبار، يعتبر المحتوى دليل على ملاءمة المحتوى والتمثيل والجودة الفنية، أمّا الموضوعية فهي الأساس المنطقي النظر.

جادل النُّقاد بأنّ العواقب لا ينبغي أن تكون أحد مكونات الموثوقية؛ لأنّه لا ينبغي تحميل مطوري الاختبار المسؤولية عن عواقب سوء الاستخدام الخارجة عن سيطرتهم، بدلاً من ذلك يجب ربط المساءلة بالمسيء، جادل ميسيك عام 1998 بأنّ العواقب الاجتماعية لتفسير الدرجات تشمل الآثار المترتبة على القيمة للبناء، حيث يجب معالجة هذا المعنى من خلال تقييم معنى درجة الاختبار، بينما لا ينبغي أن يكون مطورو الاختبارات مسؤولين عن إساءة استخدام الاختبارات.

يجب أن يظلوا حذرين تجاه النتائج غير المتوقعة لتفسير النتيجة الشرعي، وجهة نظر مختلفة عن الموثوقية والصلاحية، يجادل بعض علماء النفس بأنّ الرأي التقليدي القائل بأنّ “الموثوقية شرط ضروري ولكنه ليس شرط كافي للصحة” غير صحيح، تصور مدرسة الفكر هذه الموثوقية على أنّها الثبات والصلاحية باعتبارها عدم تحيز، قد يكون لإحصاء العينة قيمة متوقعة على العينات المساوية لمعامل المجتمع (عدم التحيز)، لكنّ لها تباين كبير عن حجم عينة صغير.

على العكس من ذلك يمكن أن يكون لإحصاء العينة تباين منخفض للغاية في أخذ العينات، لكن لها قيمة متوقعة بعيدة كل البعد عن التحيز العالي، وفقاً لوجهة النظر هذه يمكن أن يكون المقياس غير موثوق به لأنّه ذو تباين كبير، لكنّه يظل صالح لأنّه غير متحيّز، هناك مفهوم خاطئ شائع مفاده أنّه إذا اعتمد شخص ما على أداة وتمّ التحقق من صحتها، فلن يحتاج إلى التحقق من الموثوقية والصلاحية ببياناته.

الموثوقية المنخفضة أقل ضرر للاختبار القبلي للأداء، في الاختبار القبلي لا يتعرض الأشخاص للعلاج وبالتالي لا يكونون على دراية بالموضوع، من المتوقع أن تكون الموثوقية منخفضة بسبب التخمين العشوائي، إحدى أهم الطرق السهلة للتغلّب على هذه المشكلة هي تضمين “لا أعرف” في خيارات متعددة، في الإعدادات التجريبية حيث لا تؤثر ردود الطلاب على درجاتهم النهائية.

يجب على المجرِّب أن يوجه الطلاب صراحةً لاختيار “لا أعرف” بدلاً من التخمين إذا كانوا لا يعرفون الإجابة حقاً، الموثوقية المنخفضة هي إشارة إلى خطأ قياس كبير، ممّا يعكس فجوة بين ما يعرفه الطلاب فعلاً والنتائج التي يحصلون عليها، يمكن أن يساعد اختيار “لا أعرف” في سد هذه الفجوة.


شارك المقالة: