عدالة الاختبار في القرارات عالية المخاطر

اقرأ في هذا المقال


يمكن للاختبارات وخاصة التقييمات النفسية عالية المخاطر أن تثير الخوف في قلوب الجميع، للنجاح خلال وقت الاختبار يحتاج الأطفال إلى إتقان أكثر بكثير من المحتوى الأكاديمي، فهم بحاجة أيضاً إلى إدارة القلق وتطوير استراتيجيات الذاكرة، أيضاً استخدام مهارات إدارة الوقت وتوصيل معارفهم بالمهارة والمنطق، هذه مهمة صعبة للجميع الطلاب وخاصة من ذوي الاحتياجات الخاصة.

عدالة الاختبار في القرارات عالية المخاطر:

غالباً ما يكون للأداء في الاختبارات النفسية آثار كبيرة ومخاطر عالية في مجتمعنا، الاختبارات هي في جزء منها حراس بوابات الفرص التعليمية والمهنية وتلعب دور في قرارات (SSA)، على هذا النحو قد يكون لنتائج الاختبار النفسي عواقب إيجابية أو سلبية على الفرد، غالباً ما تكون هذه العواقب مقصودة ومع ذلك هناك احتمال حدوث عواقب سلبية غير مقصودة، من الضروري معالجة قضايا عدالة الاختبار بحيث لا يوجد فرد أو مجموعة محرومة في عملية الاختبار بناءً على عوامل لا علاقة لها بالمناطق التي تم قياسها بواسطة الاختبار.

ببساطة من الصعب وجود التحيزات في هذه الأنواع من القرارات المهنية، من الضروري أن يوضح البحث أنّ التدابير يمكن استخدامها بشكل عادل ومتكافئ مع أعضاء المجموعات الفرعية المختلفة في مجتمعنا، من المهم أن نلاحظ أنّ هناك أشخاص من العديد من المجموعات اللغوية والثقافية لا توجد لهم اختبارات متاحة، ذلك وفقاً للمعايير التي تمثلهم بشكل مناسب، في مثل هذه الحالات من المهم أن يقوم المقيمون بتضمين بيان حول هذا الموقف والآثار المحتملة على الدرجات والتفسير الناتج.

كشفت نتائج بعض اختبارات الكفاءة عالية المخاطر عن وجود اختلافات بين الجنسين، نقترح أنّ هذه التناقضات لا يتم توسطها أساساً من خلال الاختلافات في القدرات والمهارات والمعرفة، لكن الاختلافات بين الجنسين في تصورات المتقدمين للاختبار عن حالة الاختبار، علاوة على ذلك أشارت الأبحاث السابقة إلى أنّ تقييمات المرشحين لعدالة أداة الاختبار ذات أهمية كبيرة من وجهة نظر مؤسّسية؛ لأن مثل هذه التصورات من المعروف أنّها تؤثر على جاذبية المنظمة.

قام المتقدمون للاختبار طواعية بتقييم حالة الاختبار وتقييم جوانب معينة، منها على سبيل المثال عدالة أداة الاختيار، حيث قدموا معلومات بشأن قلقهم من الاختبار فور الانتهاء من اختبار (4-h)، أشارت تحليلات البيانات إلى اختلافات صغيرة وإن كانت كبيرة بين الجنسين في تصورات المشاركين للاختبار، وصف الرجال حالة الاختبار على أنّها تعطي القليل من الفرص للتواصل الاجتماعي وامتلاك المزيد من الفرص للخداع مقارنة بالنساء، علاوة على ذلك فإنّ تصور حالة الاختبار لم يتنبأ بشكل مباشر بنتائج الاختبار.

لكنّه كان بمثابة وسيط للتأثير غير المباشر لقلق الاختبار على نتائج الاختبار، على النقيض من ذلك كانت هناك تأثيرات مباشرة كبيرة ولكن لم تكن هناك تأثيرات غير مباشرة لتصور الموقف على تقييمات عدالة أداة الاختيار، كلما تمّ النظر إلى حالة الاختبار على أنّها حالة ضغط مرتفع، انخفضت معدلات عدالة أداة الاختبار، تمت مناقشة النتائج مع الإشارة إلى أدوار الجنسين واختبار الإنصاف.

يشير التكافؤ الثقافي إلى ما إذا كانت تفسيرات القياسات النفسية والتقييمات والملاحظات متشابهة، إن لم تكن متساوية عبر مجموعات سكانية ثقافية عرقية مختلفة، التكافؤ الثقافي هو شكل من أشكال التكافؤ عالي المستوى يعتمد على مقاييس تفي بمعايير محددة تشير إلى أنّه يمكن استخدام مقياس ما بشكل مناسب مع مجموعات ثقافية أخرى، بخلاف ذلك الذي تم تطويره من أجله في الأصل، يلاحظ تريمبل أنّه قد يكون هناك ما يزيد عن 50 نوع أو أكثر من أنواع التكافؤ التي تؤثر على الممارسات التفسيرية والإجرائية من أجل إنشاء التكافؤ الثقافي.

بالنسبة لمعظم القرن العشرين كان يسمّى نموذج القياس السائد نظرية الاختبار الكلاسيكية، استند هذا النموذج إلى فكرة أنّ جميع الدرجات تتكون من مكونين هما الدرجة الحقيقية والخطأ، يمكن للمرء أن يتخيل الدرجة الحقيقية كقيمة افتراضية من شأنها أن تمثل الدرجة الفعلية للشخص إذا لم يكن هناك خطأ في التقييم، يفترض النموذج كذلك أنّ كل الأخطاء عشوائية، كما أنّ أي ارتباط بين الخطأ وبعض المتغيرات الأخرى مثل الدرجات الحقيقية هو فعلياً صفر، يعتمد النهج بشكل كبير على نظرية الموثوقية.

منذ الخمسينيات من القرن الماضي وبشكل كبير منذ السبعينيات، تمّ تطوير نموذج حديث متطور رياضي يسمّى نظرية استجابة العنصر (IRT)، من السهل فهم فرضية نماذج (IRT) هذه في سياق الاختبارات المعرفية، حيث توجد إجابة صحيحة للأسئلة، يعتمد أبسط نموذج (IRT) على فكرة أنّ الإجابة على السؤال تعتمد بشكل عام على عاملين فقط، صعوبة السؤال ومستوى قدرة المتقدم للاختبار.

يقدر الاختبار التكيفي مع الكمبيوتر درجات المتقدم للاختبار بعد كل إجابة على سؤال ويضبط إدارة السؤال التالي وفقاً لذلك، على سبيل المثال إذا أجاب أحد المتقدمين للاختبار عن سؤال بشكل صحيح، فمن المرجح أن يتلقى سؤال أكثر صعوبة بعد ذلك، من ناحية أخرى إذا أجاب أحدهم بشكل غير صحيح، فمن المرجح أن يتلقى سؤال أسهل، مع تعديل درجة الجري التي يحتفظ بها الكمبيوتر وفقاً لذلك، لقد وجد أنّ مثل هذه الاختبارات للتكيف مع الكمبيوتر يمكن أن تكون فعالة للغاية.

جعلت نماذج (IRT) معادلة نماذج الاختبار أسهل بكثير، تسمح اختبارات المعادلة للفرد باستخدام أشكال مختلفة من نفس الفحص مع عناصر اختبار مختلفة؛ للحصول على درجات قابلة للمقارنة تماماً بسبب صعوبات العناصر المختلفة قليلاً عبر النماذج، لتحويل قيم صعوبة العنصر لتحديد درجات قدرة المتقدم في الاختبار، يحتاج المرء إلى بعض العناصر المشتركة عبر الاختبارات المختلفة، تُعرف هذه العناصر الشائعة باسم عناصر الإرساء.

تقنيات إدارة الاختبارات غير المعيارية:

قد يشكل تعديل الإجراءات بما في ذلك استخدام المترجمين وإدارة إجراءات التقييم غير المعياري، تحديات فريدة للأخصائي النفسي من خلال احتمال إدخال خطأ منهجي في عملية الاختبار، قد تكون مثل هذه الأخطاء مرتبطة باللغة أو استخدام المترجمين أو قدرات الممتحن، على سبيل المثال إذا استخدم أحد المترجمين اللغويين، فقد يؤدي احتمال حدوث خطأ في الترجمة إلى نتائج غير دقيقة.

يعد استخدام المترجمين خيار غير مفضل، يجب أن يكون المقيمون يعرفون اللغة والثقافة التي يأتي منها الفرد لتفسير نتائج الاختبار بشكل صحيح، أو حتى استنتاج ما إذا كانت التدابير المحددة مناسبة، أصبح تكييف الاختبارات عمل تجاري لشركات الاختبار والعديد من الاختبارات، غالباً ما يتم تكييف المقاييس المطورة باللغة الإنجليزية للاستخدام لاستخدامها في بلدان أخرى، تتطلب مثل هذه الإجراءات تغييرات في اللغة ولكن يجب أن يكون المترجمون على دراية بالثقافة والبيئة في المنطقة التي يأتي منها الشخص.

المصدر: الاختبارات النفسية، سوسن شاكر مجيدالاختبارات النفسية، د.فيصل عباسالاختبارات النفسية العصبية، سعيد بن سعد زهرانأسس بناء الاختبارات والمقاييس النفسية والتربوية، سوسن شاكر مجيد


شارك المقالة: