كيف يتم تقييم الاختبارات المعيارية؟

اقرأ في هذا المقال


عادة ما نسمع مصطلح مجموعة معيارية في مناقشات الاختبارات النفسية والقياسات، يشير ذلك إلى عينة من المتقدمين للاختبار الذين يمثلون السكان الذين يهدف الاختبار لهم، تهدف المجموعة المعيارية إلى الترشح لمقدم اختبار افتراضي نموذجي، شخص يمثل المجموعة التي يتم اختبارها.

كيف تستخدم المجموعات المعيارية في الاختبار النفسي؟

الاختبار هو إجراء موحد لتحديد السلوك ووصفه عن طريق الفئات أو الدرجات، هناك عدد من الخصائص كيف تستخدم المجموعات الم المحددة للاختبارات؛ أولاً يكون الاختبار معياري ممّا يعني أنّ إجراءاته هي نفسها في أماكن مختلفة وتحت ظروف مختلفة، ثانياً يعتمد الاختبار على عينة من السلوك المراد قياسه، لا يجب أن تغطي العناصر الموجودة في الاختبار السلوك الذي يتم عرضه بالكامل، طالما أنّها ذات صلة بطريقة تسمح بعمل استنتاجات حول السلوك.

تتكون معايير الاختبار من البيانات التي تجعل من الممكن تحديد المكانة النسبية للفرد الذي خضع للاختبار، في حد ذاته النتيجة الأولية للموضوع على سبيل المثال عدد الإجابات التي تتفق مع مفتاح التسجيل، لها معنى ضئيل، دائماً يجب تفسير درجة الاختبار على أنّها تشير إلى موضع الموضوع بالنسبة للآخرين في مجموعة ما، توفر القواعد أساس لمقارنة الفرد بالمجموعة، القيم العددية التي تسمّى المئويات تعمل كأساس لنظام واحد قابل للتطبيق على نطاق واسع من المعايير.

من توزيع الدرجات الأولية للمجموعة، يمكن العثور على النسبة المئوية للموضوعات التي تقع تحت أيّ درجة أولية معينة، يمكن بعد ذلك تفسير أي نتيجة أولية بالنسبة إلى أداء المجموعة المرجعية، بالتالي فإنّ الترتيب المئوي المقابل لكل درجة أولية يوضح النسبة المئوية للأشخاص الذين سجلوا أقل من تلك النقطة، هكذا فإنّ 25 في المائة من المجموعة المعيارية يحصلون على درجات أقل من الشريحة المئوية الخامسة والعشرين.

قام عالم النفس الفرنسي ألفريد بينيه في ريادته في تطوير اختبارات الذكاء، بإدراج عناصر الاختبار على طول مقياس معياري على أساس العمر الزمني لمجموعات الأطفال الذين اجتازوها، تم تخصيص درجة العمر العقلي لكل موضوع، ممّا يشير إلى العمر الزمني في العينة المرجعية التي كانت درجته الأولية هي المتوسط، لكن العمر العقلي ليس مؤش مباشر للسطوع، يختلف العمر العقلي البالغ سبع سنوات من عمره 10 سنوات عن نفس العمر العقلي لطفل عمره أربع سنوات.

عند تصميم اختبار لشيء ما على سبيل المثال القدرة الأكاديمية أو أعراض الاكتئاب، من المهم للأشخاص الذين يجرون الاختبار فهم المجموعة التي يختبرونه، يحتاجون أيضاً إلى تحديد ما يعتبر طبيعي داخل تلك المجموع، على سبيل المثال اختبار (SAT) الذي أطلق عليه في الأصل اختبار القدرات الدراسية ثمّ اختبار SAT الاستدلال، الاختبار الموحد يقيس الإمكانات الأكاديمية، يتم أخذ (SAT) من قبل صغار وكبار المدارس الثانوية في جميع أنحاء الولايات المتحدة كل عام.

لذلك فإنّ المجموعة المعيارية لـ (SAT) هي مجموعة عشوائية ومتعددة الثقافات من طلاب المدارس الثانوية الأمريكية الصغار والكبار، الذين يعكسون بدقة التنوع وبالتالي المتوسط لتلك المجموعة من المتقدمين للاختبار، يمكن أن يكون أحد الأمثلة في علم النفس اختبار يهدف إلى تشخيص الاكتئاب لدى الأطفال الأمريكيين الذين تتراوح أعمارهم بين 5 و 10 سنوات، في هذا الاختبار ستكون المجموعة المعيارية عبارة عن عينة من الأطفال الذين تتراوح أعمارهم بين 5 و 10 سنوات من مجموعات ديموغرافية مختلفة داخل الولايات المتحدة.

كيف يتم تقييم الاختبارات المعيارية؟

يتم تقييم الاختبارات المعيارية بشكل مختلف مقارنة بالاختبارات المعيارية، الاختبارات المعيارية هي شكل من أشكال الاختبار النموذجي الذي نجده في المدرسة، جميع الأسئلة لها إجابات صحيحة وإجابات خاطئة ويتم تصنيف الدرجات من الدرجة المثالية، على النقيض من ذلك ليس من الممكن اجتياز اختبار مرجعي معياري، بدلاً من ذلك سنعطي نتائج بناءً على الأداء مقارنة بمجموعة معيارية.

أحد الأنواع الرئيسية للاختبارات المعيارية هو اختبار حاصل الذكاء أو اختبار الذكاء، تقوم درجات اختبار الذكاء عادةً بتتبُّع التوزيع الطبيعي وهو منحنى يشبه الجرس، حيث تقع غالبية الدرجات بالقرب من متوسط ​​الدرجة أو حوله، على سبيل المثال تميل غالبية الدرجات على مقياس (Wechsler Adult Intelligence Scale) إلى أن تقع بين 15 نقطة من متوسط ​​الدرجات 100، هذا يعني أنّ ما يقرب من 68٪ من الأشخاص الذين يأخذون (WAIS)، سوف يسجل اختبار IV في مكان ما بين 85 و 115.

يمكن أيضاً تقديم الاختبارات المعيارية كنسبة مئوية، تستند النسب المئوية إلى منحنى الجرس مع وقوع القاعدة في المنتصف، يتم تحديد النطاق المئوي على أنّه انحرافات عن القاعدة، إذا أجرى الشخص اختبار موحد مثل (SAT)، فربما يكون قد لاحظ أنه حصل على درجة كانت عبارة عن رقم بناءً على العدد الإجمالي للنقاط التي كان من الممكن أن يحصل عليها، بالإضافة إلى النسبة المئوية التي تعكس مدى نجاحه بالنسبة للمتقدمين للاختبار الآخرين.

تحليل عامل:

تحليل العامل هو طريقة تقييم تستخدم بشكل متكرر للتحليل المنهجي للقدرة الفكرية ومجالات الاختبار الأخرى، مثل مقاييس الشخصية، بعد مطلع القرن العشرين استكشف عالم النفس البريطاني تشارلز إي سبيرمان بشكل منهجي العلاقات الإيجابية بين مقاييس القدرات المختلفة على ما يبدو لتقديم دليل على أن الكثير من التباين في الدرجات التي يحصل عليها الأطفال في اختبارات الذكاء يعتمد على عامل أساسي عام واحد، بالإضافة إلى ذلك كان يعتقد أنّ كل اختبار يحتوي على حرف s عامل خاص به وحده.

طور (Thurstone) تقنية إحصائية تسمى التحليل متعدد العوامل، التي تمكن من إثبات في مجموعة من اختبارات الذكاء، أنّ هناك قدرات عقلية أساسية مثل الفهم اللفظي والحساب العددي والتوجه المكاني والمنطق العام،  على الرّغم من أنّ العمل اللاحق قد دعم التمييز بين هذه القدرات، إلا أنّه لم يتم إنشاء تصنيف نهائي للقدرات، أحد العناصر في المشكلة هو اكتشاف أن كل قدرة من هذا القبيل يمكن أن تظهر أنّها تتكون من عوامل أضيق.

تمّ استبدال الأساليب الحسابية الأولى في تحليل العوامل بحلول أكثر أناقة من الناحية الحسابية، تمّ إنشاؤها بواسطة الكمبيوتر، بينما كانت التقنيات السابقة استكشافية بشكل أساسي، طوّر الإحصائي السويدي كارل غوستاف يوريسكوج وآخرون إجراءات تسمح للباحث باختبار فرضيات حول الهيكل في مجموعة من البيانات، متجذراً في تطبيقات واسعة النطاق لتحليل العوامل، نموذج بنية الفكر الذي طوره عالم النفس الأمريكي جوي بول جيلفورد يفترض عدد كبير من عوامل الذكاء.

تصور جيلفورد ثلاثة أبعاد متقاطعة تتوافق على التوالي مع أربعة أنواع من محتوى الاختبار، كذلك خمسة أنواع من العمليات الفكرية وستة أنواع من المنتجات، تم افتراض أنّ كل خلية من الخلايا الـ 120 في المكعب المتولدة تمثِّل قدرة منفصلة، كل منها يشكل عامل مميز للذكاء، يفضل المستشارون التربويون والمهنيون عادةً عدد أقل بكثير من الدرجات من 120 التي يتضمنها هذا النموذج.

كما تم استخدام تحليل العوامل على نطاق واسع خارج مجال الذكاء، خاصة للبحث عن بنية الشخصيّة كما تنعكس في التقييمات من قبل الفرد والآخرين، على الرغم من وجود إجماع هنا أقل من إجماع الذكاء، إلا أنّ عدد من الدراسات تشير إلى أنّه يمكن وصف أربعة عوامل سائدة تقريباً، هي التوافق والانبساط والقلق والاعتمادية.

تحليل الملف الشخصي:

مع تجزئة الاختبارات على سبيل المثال، للحصول على درجات تقيس عوامل أو مجموعات منفصلة، نشأ اهتمام جديد لتفسير الفروق بين الدرجات التي تقيس المتغيرات الأساسية مهما كان تصورها، يمكن رسم عشرات الأفراد في العديد من هذه المقاييس بيانياً كملف تعريف؛ من أجل المقارنة المباشرة يمكن التعبير عن جميع الدرجات الأولية من حيث الدرجات القياسية التي لها وسائل ومتغيرات متساوية، يميل الفرق بين أيّ زوج من الدرجات التي تتمتع بدرجة أقل من الموثوقية إلى أن يكون أقل موثوقية من أيّ منهما.

يجب تفسير التقلبات في الرسم البياني بحذر، مع ذلك يمكن فحص السمات المختلفة للملف الشخصي للفرد، مثل التشتت والمستوى النسبي للأداء على مقاييس مختلفة، يجب ملاحظة الشكل الخاص للرسم البياني، يعتمد جزئياً على الترتيب التعسفي الذي يتم فيه سرد المقاييس، يمكن أيضاً التعبير إحصائياً عن درجة التشابه بين أي ملفين، تسمح مثل هذه المقاييس الإحصائية لتشابه الأنماط بإجراء مقارنة كمية لمحات لأشخاص مختلفين أو لمحات عن أداء نفس الفرد في أوقات مختلفة أو لفرد مع ملفات تعريف جماعية أو ملف تعريف مجموعة مع آخر.

مقارنة ملف تعريف الفرد مع الرسوم البيانية المماثلة التي تمثل الوسائل لمختلف المجموعات المهنية على سبيل المثال، مفيدة للتوجيه المهني أو اختيار الموظفين، لمحات عن أداء نفس الفرد في أوقات مختلفة أو لأفراد مع ملفات تعريف جماعية أو ملف تعريف جماعي مع آخر


شارك المقالة: