يعتبر القياس النفسي مجال دراسي يهتم بنظرية وأسلوب الاختبار النفسي؛ يشير المجلس الوطني الأمريكي للقياس بشكل عام إلى مجال علم النفس والتعليم المخصص للاختبار والقياس والتقييم والأنشطة ذات الصلة، يركز بعض الباحثين على بناء والتحقق من أدوات التقييم مثل الاستبيانات والاختبارات والأحكام المقيمون وجداول أعراض نفسية واختبارات الشخصية، يركز آخرون على البحث المتعلق بنظرية القياس.
تاريخ الاختبار النفسي:
جاء الاختبار النفسي من تيارين فكريين؛ الأول من داروين وجالتون وكاتيل حول قياس الفروق الفردية، أمّا الثاني من هيربارت وييبر ووينديت وقياساتهم النفسية الفيزيائية لبنية مماثلة؛ المجموعة الثانية من الأفراد وأبحاثهم هي ما أدّى إلى تطوّر علم النفس التجريبي والاختبار النفسي.
التيار الفيكتوري:
كان تشارلز داروين مصدر إلهام للسير فرانسيس جالتون الذي أدى إلى إنشاء الاختبار النفسي، في عام 1859 نشر داروين كتابه حول أصل الأنواع والذي كان مكرس لدور الانتقاء الطبيعي في ظهور مجموعات مختلفة من أنواع النباتات والحيوانات بمرور الوقت، ناقش الكتّاب كيف يختلف الأفراد من نوع ما وكيف يمتلكون خصائص أكثر أو أقل تكيف مع بيئتهم، أولئك الذين يتمتعون بخصائص أكثر تكيف هم أكثر عرضة للإنجاب وينشأون عن جيل آخر.
أولئك الذين لديهم خصائص أقل تكيف هم أقل عرضة للإنجا؛. أثارت هذه الفكرة اهتمام غالتون بدراسة البشر وكيفية اختلافهم عن بعضهم البعض والأهم من ذلك، كيفية قياس هذه الاختلافات، كتب غالتون كتاب بعنوان ” عبقرية وراثية” حول الخصائص المختلفة التي يمتلكها الناس وكيف تجعلهم هذه الخصائص أكثر ملائمة من غيرهم، تعد هذه الاختلافات اليوم مثل الأداء الحسي والحركي مجالات مهمة في علم النفس العلمي.
تم إجراء الكثير من الأعمال النظرية والتطبيقية المبكرة في الاختبار النفسي في محاولة لقياس الذكاء، ابتكر غالتون الذي غالباً ما يُشار إليه ب أب الاختبار النفسي، اختبارات عقلية ضمن مقاييسه البشرية، ذهب جيمس ماكين كاتيل الذي يُعتبر رائد في الاختبار النفسي لتوسيع عمل جالتون. صاغ كاتيل أيضاً مصطلح الاختبار العقلي، هو مسؤول عن البحث والمعرفة التي أدّت في النهاية إلى تطوير الاختبارات الحديثة.
تيار الألمانية:
أصل الاختبار النفسي له أيضاً صلات بمجالات علم النفس مثل علم النفس الفيزيائي، في نفس الوقت تقريباً الذي كان داروين وغالتون وكاتيل يقومون باكتشافاتهم، كان هيربارت مهتم أيضاً بفك أسرار الوعي البشري من خلال المنهج العلمي، كان هربرت مسؤول عن إنشاء نماذج رياضية للعقل والتي كانت مؤثرة في الممارسات التعليمية في السنوات القادمة.
اعتمد (EH Weber ) على عمل (Herbart) وحاول إثبات وجود عتبة نفسية؛ حيث قال أنّ الحد الأدنى من التحفيز ضروري لتنشيط الجهاز الحسي، بعد ويبر وسع جي تي فيشنر المعرفة التي استقاها من هيربارت وويبر ليبتكر القانون الذي يقضي بأنّ قوة الإحساس تنمو كلوغاريتم شدة التحفيز، من أتباع ويبر وفيشنر ويلهلم فونت له الفضل في تأسيس علم النفس، إنّ تأثير (Wundt) هو الذي مهَّد الطريق للآخرين لتطوير الاختبارات النفسية.
في عام 1936 تمّ تطبيق مقاربة نظرية لقياس قانون الحكم المقارن؛ هو نهج له صلات وثيقة بنظرية إرنست هاينريش يبر وجوستاف فخنر، بالإضافة إلى ذلك قدم كل من سبيرمان وثورستون مساهمات مهمة في نظرية تحليل العوامل وتطبيقها، هي طريقة إحصائية تم تطويرها واستخدامها على نطاق واسع في القياس أو الاختبار النفسي، في أواخر الخمسينيات أجرى ليوبولد زوندي تقييم تاريخي ومعرفي لتأثير التفكير الإحصائي على علم النفس خلال العقود القليلة الماضية.
في الآونة الأخيرة تم تطبيق نظرية السيكومترية في قياس الشخصية والمواقف و المعتقدات والتحصيل الدراسي، يعد قياس هذه الظواهر غير القابلة للرصد أمر صعب، فقد تم تطوير الكثير من الأبحاث والعلوم المتراكمة في هذا التخصص في محاولة لتحديد هذه الظواهر وتحديدها بشكل صحيح؛ النقاد بمن فيهم الأطباء في العلوم الفيزيائية و الناشطين الاجتماعيين وبقول أنّ هذا التعريف والتحديد الكمي صعب مستحيل، أنّ مثل هذه القياسات غالبا ما يساء استخدامها؛ مثل مع اختبارات الشخصية المستخدمة في إجراءات التوظيف.
الاختبار النفسي في العلوم الاجتماعية:
تعريف الاختبار في العلوم الاجتماعية له تاريخ طويل؛ فهو تعريف واسع الانتشار حالياً واقترحه ستانلي سميث ستيفنز عام 1946، يمكن تعريف الاختبار النفسي بأنّه تخصيص الأرقام للأشياء أو الأحداث وفقاً لبعض القواعد، تم تقديم هذا التعريف في الورقة التي اقترح فيها ستيفنز أربعة مستويات للاختبار، على الرغم من اعتماد هذا التعريف على نطاق واسع، إلا أنّه يختلف في نواحي مهمّة عن التعريف الأكثر كلاسيكية للاختبار المعتمد في العلوم الفيزيائية.
في الواقع تمّ طرح تعريف ستيفنز للاختبار النفسي رداً على لجنة فيرجسون البريطانية، التي كان رئيسها، فيرجسون، تم تعيين اللجنة في عام 1932 من قبل الجمعية البريطانية لتقدم العلوم للتحقيق في إمكانية التقدير الكمي للأحداث الحسية، على الرغم من أن رئيس اللجنة وأعضاء آخرين كانوا فيزيائيين، فقد ضمت اللجنة أيضاً العديد من علماء النفس، فقد سلط تقرير اللجنة الضوء على أهمية تعريف الاختبار النفسي.
بينما كان رد ستيفنز هو اقتراح تعريف جديد والذي كان له تأثير كبير في هذا المجال، لم يكن هذا بأي حال من الأحوال الرد الوحيد على التقرير، كان الرد الآخر المختلف بشكل ملحوظ هو قبول التعريف الكلاسيكي؛ لا يختلف الاختبار النفسي في علم النفس والفيزياء بأي حال من الأحوال، يمكن للفيزيائيين قياس الوقت الذي يمكنهم فيه العثور على العمليات التي يمكنهم من خلالها تلبية المعايير اللازمة.
أدوات الاختبار النفسي:
تم تصميم أدوات الاختبار النفسي الأولى لقياس مفهوم الذكاء؛ تضمنت إحدى المقاربات التاريخية اختبار (Stanford-Binet IQ) والذي طوره في الأصل عالم النفس الفرنسي ألفريد بينيه، المفهوم البديل للذكاء هو أن القدرات المعرفية لدى الأفراد هي مظهر من مظاهر مكون عام أو عامل ذكاء عام، بالإضافة إلى القدرة المعرفية الخاصة بمجال معين، كان التركيز الرئيسي الآخر في القياس النفسي على اختبار الشخصية.
كانت هناك مجموعة من الأساليب النظرية لتصور الشخصية وقياسها، بعض الأدوات المعروفة تشمل الشخصية جرد مينيسوتا المتعدد المراحل و خمسة عامل نموذج وأدوات مثل الشخصية وجرد الأفضلية ونوع مؤشر مايرز بريغز، كما تمت دراسة المواقف على نطاق واسع باستخدام المقاربات السيكومترية، من الطرق الشائعة في قياس الاتجاهات استخدام مقياس ليكرت، تتضمن الطريقة البديلة تطبيق نماذج القياس المتكشفة وأكثرها عمومية هو نموذج جيب التمام الزائدي.
يهتم العديد من علماء القياس النفسي بإيجاد وإزالة التحيز في الاختبار من اختباراتهم النفسية؛ التحيز في الاختبار هو شكل من أشكال الخطأ المنهجي الذي يؤدي إلى أن يكون لدى الممتحَنين من مجموعة ديموغرافية واحدة ميزة غير مبررة على الممتحَنين من مجموعة ديموغرافية أخرى، وفقاً لخبراء بارزين قد يتسبب تحيز الاختبار في اختلافات في متوسط الدرجات عبر المجموعات الديموغرافية.
لكنّ الاختلافات في درجات المجموعة ليست دليل كافي على وجود تحيز الاختبار بالفعل؛ لأنّ الاختبار يمكن أن يقيس الاختلافات الحقيقية بين المجموعات، يستخدم علماء القياس النفسي أساليب علمية متطورة للبحث عن تحيز الاختبار والقضاء عليه، تظهر الأبحاث أنّه من المستحيل عادةً على الأشخاص الذين يقرؤون عنصر اختبار أن يحددوا بدقة ما إذا كان متحيز أم لا.
معايير الجودة:
تعتبر معايير الجودة اعتبارات صحية وموثوقية وعناصر أساسية لتحديد نوعية أي اختبار، مع ذلك غالباً ما وضعت الاتحادات المهنية والممارسين هذه المخاوف ضمن سياقات أوسع عند تطوير المعايير وإصدار أحكام عامة حول جودة أي اختبار ككل في سياق معين، أحد الاعتبارات المثيرة للقلق في العديد من إعدادات البحث التطبيقي هو ما إذا كان مقياس جرد نفسي معين ذا مغزى أو تعسفي.
معايير الاختبار:
في عام 2014 نشرت الجمعية الأمريكية للبحوث التربوية والجمعية الأمريكية لعلم النفس والمجلس الوطني للقياس في التعليم؛ مراجعة لمعايير الاختبارات التربوية والنفسية التي تصف معايير تطوير الاختبار والتقييم والاستخدام، كذلك معايير تغطية الموضوعات الأساسية في الاختبارات بما في ذلك الصحة والموثوقية زأخطاء القياس والإنصاف في الاختباري.
كما يوجد المعايير المتعلقة بعمليات الاختبار بما في ذلك تصميم الاختبار وتطويره والدرجات والمقاييس والمعايير وربط الدرجات وقطع الدرجات وإدارة الاختبار والتسجيل وإعداد التقارير وتفسير النتيجة وحقوق ومسؤوليات المتقدمين للاختبار ومستخدمي الاختبار ؛ فإن تغطي المعايير الموضوعات المتعلقة بتطبيقات الاختبار بما في ذلك الاختبار والتقييم النفسي واختبار مكان العمل والاعتماد والاختبار والتقييم التربوي والاختبار في تقييم البرنامج والسياسة العامة.
معايير التقييم:
في مجال التقييم وخاصة التقييم التربوي؛ نشرت اللجنة المشتركة لمعايير التقييم التربوي ثلاث مجموعات من المعايير للتقييمات، تم نشر معايير تقييم الموظفين في عام 1988 ونشرت معايير تقييم البرنامج في عام 1994 ومعايير تقييم الطلاب في عام 2003، يقدم كل منشور ويوضح مجموعة من المعايير لاستخدامها في مجموعة متنوعة من البيئات التعليمية.
توفر المعايير إرشادات لتصميم وتنفيذ وتقييم وتحسين شكل التقييم المحدد، تمّ وضع كل معيار في واحدة من أربع فئات أساسية لتعزيز التقييمات التعليمية التي تكون مناسبة ومفيدة ومجدية ودقيقة، في هذه المجموعات من المعايير، يتم تناول اعتبارات الصلاحية والموثوقية تحت موضوع الدقة؛ على سبيل المثال تساعد معايير دقة الطلاب في ضمان أنّ تقييمات الطلاب ستوفر معلومات صحيحة ودقيقة وموثوقة حول تعلم الطلاب وأدائهم.