مشاكل القياس العامة في علم النفس

اقرأ في هذا المقال


تشير كلمة اختبار إلى أي وسيلة وغالباً ما تكون مفتعلة رسمياً، تُستخدم لاستنباط استجابات يمكن أن يرتبط بها السلوك البشري في سياقات أخرى، عندما يُقصد بالتنبؤ بسلوك مستقبلي بعيد نسبياً على سبيل المثال، النجاح في المدرسة، يُطلق على هذا الجهاز اسم اختبار القدرات، عند استخدامها لتقييم المهارة الأكاديمية أو المهنية الحالية للفرد، يمكن تسميتها باختبار كفاءة.

مشاكل القياس العامة في علم النفس:

يتم إدراك الأشياء المادية من خلال خصائصها أو سماتها، قد تشعر الأم مباشرة بالخاصية التي تسمّى درجة الحرارة من خلال تحسس جبين رضيعها، مع ذلك لا يمكنها ملاحظة مشاعر المغص أو مشاركة تجربة الجوع الشخصية للرضيع، يجب أن تستنتج مثل هذه الأحاسيس الخاصة التي لا يمكن ملاحظتها من سماع طفلها يبكي أو يقرقر، من رؤيته يرفرف بذراعيه، أو يتجهم أو يبتسم، بنفس الطريقة الكثير ممّا يسمّى يجب أن يتم القياس بواسطة استنتاج.

بالتالي قد تستخدم الأم التي تشتبه في أنّ طفلها يعاني من الحمى مقياس حرارة، في هذه الحالة تتحقق من درجة حرارته من خلال النظر إلى مقياس الحرارة، بدلاً من لمس رأسه مباشرة، في الواقع القياس عن طريق الاستدلال هو سمة خاصة لعلم النفس، لا يتم قياس الخصائص أو السمات المجردة مثل الذكاء أو الانطواء بشكل مباشر أبداً ولكن يجب استنتاجها من السلوك الذي يمكن ملاحظته.

قد يكون الاستدلال مباشر إلى حد ما أو غير مباشر تماماً، إذا استجاب الأشخاص بذكاء على سبيل المثال من خلال التفكير بشكل صحيح في اختبار القدرة، فيمكن الاستدلال بأمان على أنّهم يمتلكون الذكاء إلى حد ما، في المقابل يمكن استخدام قدرة الأشخاص على تكوين ارتباطات أو روابط؛ خاصة تلك غير العادية، بين الأشياء أو الأفكار المقدمة في الاختبار كأساس لاستنتاج الإبداع، على الرغم من أنّ إنتاج منتج إبداعي يتطلب سمات أخرى؛ بما في ذلك الدافع والفرصة والمهارة التقنية.

موازين القياس:

لقياس أي خاصية أو نشاط هو تعيين موضع فريد لها على طول مقياس رقمي، عندما تستخدم الأرقام فقط للتعرف على الأفراد أو الطبقات كما في ظهور الرياضيين على فريق كرة القدم، فإنّها تشكل المقياس الاسمي، عندما يعكس مجموعة من الأرقام فقط النظام النسبي من الأشياء، فإنّه يشكل لمقياس ترتيبي. إنّ المقياس الفاصل له وحدات متساوية ونقطة صفر مخصصة بشكل تعسفي.

أحد هذه المقاييس على سبيل المثال، هو مقياس درجة حرارة فهرنهايت، لا توفر مقاييس النسبة وحدات متساوية فحسب، بل تحتوي كذلك على نقاط صفرية مطلقة؛ تشمل الأمثلة مقاييس الوزن والمسافة، على الرّغم من وجود محاولات بارعة لإنشاء مقاييس نفسية بنقاط الصفر المطلقة، فإنّ علماء النفس عادة ما يكونون راضين عن تقريب المقاييس الفاصلة؛ غالباً ما تستخدم المقاييس الترتيبية أيضاً.

الصلاحية:

الشرط الأساسي للاختبار هو الصلاحية؛ تُعرَّف تقليدياً على أنها الدرجة التي يقيس بها الاختبار فعلياً ما يقصد قياسه، يمكن الاعتماد على الاختبار إلى الحد الذي يقيسه بشكل متسق، لكن الموثوقية ليس لها أي نتيجة إذا كان الاختبار يفتقر إلى الصلاحية، نظراً لأنّ الشخص الذي يستخلص الاستنتاجات من الاختبار يجب أن يحدد مدى نجاحه في خدمة أغراضه، فإنّ تقدير الصلاحية يتطلب الحكم، اعتماداً على معايير الحكم المستخدمة، تُظهر الاختبارات عدد من أنواع الصلاحية المختلفة.

تصف الصلاحية التجريبية مدى تقارب الدرجات في الاختبار بالسلوك كما تم قياسه في سياقات أخرى، يمكن مقارنة درجات الطلاب في اختبار الكفاءة الأكاديمية؛ على سبيل المثال مع درجاتهم المدرسية إلى الدرجة التي يتوافق بها المقياسان إحصائياً، يتنبأ الاختبار تجريبياً بمعيار الأداء في المدرسة، الصلاحية التنبؤية لها أهم تطبيقاتها في اختبار القدرات؛ على سبيل المثال في فحص المتقدمين للعمل، في التنسيب الأكاديمي وفي تكليف أفراد عسكريين بمهام مختلفة.

بدلاً من ذلك يمكن فحص الاختبار ببساطة لمعرفة ما إذا كان يبدو المحتوى مناسب للغرض المقصود منه، يتم استخدام هذا التحقق من صحة المحتوى على نطاق واسع في قياس التحصيل الأكاديمي ولكن مع الاعتراف بالدور الحتمي للحكم، بالتالي يُظهر اختبار الهندسة صحة المحتوى عندما يعتقد الخبراء أنّه يأخذ عينات مناسبة للمناهج المدرسية لهذا الموضوع.

عند تفسيره على نطاق واسع، يغطي المحتوى المهارات المطلوبة بالإضافة إلى نقاط المعلومات في حالة اختبارات الإنجاز، تعكس الصلاحية الظاهرية (نوع خام من صلاحية المحتوى) قبول الاختبار لأشخاص مثل الطلاب وأولياء الأمور وأصحاب العمل والمسؤولين الحكوميين، الاختبار الذي يبدو صحيح أمر مرغوب فيه، لكنّ صلاحية الوجه دون بعض الصلاحية الأساسية ليست أكثر من تزيين النوافذ.

تميل اختبارات الشخصية وأحكام محتوى الاختبار إلى أن تكون غير جديرة بالثقة بشكل خاص، كما أن المعايير الخارجية التي يمكن الاعتماد عليها نادرة، قد يفترض المرء على سبيل المثال أن الرجل الذي يتعرق بشكل مفرط يشعر بالقلق، مع ذلك فإنّ مشاعر القلق لديه إن وجدت لا يمكن ملاحظتها بشكل مباشر، أيّ سمة مفترضة يُعتقد أنّها تكمن وراء سلوك يمكن ملاحظته تسمى أبناء؛ نظراً لأنّ البنية نفسها لا يمكن قياسها بشكل مباشر، فإنّ مدى كفاية أي اختبار كمقياس للقلق يمكن قياسه بشكل غير مباشر فقط.

تثبت معروضات الاختبار الصلاحية عندما يتبين أنّ أصحاب الدرجات المنخفضة والمرتفعين يستجيبون بشكل مختلف للتجارب اليومية أو للإجراءات التجريبية، اختبار يُفترض أنّه يقيس القلق على سبيل المثال؛ من شأنه أن يعطي دليلاً على صحة البناء إذا كان من الممكن إثبات أن الأشخاص ذوي الدرجات العالية يتعلمون بشكل أقل كفاءة من أولئك الذين حصلوا على درجات أقل.

الأساس المنطقي هو أن هناك العديد من المقترحات المرتبطة بمفهوم القلق؛ من المرجح أن يتعلم الأشخاص القلقون بشكل أقل كفاءة، خاصة إذا كانوا غير متأكدين من قدرتهم على التعلم، من المحتمل أن يتغاضوا عن الأشياء التي يجب أن يحضروا إليها أثناء تنفيذ المهمة؛ هم عرضة لأن يكونوا تحت الضغط وبالتالي يشعرون بالتعب، لكن قد يكون الأشخاص القلقون صغار أو كبار أو أذكياء أو غير أذكياء، إذا أظهر الأشخاص الذين حصلوا على درجات عالية في اختبار القلق مثل هذه العلامات المقترحة للقلق.

الموثوقية:

تتأثر الموثوقية بدقة التسجيل وكفاية أخذ عينات المحتوى واستقرار السمة التي يتم قياسها، تشير موثوقية المسجل إلى الاتساق الذي يتفق معه مختلف الأشخاص الذين يسجلون نفس الاختبار، بالنسبة للاختبار باستخدام مفتاح إجابة محدد، فإنّ موثوقية المسجل لا تشكل مصدر قلق يذكر، عندما يستجيب الموضوع بكلماته الخاصّة وكتابته اليدوية وتنظيم الموضوع، فإنّ الأفكار المسبقة لمقيمين مختلفين تنتج درجات مختلفة لنفس الاختبار من مقيم إلى آخر؛ أي أنّ الاختبار يُظهر عدم موثوقية المسجل.

في حالة عدم وجود مفتاح تسجيل موضوعي، قد يختلف تقييم المصنف من وقت إلى آخر وعن تقييمات المقيّمين الذين يحظون باحترام متساوٍ، عند تساوي الأشياء الأخرى يفضل إجراء الاختبارات التي تسمح بالتسجيل الموضوعي، تعتمد الموثوقية كذلك على الصفة التمثيلية التي تختبر بها الاختبارات المحتوى المراد اختباره، إذا كانت الدرجات على عناصر اختبار تأخذ عينة من عالم معين من المحتوى المصمم ليكون متجانس بشكل معقول وترتبط ارتباط وثيق بتلك الموجودة على مجموعة أخرى من العناصر المحددة من نفس عالم المحتوى، فإنّ الاختبار يتمتع بموثوقيَّة عالية المحتوى.

لكن إذا كان عالم المحتوى متنوع للغاية من حيث أنّه يأخذ عينات من عوامل مختلفة؛ على سبيل المثال التفكير اللفظي والتسهيل مع الأرقام، فقد يكون للاختبار موثوقية عالية المحتوى ولكن تناسق داخلي منخفض، بالنسبة لمعظم الأغراض يجب أن يكون أداء موضوع في نفس الاختبار من يوم لآخر متسق، عندما تميل هذه الدرجات إلى أن تظل مستقرة بمرور الوقت، فإنّ الاختبار يعرض موثوقية زمنية.

قد تنشأ تقلبات الدرجات من عدم استقرار سمة؛ على سبيل المثال قد يكون المتقدم في الاختبار أسعد يوم من اليوم التالي، أو قد يعكس عدم الموثوقية الزمنية بناء اختبار غير حكيم، من بين الطرق الرئيسية التي يتم من خلالها إجراء تقديرات موثوقية الاختبار هو تقنية النماذج المقارنة، حيث تتم مقارنة درجات مجموعة من الأشخاص في أحد أشكال الاختبار مع الدرجات التي حصلوا عليها في نموذج آخر.

من الناحية النظرية قد يعكس نهج الأشكال القابلة للمقارنة المسجل والمحتوى والموثوقية الزمنية، يتطلب هذا بشكل مثالي أن يتم إنشاء كل شكل من أشكال الاختبار من قبل أشخاص مختلفين ولكن مؤهلين بشكل متساوي وأن يتم تقديم النماذج في أوقات مختلفة وتقييمها بواسطة مقيم ثاني، ما لم يتم إصلاح مفتاح موضوعي.

ترتبط درجات نفس المجموعة من الأشخاص من إدارتين من نفس الاختبار، إذا كان الفاصل الزمني بين الإدارات قصير جداً، فقد تعزز الذاكرة الارتباط بشكل غير ملائم أو قد يبحث بعض الأشخاص على سبيل المثال عن الكلمات التي فاتتهم في أول اختبار للمفردات، بالتالي يمكنهم رفع درجاتهم في المرة الثانية، يمكن أن يؤدي الفاصل الزمني الطويل إلى تأثيرات مختلفة لكل شخص بسبب معدلات النسيان أو التعلم المختلفة.

باستثناء اختبارات السرعة السهلة للغاية، التي قد تعطي هذه الطريقة تقديرات مضللة حول الموثوقية، تتطلب طرق الاتساق الداخلي لتقدير الموثوقية إدارة واحدة فقط لشكل واحد من الاختبار، تستلزم إحدى الطرق الحصول على الدرجات على أنصاف منفصلة من الاختبار، عادة ما تكون العناصر ذات الأرقام الفردية والزوجية، تسمح درجة التطابق بين الدرجات في هذه الاختبارات النصفية بتقدير موثوقية الاختبار عن طريق التصحيح الإحصائي.


شارك المقالة: