تُستخدم “نماذج جمع الغاوسي” بشكل شائع في التعلم الآلي وتحليل البيانات؛ لأنّها مرنة ويمكنها التقاط أنماط معقدة في البيانات ومع ذلك يمكن أن تكون باهظة الثمن من الناحية الحسابية.
ما هو نموذج خليط غاوسي GMM
“نموذج خليط غاوسي” هو نموذج ممكن يعمل على اعتماد جميع نقاط البيانات يتم تكوينها من مزيج من عدد معين من التوزيعات الغوسية مع معلمات غير ممكنة، كما يمكن للمرء أن يفكر في نموذج الجمع كتعميم لخوارزمية التجميع (k-mean clustering) حيث يمكن استخدامه لتقدير الكثافة وتصنيفها.
في نموذج خليط غاوسي ترتبط كل مجموعة بتوزيع غاوسي متعدد المتغيرات ونموذج الجمع عبارة عن مجموع مرجح لهذه التوزيعات، حيث تشير الأوزان إلى احتمال أن تنتمي نقطة البيانات إلى مجموعة معينة وتصف توزيعات (Gaussian) توزيع البيانات داخل كل مجموعة.
يمكن تقدير معلمات “نموذج خليط غاوسي” باستخدام خوارزمية (EM)، ويتضمن ذلك التناوب بين تقدير معلمات التوزيعات الغوسية وأوزان نموذج الجمع حتى الوصول إلى التقارب، ونماذج المزيج الغاوسي (GMMs) هي نماذج إحصائية يمكن استخدامها لتمثيل التوزيع الاحتمالي لمتغير مستمر متعدد الأبعاد كمجموع مرجح للتوزيعات العادية متعددة المتغيرات، وغالبًا ما يتم استخدام (GMM) في مجموعة متنوعة من:
- التجميع: يمكن استخدام (GMMs) لتحديد الأنماط وتجميع الملاحظات المتشابهة معًا.
- تقدير الكثافة: يمكن استخدام (GMM) لتقدير دالة كثافة الاحتمال (PDF) لمجموعة بيانات معينة، ويمكن أن يكون هذا مفيدًا لمهام مثل اكتشاف الشذوذ المستند إلى الكثافة، حيث يمكن استخدام (GMM) لتحديد الملاحظات التي تختلف اختلافًا كبيرًا عن بقية البيانات.
- كشف الشذوذ: يمكن استخدام (GMM) للكشف عن الملاحظات الشاذة في مجموعة البيانات.
- التعرف على الكلام: غالبًا ما تستخدم (GMM) في أنظمة التعرف على الكلام لنمذجة التوزيع الاحتمالي لأصوات الكلام حيث يتيح ذلك للنظام تحديد أكثر تسلسل الصوتيات احتمالية عند إعطاء إشارة إدخال صوتية.
- رؤية الكمبيوتر: يمكن استخدام (GMM) في تطبيقات رؤية الكمبيوتر لنمذجة مظهر الكائنات في صورة ما، وعلى سبيل المثال يمكن استخدام (GMM) لنمذجة مظهر أنواع مختلفة من الأنظمة.