مزايا خوارزمية k-Means في علم البيانات

اقرأ في هذا المقال


من السهل تنفيذ خواررزمية (k-Means) وتحديد مجموعات غير معروفة من البيانات من مجموعات البيانات المعقدة ويتم عرض النتائج بطريقة سلسة ومناسبة.

مزايا خوارزمية k-Means

1- الأداء العالي

  • تتميز خوارزمية (K-Means) بتعقيد زمني خطي ويمكن استخدامها مع مجموعات البيانات الكبيرة بسهولة، ومع البيانات الكبيرة غير المسماة تقدم (K-Means) العديد من الأفكار والفوائد كخوارزمية تجميع غير خاضعة للإشراف.

2- سهلة الاستخدام

  • خوارزمية (K-Means) سهلة الاستخدام أيضًا، ويمكن تهيئتها باستخدام المعلمات الافتراضية في تطبيق (Scikit-Learn).
  • وفقًا لهذا النهج يمكن بسهولة تعديل المعلمات مثل: عدد المجموعات (8 افتراضيًا) والحد الأقصى للتكرار (300 افتراضيًا) والتهيئة الأولية للنقطة الوسطى (10 افتراضيًا) لاحقًا لتناسب أهداف المهمة.

3- البيانات غير المصنفة

  • هذه هي خوارزمية تعلم آلي عامة غير خاضعة للإشراف تنطبق أيضًا على (K-Means).
  • إذا لم يكن للبيانات تسميات “قيم أو فئة أو أهداف” أو حتى رؤوس أعمدة فستظل (K-Means) تجمع البيانات بنجاح وهذا مثال على التعلم الآلي الذي يجمع البيانات ويستخرج رؤى مفيدة من البيانات التي يمكن أن تكون عديمة الفائدة تمامًا للعين البشرية.

4- تفسير النتيجة

  • تقوم (K-Means) بإرجاع المجموعات التي يمكن تفسيرها بسهولة وحتى تصورها وهذه البساطة تجعلها مفيدة للغاية في بعض الحالات عندما تحتاج إلى نظرة عامة سريعة على أجزاء البيانات.
  • بالإضافة إلى ذلك يمكن أن تكون قيم القصور الذاتي التي تنتجها خوارزمية (K-Means) مفيدة للتفسير أيضًا، ويعني مجموع القصور الذاتي للوسائل التربيعية لكل نقطة إلى مركز الكتلة الخاص بها “النقطة الوسطى”.

5- المرونة

  • يمكن لخوارزمية (K-mean) أن تتكيف بسهولة مع التغييرات، وإذا كانت هناك أي مشاكل فإنّ تعديل مقطع الكتلة سيسمح بإجراء التغييرات بسهولة على الخوارزمية.

6- مناسبة في مجموعة البيانات الكبيرة

  • (K-mean) مناسبة لعدد كبير من مجموعات البيانات ويتم حسابها بشكل أسرع بكثير من مجموعة البيانات الأصغر ويمكن أن تنتج أيضًا عناقيد أعلى.

7- الكفاءة

  • الخوارزمية المستخدمة جيدة في تقسيم مجموعة البيانات الكبيرة وتعتمد كفاءتها على شكل الكتل ويعمل (K-mean) بشكل جيد في المجموعات الكروية.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: