عملية التنقيب عن البيانات مقابل التعلم الآلي

اقرأ في هذا المقال


لقد شاع في العالم الرقمي العديد من المصطلحات والعبارات الجديدة بحيث يسهل الشعور بالإرهاق أو فقدان المسار، حيث يُعد التنقيب عن البيانات والتعلم الآلي كلاهما من أساليب علوم الكمبيوتر لاكتشاف الأنماط في البيانات، واتخاذ قرارات مستنيرة بناءً على تلك البيانات.

ما هي عملية التنقيب عن البيانات

عملية التنقيب عن البيانات: هي عملية تعمل على تحليل كميات هائلة من المعلومات ومجموعات البيانات للحصول على الرؤى ذات الصلة لمساعدة الشركات في حل المشكلات والتنبؤ بالاتجاهات وتخفيف المخاطر واكتشاف إمكانيات جديدة، ويشبه تنقيب البيانات التنقيب الفعلي من حيث أن كلاهما يتضمن عمال المناجم أخذ كميات المحتوى بحثًا عن سلع ومكونات قيمة.

يُطلق عليها أيضًا عملية اكتشاف المعرفة، وهو مجال علمي يُستخدم لتحديد خصائص مجموعات البيانات وظهر مصطلح “التنقيب عن البيانات” في مجتمع قاعدة البيانات في عام (1990م)، ومجموعات ضخمة من البيانات التي تم جمعها من مستودعات البيانات أو مجموعات البيانات المعقدة، مثل السلاسل الزمنية والمكانية من أجل استخراج ارتباطات وأنماط مثيرة للاهتمام بين عناصر البيانات، وبالنسبة لخوارزميات التعلم الآلي غالبًا ما يتم استخدام ناتج خوارزمية التنقيب عن البيانات كمدخلات.

ما هو التعلم الآلي

التعلم الآلي: هو عملية اكتشاف الخوارزميات التي حسنت من مجاملة الخبرة المستمدة من البيانات، حيث إنّه تصميم ودراسة وتطوير الخوارزميات التي تسمح للآلات بالتعلم دون تدخل بشري، كما أنّها أداة لجعل الآلات أكثر ذكاءً والقضاء على عنصر التدخل البشري.

يرتبط التعلم الآلي بتطوير وتصميم آلة يمكنها أن تتعلم من تلقاء نفسها من مجموعة محددة من البيانات للحصول على نتيجة مرغوبة دون تشفيرها بشكل صريح، والتعلم الآلي هو تقنية تنشئ خوارزميات معقدة لمعالجة البيانات الكبيرة وتوفر نتائج لمستخدميها وكما يستخدم البرامج المعقدة التي يمكن أن تتعلم من خلال التجربة والتنبؤات، ويتم تحسين الخوارزميات من خلال الإدخال المتكرر لبيانات التدريب، والهدف من التعلم الآلي هو فهم المعلومات وبناء نماذج من البيانات التي يمكن فهمها واستخدامها من قبل البشر.

القواسم المشتركة بين عملية التنقيب عن البيانات والتعلم الآلي

يقع كل من التنقيب عن البيانات والتعلم الآلي تحت ظل (Data Science)، وهو أمر منطقي لأنّ كلاهما يستخدم البيانات ويتم استخدام كلتا العمليتين لحل المشكلات المعقدة، وبالتالي يستخدم العديد من الأشخاص (خطأ) المصطلحين بالتبادل ومع الأخذ في الاعتبار أن التعلم الآلي يُستخدم أحيانًا كوسيلة لإجراء التنقيب عن البيانات المفيدة.

بينما يمكن استخدام البيانات التي تم جمعها من التنقيب عن البيانات لتعليم الآلات تصبح الخطوط الفاصلة بين المفهومين غير واضحة بعض الشيء، وعلاوةً على ذلك تستخدم كلتا العمليتين نفس الخوارزميات الهامة لاكتشاف أنماط البيانات وبالنسبة للمبتدئين يسبق التنقيب عن البيانات التعلم الآلي بعقدين من الزمن، وكان الأخير يطلق عليه في البداية تحديد المعرفة في قواعد البيانات (KDD).

لا يزال يُشار إلى التنقيب في البيانات باسم (KDD) في بعض المناطق، وكان التنقيب عن البيانات موجودًا منذ الثلاثينيات وظهر التعلم الآلي في الخمسينيات من القرن الماضي، ويتم تحديد دقة تنقيب البيانات من خلال كيفية الحصول على البيانات، وينتج عن التنقيب في البيانات نتائج دقيقة ويتم استخدامها بعد ذلك بواسطة “التعلم الآلي” لتحسين أدائه، ونظرًا لأنّ التنقيب في البيانات يستلزم مشاركة بشرية فقد يتجاهل الارتباطات الرئيسية بينما ينتج عن التعلم الآلي نتائج أكثر دقة مقارنة باستخراج البيانات نظرًا لأنّه عملية آلية.

الفرق الرئيسي بين التنقيب عن البيانات والتعلم الآلي

  • يتم استخدام مكونين لإدخال تقنيات التنقيب عن البيانات الأول هو قاعدة البيانات والثاني هو التعلم الآلي، حيث توفر قاعدة البيانات تقنيات إدارة البيانات، بينما يوفر التعلم الآلي طرقًا لتحليل البيانات ولكن لإدخال أساليب التعلم الآلي استخدمت الخوارزميات، ويستخدم التنقيب في البيانات مزيدًا من البيانات للحصول على معلومات مفيدة وستساعد تلك البيانات المحددة في التنبؤ ببعض النتائج المستقبلية.
  • التنقيب في البيانات غير قادر على التعلم الذاتي، حيث إنّه يتبع الإرشادات المحددة مسبقًا وسيوفر إجابة لمشكلة معينة لكنّ خوارزميات التعلم الآلي محددة ذاتيًا، ويمكن أن تغير قواعدها وفقًا للموقف وتكتشف الحل لمشكلة معينة وتحلها بطريقتها.
  • يتمثل الاختلاف الرئيسي والأكثر أهمية بين التنقيب عن البيانات والتعلم الآلي في أنه بدون مشاركة البشر ولا يمكن التنقيب في البيانات عن العمل، ولكن في حالة التعلم الآلي فإنّ الجهد البشري يقتصر على الوقت الذي يتم فيه تحديد الخوارزمية بعد ذلك سوف يختتم كل شيء بمفرده، وبمجرد تنفيذه يمكن استخدامه إلى الأبد لكن هذا غير ممكن في حالة التنقيب عن البيانات.
  • نظرًا لأن التعلم الآلي هو عملية تلقائية فإنّ النتيجة الناتجة عن التعلم الآلي ستكون أكثر دقة مقارنة بالتنقيب عن البيانات ويستخدم التنقيب عن البيانات قاعدة البيانات وخادم مستودع البيانات ومحرك التنقيب عن البيانات، وتقنيات تقييم الأنماط للحصول على معلومات مفيدة بينما يستخدم التعلم الآلي الشبكات العصبية والنماذج التنبؤية والخوارزميات الآلية لاتخاذ القرارات.
  • تم تصميم التنقيب عن البيانات لاستخراج القواعد من كميات كبيرة من البيانات، بينما يعلم التعلم الآلي الكمبيوتر كيفية تعلم وفهم المعلمات المحددة، ويُعد التنقيب عن البيانات مجرد طريقة للبحث لتحديد نتيجة معينة بناءً على إجمالي البيانات التي تم جمعها، أمّا التعلم الآلي فيدرب النظام على أداء المهام المعقدة ويستخدم البيانات المحصودة والخبرة ليصبح أكثر ذكاءً.
  • يعتمد التنقيب في البيانات على مخازن ضخمة من البيانات (على سبيل المثال البيانات الكبيرة)، والتي بدورها تُستخدم لعمل تنبؤات للشركات والمؤسسات الأخرى، ومن ناحية أخرى يعمل التعلم الآلي مع الخوارزميات وليس البيانات الأولية.
  • التنقيب عن البيانات هو عملية تتضمن عنصرين هما قاعدة البيانات والتعلم الآلي، حيث يوفر الأول تقنيات إدارة البيانات بينما يوفر الأخير تقنيات تحليل البيانات، لذلك بينما يحتاج التنقيب عن البيانات إلى التعلم الآلي لا يحتاج التعلم الآلي بالضرورة إلى التنقيب في البيانات.
  • رغم ذلك هناك حالات يتم فيها استخدام المعلومات من التنقيب عن البيانات لمعرفة الروابط بين العلاقات، ومن الصعب إجراء مقارنات ما لم يكن لديك على الأقل جزأين من المعلومات يقارنان ببعضهما البعض، وبالتالي يمكن بعد ذلك استخدام المعلومات التي تم جمعها ومعالجتها عبر التنقيب عن البيانات لمساعدة الآلة على التعلم.
  • لا يمكن أن يتعلم التنقيب عن البيانات أو يتكيف في حين أن هذا هو أساس التعلم الآلي، حيث يتبع التنقيب عن البيانات قواعد محددة مسبقًا وهو ثابت بينما يعدل التعلم الآلي الخوارزميات حسب الظروف المناسبة، ويُعد التنقيب عن البيانات ذكيًا فقط مثل المستخدمين الذين يدخلون المعلمات ويعني التعلم الآلي أنّ أجهزة الكمبيوتر هذه تزداد ذكاءً.

التعلم الآلي هو وسيلة لإيجاد خوارزمية جديدة من التجربة، حيث يتضمن التعلم الآلي دراسة خوارزمية يمكنها التنقيب عن البيانات تلقائيًا، ويستخدم التعلم الآلي تقنيات التنقيب عن البيانات وخوارزمية تعلم أخرى لبناء نماذج لما يحدث وراء معلومات معينة حتى يتمكن من التنبؤ بالنتائج المستقبلية.

المصدر: Foundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionData Science from Scratch: First Principles with Python by Joel Grus / 2nd Edition


شارك المقالة: