خوارزميات عملية التنقيب عن البيانات

التقنيةأساسيات علم البياناتعلم البيانات

قابلية التوسع في خوارزميات عملية التنقيب عن البيانات

إنّ قابلية التوسع في تقنيات التنقيب عن البيانات مهمة جدًا نظرًا للنمو السريع في حجم قواعد البيانات، حيث أصبح استخدام مصنفات شجرة القرار نموذج تصنيف فعال، والهدف الرئيسي من هذا البحث هو دراسة مصنفات شجرة القرار (SDTC) الحالية وتحليلها للعثور على أفضل الخوارزمية.

التقنيةأساسيات علم البياناتعلم البيانات

خوارزمية الاختزال التكراري BIRCH في التنقيب عن البيانات

تقدم (BIRCH) مفهومين ميزة التجميع وشجرة ميزات التجميع (شجرة CF) والتي يتم استخدامها لتلخيص وصف المجموعة، كما تسهل هذه الهياكل طريقة التجميع لتحقيق أفضل سرعة وقابلية للتوسع في قواعد البيانات الضخمة، وكما أنّها تجعلها فعالة في التجميع المتزايد والديناميكي للكائنات الواردة.

التقنيةأساسيات علم البياناتعلم البيانات

خوارزميات التصنيف والتنبؤ وطريقة عملها وأنواعها

إنّ التصنيف والتنبؤ هُما طريقتان رئيسيتان تستخدمان لعملية التنقيب عن البيانات، حيث يم استخدام هاتين الطريقتين لتحليل البيانات ولاستكشاف المزيد حول البيانات غير المعروفة، والتصنيف والتنبؤ هما شكلان من أشكال التنقيب في البيانات

التقنيةأساسيات علم البياناتعلم البيانات

خوارزمية التنقيب عن البيانات المتوازية Parallel Data Mining

في الواقع تستعد تطبيقات التنقيب عن البيانات لتصبح المستهلك المسيطر للحوسبة الفائقة في المستقبل القريب، حيث هناك ضرورة لتطوير خوارزميات متوازية فعالة لتقنيات استخراج البيانات المختلفة، ومع ذلك فإنّ تصميم مثل هذه الخوارزميات يمثل تحديًا.

التقنيةأساسيات علم البياناتعلم البيانات

خوارزمية النمو FP-Growth في عملية التنقيب في البيانات

إنّ خوارزمية (FP-Growth) هذه طريقة فعالة وقابلة للتطوير لتنقي مجموعة كاملة من الأنماط المتكررة عن طريق تطور جزء النمط باستخدام بنية شجرة بادئة ممتدة؛ لتخزين المعلومات المضغوطة والحاسمة حول الأنماط المتسلسلة المسماة بشجرة النمط المتسلسل (شجرة FP).