تقنيات عملية التنقيب عن البيانات

اقرأ في هذا المقال


التنقيب عن البيانات ليس تقنية جديدة، حيث تعود جذورها إلى الثلاثينيات، لكنّ المصطلح أصبح مستخدمًا على نطاق واسع في التسعينيات، حيث حاولت الشركات التعامل مع الكمية المتزايدة باستمرار من البيانات التي كان مجتمعنا ينتجها لاستخلاص القيمة منها.

ما هي تقنيات عملية التنقيب عن البيانات

1- الذكاء الاصطناعي

تؤدي أنظمة الذكاء الاصطناعي وظائف تحليلية تحاكي الذكاء البشري مثل: التعلم والتصميم وحل المشكلات والاستدلال.

2- تعلم قواعد الارتباط

تبحث مجموعة الأدوات هذه والتي تسمى أيضًا “تحليل طريقة السوق” عن الاتصال بين متغيرات مجموعة البيانات، وعلى سبيل المثال يمكن لتعلم قواعد الارتباط تعيين المنتجات التي يتم شراؤها بشكل متكرر معًا، وعلى سبيل المثال هاتف ذكي وحافظة واقية.

3- وضع البيانات في مجموعات

تقسم هذه العملية مجموعات البيانات إلى مجموعة من الفئات الفرعية ذات المعنى والمعروفة باسم “المجموعات”، حيث تساعد العملية المستخدمين على فهم البنية الطبيعية أو التجميع داخل البيانات.

4- التصنيف

تقوم هذه التقنية بتعيين عناصر معينة في مجموعة البيانات لفئات مستهدفة مختلفة، والهدف هو تطوير تنبؤات دقيقة داخل الفئة المستهدفة لكل حالة في البيانات.

5- تحليلات البيانات

تتيح عملية تحليل البيانات للمهنيين تقييم المعلومات الرقمية وتحويلها إلى ذكاء أعمال مفيد.

6- تنقية البيانات وإعدادها

تقوم هذه التقنية بتحويل البيانات إلى نموذج مثالي لمزيد من التحليل والمعالجة، بحيث يشمل الإعداد أنشطة مثل تحديد وإزالة الأخطاء والبيانات الغير متوفرة أو المكررة.

7- تخزين البيانات

يتكون تخزين البيانات من مجموعة واسعة من بيانات الأعمال التي تستخدمها الشركات لمساعدتها على اتخاذ القرارات، حيث يُعد التخزين مكونًا أساسيًا وضروريًا لمعظم جهود التنقيب عن البيانات على نطاق واسع.

8- التعلم الالي

فيما يتعلق بتقنية الذكاء الاصطناعي، فإنّ التعلم الآلي هو أسلوب برمجة كمبيوتر يعتمد الاحتمالات الإحصائية لتزويد أجهزة الكمبيوتر بالإمكانية على التعلم دون تدخل بشري أو برمجتها يدويًا.

9- الانحدار

يتنبأ أسلوب الانحدار بمجموعة من القيم الرقمية في فئات مثل: المبيعات أو أسعار الأسهم أو حتى درجة الحرارة، بحيث تعتمد النطاقات على المعلومات الموجودة في مجموعة بيانات معينة.

10- اعتماد الشبكات العصبية Neural Networks

تعالج أجهزة الكمبيوتر كميات كبيرة من البيانات بشكل أسرع بكثير من العقول البشرية ولكنّها لا تملك القدرة بعد على تطبيق الفطرة السليمة والخيال في العمل مع البيانات، والشبكات العصبية هي إحدى الطرق لمساعدة أجهزة الكمبيوتر على التفكير أكثر مثل البشر.

تتكون الشبكات العصبية من ثلاث طبقات رئيسية المدخلات والمخفية والمخرجات، بحيث تدخل البيانات من خلال طبقة الإدخال وتتم معالجتها في الطبقة المخفية ويتم حلها في طبقة الإخراج، حيث يتم اتخاذ أي إجراء ذي صلة بناءً على البيانات ويمكن أن تتكون الطبقة المخفية من العديد من طبقات المعالجة، اعتمادًا على كمية البيانات المستخدمة والتعلم الذي يحدث.

الشبكات العصبونية التلافيفية لديها مجموعة واسعة من التطبيقات، ويمكنها مساعدة الشركات على التنبؤ بأنماط شراء المستهلك وتركيز حملات التسويق على التركيبة السكانية المحددة، كما يمكنها أيضًا مساعدة تجار التجزئة في وضع توقعات مبيعات دقيقة وفهم كيفية استخدام التسعير الديناميكي، وعلاوةً على ذلك فهي تساعد على تحسين طرق التشخيص والعلاج في الرعاية الصحية وتحسين الرعاية والأداء.

المصدر: Data Science from Scratch: First Principles with Python by Joel Grus / 2nd EditionAn Introduction to Data Science By Jeffrey S. Saltz, Jeffrey M. Stanton / First EditionFoundations of Data Science By Avrim Blum, John Hopcroft, Ravindran Kannan / First EditionIntroducing Data Science: Big data, machine learning, and more, using Python tools By Davy Cielen, Arno Meysman / First Edition


شارك المقالة: