الرياضيات هي حجر الأساس لأي تخصص علمي معاصر، وتمتلك جميع تقنيات علوم البيانات الحديثة تقريبًا بما في ذلك التعلم الآلي أساسًا رياضيًا عميقًا.
كيفية استخدام الرياضيات في علوم البيانات
- علم البيانات هو مجال كبير يتطلب خبرة واسعة وكونه على مستوى المبتدئين وتكون النقطة المهمة هي أنّه عندما تعمل على حل مشاكل الحياة الواقعية، سيُطلب العمل على نطاق واسع وسيحتاج ذلك بالتأكيد إلى مفاهيم واضحة للرياضيات.
- يحجب أحد ركائز الرياضيات في أربع ركائز يمكن أن تساعد على البدء من الصفر، ويجب تطبيق هذه الركائز الأربع لمعرفة كيفية ومكان برمجة تلك الخوارزميات الرياضية أثناء العمل على النظام.
- إنّ المهارة الأولى التي تحتاج إلى إتقانها في الرياضيات هي الجبر الخطي وبعدها يأتي دور الإحصاء وحساب التفاضل والتكامل وما إلى ذلك.
طريقة استخدام الرياضيات في علم البيانات
1. الجبر الخطي والمصفوفة
- تركيبات خطية.
- المتجهات والمصفوفات.
- الكميات ثلاثة أبعاد.
- المصفوفات.
- تبديل المصفوفة.
- مصفوفة معكوسة.
- المصفوفة المحددة.
- التعيينات الخطية.
- تكوين رسم الخرائط الخطية.
- الهياكل الجبرية.
- تكرار البيانات.
- النظرية الأساسية للجبر الخطي ومعلومات البيانات.
- تقسيم مجال التعيين الخطي والمجال المشترك وتقسيم البيانات.
- تحليل القيمة الفردية (SVD).
2- الاحتمالات والإحصاء
- متغير عشوائي مستمر ومنفصل.
- نظرية الحد المركزي.
- التوزيعات الاحتمالية ذات الحدين وبواسون (Poisson) وعادي.
- الإحصائيات ويعني والوسيط والوضع والانحراف والتباين المعياري.
- مقاييس التشابه بيرسون وجيب التمام وسبيرمان (Spearman).
- اختبار الفرضيات مثل (T-test) و(Paired T-test) و(p-value) و(F-Test) و(z-test).
3- حساب التفاضل والتكامل
- الحد الأقصى والحد الأدنى ونظرية القيمة.
- قاعدة السلسلة وسلسلة تايلور.
- المشتقات.
- تدرجات المصفوفات.
- التكاثر العكسي.
- خوارزمية نزول التدرج.
- هويات مفيدة لحساب التدرج.
- المشتقات ذات الترتيب الأعلى.
- سلسلة تايلور متعددة المتغيرات.
- المنطقة الواقعة تحت المنحنى.
4- الهندسة والمعرفة بالرسم البياني
- يتعامل مع زوايا وقياسات ونسب الأشياء العادية.
- فهم مخططات التوزيع والمخططات المبعثرة و(Boxplot).
- تصور الرسوم البيانية والقدرة على تكوين رؤى منها.
- الرسوم البيانية المحدبة والمقعرة وخصائصها.