مكتبات برمجية R الأكثر شيوعا لعلوم البيانات

اقرأ في هذا المقال


يبحث علماء البيانات وقادة الأعمال في جميع أنحاء العالم عن طرق جديدة لفهم لغات برمجة الكمبيوتر، ويمكن العثور على العديد من حزم (R) والمكتبات لأداء مهام مختلفة في (Data Science).

ما هي مكتبات برمجية R الأكثر شيوعا لعلوم البيانات

1. حزم قواعد البيانات

  • حزمة (DBI) لدمج (R) مع أنظمة إدارة قواعد البيانات (DBMS).
  • توفر الحزم (RMySQL) و(RSQLite) برامج تشغيل لقواعد البيانات لتحميل البيانات وقراءتها من قاعدة البيانات.

2. حزم التصور

  • تسهل أداة (ggplot2) إنشاء مخططات ورسومات جذابة بصريًا.
  • (ggmap) عبارة عن حزمة (R) تساعد في البيانات المكانية لأنها تسمح بتنزيل مناطق الخريطة من خرائط (Google) ودمجها لاحقًا في تصورات (ggplot).
  • تساعدك الحزمة (shiny) إنشاء تطبيقات الويب.

3. حزم معالجة وتحليل البيانات

  • تسمح حزمة (dplyr) بتلخيص مجموعات البيانات وتوصيلها وإعادة ترتيبها.
  • توفر حزمة (stringr) أدوات سهلة الاستخدام للتعامل مع سلاسل الأحرف والتعبيرات العادية.
  • تساعد حزمة (lubridate) على العمل بكفاءة مع إدخالات التاريخ والوقت في مجموعة البيانات.

4. حزم التعلم الآلي والتعلم العميق

  • يمكن استخدام حزم علامة الإدخال و(randomForest) لتصنيف التدريب ونماذج الانحدار.
  • توفر حزمة الشبكة العميقة مجموعة أدوات في (R) للتعلم العميق، وبالمثل يمكن استخدام الأطر الشائعة (Keras) و(TensorFlow) في (R).

5. مكتبة lubridate

من المحتمل أن تكون التواريخ هي المشتبه بهم المعتاد عندما يحدث خطأ في بعض التحليلات أو عندما تكون البيانات غير منطقية، وذلك لأنّ التواريخ نادرًا ما يتم تحليلها بشكل صحيح وموثوق خارج الصندوق وفي كثير من الأحيان يتعين تحديد اللغة يدويًا وفهم التنسيق وتحليلها وما إلى ذلك.

يجعل (lubridate) من السهل التعامل مع التواريخ بوظائف بسيطة لتحليل قيم التاريخ والوقت تلقائيًا، كما أنّ لديها صيغ فريدة مثل: (ymd () وdmy () وmdy ()) وآخرون والتي تحول تنسيقات التاريخ من واحد إلى آخر، كما تتوفر تنسيقات مماثلة لقيم الوقت والتاريخ أيضًا.


شارك المقالة: