استيراد البيانات وقراءة ملفات CSV و Excel في R

اقرأ في هذا المقال


يعد استيراد البيانات إلى (R) خطوة حاسمة في أي مشروع لتحليل البيانات، أكثر تنسيقات الملفات شيوعًا لتخزين البيانات هما (CSV) “قيم مفصولة بفواصل” وملفات (Excel)، في هذه المقالة، سوف نستكشف كيفية قراءة أنواع الملفات هذه إلى (R).

كيفية قراءة ملفات CSV في R

  • ملفات (CSV) هي ملفات نصية عادية تحتوي على بيانات مفصولة بفواصل، قراءة ملف (CSV) إلى (R) أمر بسيط ومباشر، يمكننا استخدام وظيفة (() read.csv) للقيام بذلك، على سبيل المثال، افترض أن لدينا ملف (CSV) يسمى (data.csv) موجود في دليل العمل، يمكننا قراءته إلى (R) باستخدام الكود التالي:

data <- read.csv(“data.csv”)

  • بشكل افتراضي، تفترض (() read.csv) أن الصف الأول من الملف يحتوي على أسماء أعمدة، إذا لم يكن الملف يحتوي على أسماء أعمدة، فيمكننا تعيين (header = FALSE) لإخبار (R) باستخدام أسماء الأعمدة الافتراضية، بالإضافة إلى ذلك، يمكننا تعيين خيارات أخرى، مثل الحرف الفاصل، من خلال تحديد وسيطة (sep).

كيفية قراءة ملفات Excel في R

  • غالبًا ما تُستخدم ملفات (Excel) لتخزين البيانات في إعدادات العمل، يحتوي (R) على العديد من الحزم التي يمكنها قراءة ملفات (Excel)، مثل: (xlsx و readxl)، توفر حزمة (readxl) واجهة بسيطة لاستيراد ملفات (Excel) إلى (R)، لاستخدام حزمة (readxl)، نحتاج أولاً إلى تثبيتها باستخدام الكود التالي:

install.packages(“readxl”)

  • بمجرد التثبيت، يمكننا استخدام وظيفة (() read_excel) لقراءة ملف (Excel) إلى (R)، على سبيل المثال، افترض أن لدينا ملف (Excel) يسمى (data.xlsx) موجود في دليل العمل، يمكننا قراءته إلى (R) باستخدام الكود التالي:

library(readxl)
data <- read_excel(“data.xlsx”)

  • بشكل افتراضي، تفترض (() read_excel) أن الورقة الأولى من الملف تحتوي على بيانات، ومع ذلك، يمكننا تحديد اسم الورقة أو الفهرس عن طريق تعيين وسيطة الورقة.
  • يعد استيراد البيانات إلى (R) خطوة حيوية في أي مشروع لتحليل البيانات، في هذه المقالة، اكتشفنا كيفية قراءة ملفات (CSV و Excel) إلى (R)، يمكن لوظيفة (() read.csv) قراءة ملفات (CSV)، بينما يمكن لوظيفة (() read_excel) من حزمة (readxl) قراءة ملفات (Excel)، باستخدام هذه الأدوات، يمكننا بسهولة استيراد البيانات إلى (R) والبدء في تحليلها.

شارك المقالة: