كيفية إنشاء إطارات البيانات Data frames في R

اقرأ في هذا المقال


تُعد إطارات البيانات واحدة من أكثر هياكل البيانات شيوعًا في (R)، فهي تشبه المصفوفات، ولكنها تتمتع بوظائف إضافية تجعلها أكثر ملاءمة للتعامل مع بيانات العالم الحقيقي، إطار البيانات عبارة عن هيكل ثنائي الأبعاد يشبه الجدول حيث يمكن أن يكون كل عمود من نوع بيانات مختلف، في هذه المقالة، سوف نستكشف كيفية العمل مع إطارات البيانات في (R).

كيفية إنشاء إطارات البيانات في R

  • يعد إنشاء إطار بيانات في (R) أمرًا بسيطًا، يمكننا استخدام وظيفة (() data.frame) لإنشاء إطار بيانات من المتجهات أو القوائم، على سبيل المثال، لنفترض أن لدينا ثلاثة متجهات للبيانات:

name <- c(“Alice”, “Bob”, “Charlie”)
age <- c(25, 30, 35)
gender <- c(“Female”, “Male”, “Male”)

  • لإنشاء إطار بيانات من هذه المتجهات، يمكننا استخدام وظيفة (() data.frame):

my_data <- data.frame(name, age, gender)

  • الآن، (my_data) هو كائن إطار بيانات في (R)، يمكننا رؤية بنية إطار البيانات هذا باستخدام وظيفة (() str):

str(my_data)

  • سيعود هذا:

‘data.frame’: 3 obs. of 3 variables:
$ name : Factor w/ 3 levels “Alice”,”Bob”,..: 1 2 3
$ age : num 25 30 35
$ gender: Factor w/ 2 levels “Female”,”Male”: 1 2 2

  • يمكننا أن نرى أن (my_data) بها ثلاثة متغيرات (أعمدة) وثلاث ملاحظات (صفوف)، المتغير الأول والثالث عوامل، بينما المتغير الثاني متغير رقمي.
  • بمجرد أن يكون لدينا إطار بيانات في (R)، يمكننا إجراء مجموعة متنوعة من العمليات عليه، تتمثل إحدى العمليات الشائعة في تعيين إطار البيانات على أساس معايير معينة، على سبيل المثال، يمكننا تعيين إطار البيانات فرعيًا ليشمل فقط الصفوف التي يكون فيها العمر أكبر من (30):

subset_data <- subset(my_data, age > 30)

  • يمكننا أيضًا إجراء تحليلات إحصائية أساسية على إطار البيانات باستخدام وظائف مثل المتوسط و(() sd)، على سبيل المثال، لحساب متوسط العمر في (my_data)، يمكننا استخدام:

mean_age <- mean(my_data$age)

تعد إطارات البيانات بنية بيانات أساسية ومتعددة الاستخدامات في (R)، فهي تتيح لنا تنظيم وتحليل بيانات العالم الحقيقي بسهولة باستخدام متغيرات متعددة من أنواع مختلفة، من خلال فهم كيفية إنشاء إطارات البيانات ومعالجتها في (R)، يمكننا تنفيذ مجموعة واسعة من مهام تحليل البيانات واكتساب رؤى أعمق في بياناتنا.

المصدر: "R Graphics Cookbook" by Winston Chang"The Art of R Programming" by Norman Matloff"Advanced R" by Hadley Wickham"R for Data Science" by Hadley Wickham and Garrett Grolemund


شارك المقالة: