كيفية إعادة تشكيل البيانات في R

اقرأ في هذا المقال


تعد إعادة تشكيل البيانات مهمة حاسمة في تحليل البيانات تتضمن تغيير بنية مجموعة البيانات لتسهيل العمل معها، توفر (R) العديد من المكتبات والوظائف لإعادة تشكيل البيانات، مما يسهل تحويل البيانات إلى تنسيقات مختلفة لتلبية احتياجات التحليل.

كيفية إعادة تشكيل البيانات في R

  • الحزمة الأكثر استخدامًا لإعادة تشكيل البيانات في (R) هي حزمة (reshape2)، توفر حزمة (reshape2) وظيفتين رئيسيتين لإعادة تشكيل البيانات: (() melt) و(() dcast).
  • تتيح لك وظيفة (() melt) تحويل مجموعة بيانات من تنسيق عريض إلى تنسيق طويل، الشكل العريض هو المكان الذي يمثل فيه كل صف ملاحظة فريدة، ويمثل كل عمود متغيرًا، في المقابل، فإن التنسيق الطويل هو المكان الذي يمثل فيه كل صف ملاحظة فريدة، وهناك أعمدة متعددة لنفس المتغير، ولكل منها قيمة مختلفة، صيغة الدالة (() melt) هي كما يلي:

melt(data, id.vars, measure.vars, …)

  • حيث البيانات هي اسم إطار البيانات، (id.vars) هو متجه لأسماء المتغيرات التي يجب الاحتفاظ بها كمعرفات، و(measure.vars) هو متجه لأسماء المتغيرات المراد تحويلها، على سبيل المثال، لتحويل إطار بيانات من تنسيق عريض إلى تنسيق طويل، يمكنك استخدام الكود التالي:

library(reshape2)
melt(data, id.vars = c(“id”, “date”), measure.vars = c(“value1”, “value2”))

  • تتيح لك وظيفة (() dcast) تحويل مجموعة بيانات من تنسيق طويل إلى تنسيق عريض، بناء الجملة لوظيفة (() dcast) كما يلي:

dcast(data, formula, fun.aggregate, …)

حيث البيانات هي اسم إطار البيانات، والصيغة هي صيغة تشير إلى المتغير (المتغيرات) التي سيتم استخدامها كصفوف وأعمدة، و(fun.aggregate) هي وظيفة يتم تطبيقها على قيم الجدول الناتج، على سبيل المثال، لإعادة إرسال إطار البيانات المصهور إلى تنسيق عريض ، يمكنك استخدام الكود التالي:

dcast(melted_data, id + date ~ variable, sum)

تعد إعادة تشكيل البيانات مهمة حاسمة في تحليل البيانات تتضمن تغيير بنية مجموعة البيانات لتسهيل التعامل معها، يوفر (R) العديد من المكتبات والوظائف لإعادة تشكيل البيانات، بما في ذلك حزمة (reshape2) مع وظائف (() melt) و (() dcast)، من خلال إتقان هذه الأدوات، يمكن لمحللي البيانات التأكد من أن تحليلهم يعتمد على بيانات جيدة التنظيم، مما يؤدي إلى رؤى أكثر موثوقية واتخاذ قرارات أفضل.

المصدر: "R for Data Science" by Hadley Wickham and Garrett Grolemund"Advanced R" by Hadley Wickham"The Art of R Programming" by Norman Matloff"R Graphics Cookbook" by Winston Chang


شارك المقالة: