كيفية التعامل مع العوامل Factors في برمجية R

اقرأ في هذا المقال


في (R)، العوامل هي نوع من بنية البيانات المستخدمة لتمثيل المتغيرات الفئوية، العوامل مفيدة لتحليل البيانات، لأنها تتيح لنا تنظيم البيانات وتحليلها بسهولة بناءً على المتغيرات الفئوية، في هذه المقالة، سوف نستكشف كيفية التعامل مع العوامل في (R).

كيفية التعامل مع العوامل في R

  • تكوين العوامل في (R) أمر بسيط، يمكننا إنشاء عامل باستخدام وظيفة العامل ()، على سبيل المثال، لنفترض أن لدينا متجهًا للألوان:

colors <- c(“red”, “blue”, “green”, “red”, “blue”, “green”)

  • لإنشاء عامل من هذا المتجه، يمكننا استخدام وظيفة العامل ():

color_factor <- factor(colors)

  • الآن، (color_factor) هو كائن عامل في (R)، يمكننا رؤية مستويات هذا العامل باستخدام وظيفة levels ():

levels(color_factor)

  • سيعود هذا:

“blue” “green” “red”

  • في (R)، يمكن ترتيب العوامل أو عدم ترتيبها، افتراضيًا، العوامل غير مرتبة، ومع ذلك، إذا أردنا إنشاء عامل مرتب، فيمكننا استخدام الدالة (() Order)، على سبيل المثال:

sizes <- c(“small”, “medium”, “large”, “medium”, “small”, “large”)
size_factor <- ordered(sizes, levels=c(“small”, “medium”, “large”))

  • في هذا المثال، أنشأنا عاملًا مرتبًا بالمستويات “صغير” و”متوسط” و”كبير”، يمكننا أن نرى مستويات هذا العامل باستخدام وظيفة Level ():

levels(size_factor)

  • سيعود هذا:

“small” “medium” “large”

  • يعد العمل مع العوامل في (R) أمرًا بسيطًا، وهي أداة مفيدة لتنظيم البيانات الفئوية وتحليلها، يمكن أيضًا استخدام العوامل جنبًا إلى جنب مع وظائف (R) الأخرى، مثل دالة التجميع ()، لأداء مهام تحليل بيانات أكثر تقدمًا.
  • بالإضافة إلى إنشاء العوامل، يمكننا أيضًا إجراء مجموعة متنوعة من العمليات على العوامل في (R)، إحدى العمليات الشائعة هي إعادة ترميز مستويات العوامل، يمكن أن يكون هذا مفيدًا عندما نريد تجميع المستويات معًا أو إعادة تسمية المستويات لجعلها أكثر وضوحًا، على سبيل المثال:

gender <- c(“male”, “female”, “male”, “female”, “male”)
gender_factor <- factor(gender)

# Recode “male” to “M” and “female” to “F”
levels(gender_factor) <- c(“M”, “F”)

# Rename factor levels
levels(gender_factor) <- c(“Male”, “Female”)

  • عملية أخرى يمكننا إجراؤها على العوامل هي إعادة ترتيب المستويات، يمكن أن يكون هذا مفيدًا عندما نريد تغيير الترتيب الذي تظهر به المستويات في مخطط أو جدول، على سبيل المثال:

income <- c(“low”, “high”, “medium”, “high”, “low”)
income_factor <- factor(income, levels=c(“low”, “medium”, “high”))

# Reorder factor levels
income_factor <- factor(income_factor, levels=c(“high”, “medium”, “low”))

  • بالإضافة إلى هذه العمليات الأساسية، يمكننا أيضًا إجراء عمليات أكثر تقدمًا على العوامل التي تستخدم حزم (R)، على سبيل المثال، توفر حزمة (forcats) مجموعة متنوعة من الوظائف للعمل مع العوامل، مثل: (() fct_reorder) لإعادة ترتيب مستويات العوامل بناءً على وظيفة البيانات.

المصدر: "R for Data Science" by Hadley Wickham and Garrett Grolemund"Advanced R" by Hadley Wickham"The Art of R Programming" by Norman Matloff"R Graphics Cookbook" by Winston Chang


شارك المقالة: