R में फैक्टर क्या है?
R में फैक्टर एक वैरिएबल है जिसका उपयोग डेटा को वर्गीकृत करने और स्टोर करने के लिए किया जाता है, जिसमें सीमित संख्या में विभिन्न मूल्य होते हैं। यह डेटा को पूर्णांक मानों के वेक्टर के रूप में संग्रहीत करता है। R में फैक्टर को एक श्रेणीगत चर के रूप में भी जाना जाता है जो स्ट्रिंग और पूर्णांक डेटा मान दोनों को स्तरों के रूप में संग्रहीत करता है। फैक्टर ज्यादातर सांख्यिकीय मॉडलिंग और खोजपूर्ण डेटा विश्लेषण में आर के साथ प्रयोग किया जाता है।
डेटासेट में, हम दो प्रकार के चर को भेद कर सकते हैं: श्रेणीबद्ध और निरंतर ।
- आर में श्रेणीबद्ध चर के लिए वर्णनात्मक आंकड़ों में, मूल्य सीमित है और आमतौर पर एक विशेष परिमित समूह पर आधारित है। उदाहरण के लिए, R का एक श्रेणीगत चर देश, वर्ष, लिंग, व्यवसाय हो सकता है।
- एक सतत चर, हालांकि, पूर्णांक से दशमलव तक कोई भी मान ले सकता है। उदाहरण के लिए, हम राजस्व, एक शेयर की कीमत, आदि…
श्रेणीगत चर
R में श्रेणीबद्ध चर एक कारक में संचित होते हैं। चरित्र आर को एक कारक चर में परिवर्तित करने के लिए नीचे दिए गए कोड की जाँच करें। अक्षर मशीन एल्गोरिथ्म में समर्थित नहीं हैं, और एक स्ट्रिंग को पूर्णांक में बदलने का एकमात्र तरीका है।
वाक्य - विन्यास
factor(x = character(), levels, labels = levels, ordered = is.ordered(x))
तर्क:
- x : R में श्रेणीबद्ध डेटा का एक वेक्टर, एक स्ट्रिंग या पूर्णांक होना चाहिए, दशमलव नहीं।
- स्तर : x द्वारा लिए गए संभावित मानों का एक सदिश। यह तर्क वैकल्पिक है। डिफ़ॉल्ट मान वेक्टर x की वस्तुओं की अद्वितीय सूची है।
- लेबल : आर। में एक्स श्रेणीबद्ध डेटा के लिए एक लेबल जोड़ें। उदाहरण के लिए, 1 लेबल `पुरुष` जबकि 0, लेबल` महिला` ले सकते हैं।
- आदेश दिया : निर्धारित करें कि क्या स्तरों को श्रेणीबद्ध डेटा में आर में क्रमबद्ध किया जाना चाहिए।
उदाहरण:
चलो एक कारक डेटा फ़्रेम बनाते हैं।
# Create gender vectorgender_vector <- c("Male", "Female", "Female", "Male", "Male")class(gender_vector)# Convert gender_vector to a factorfactor_gender_vector <-factor(gender_vector)class(factor_gender_vector)
आउटपुट:
## [1] "character"## [1] "factor"
जब हम मशीन लर्निंग कार्य करते हैं तो R में एक स्ट्रिंग को कारक चर में बदलना महत्वपूर्ण होता है ।
R में एक श्रेणीगत चर को नाममात्र श्रेणीगत चर और क्रमिक श्रेणीगत चर में विभाजित किया जा सकता है ।
नाममात्र श्रेणीबद्ध चर
एक श्रेणीगत चर में कई मान होते हैं लेकिन आदेश कोई मायने नहीं रखता। मसलन, पुरुष या महिला। R में श्रेणीबद्ध चर के पास आदेश नहीं है।
# Create a color vectorcolor_vector <- c('blue', 'red', 'green', 'white', 'black', 'yellow')# Convert the vector to factorfactor_color <- factor(color_vector)factor_color
आउटपुट:
## [1] blue red green white black yellow## Levels: black blue green red white yellow
Factor_color से, हम कोई आदेश नहीं बता सकते।
साधारण श्रेणीबद्ध चर
साधारण श्रेणीबद्ध चर में प्राकृतिक क्रमबद्धता होती है। हम ऑर्डर निर्दिष्ट कर सकते हैं, ऑर्डर के साथ निम्नतम से उच्चतम = TRUE और ऑर्डर के साथ सबसे कम = FALSE।
उदाहरण:
हम आर में प्रत्येक कारक चर के मूल्यों को गिनने के लिए सारांश का उपयोग कर सकते हैं।
# Create Ordinal categorical vectorday_vector <- c('evening', 'morning', 'afternoon', 'midday', 'midnight', 'evening')# Convert `day_vector` to a factor with ordered levelfactor_day <- factor(day_vector, order = TRUE, levels =c('morning', 'midday', 'afternoon', 'evening', 'midnight'))# Print the new variablefactor_day
आउटपुट:
## [1] evening morning afternoon middaymidnight evening
उदाहरण:
## Levels: morning < midday < afternoon < evening < midnight# Append the line to above code# Count the number of occurence of each levelsummary(factor_day)
आउटपुट:
## morning midday afternoon evening midnight## 1 1 1 2 1
आर स्तर 'सुबह' से 'मध्यरात्रि' तक का स्तर स्तर कोष्ठक में निर्दिष्ट किया गया है।
सतत चर
सतत वर्ग चर आर में डिफ़ॉल्ट मान हैं। उन्हें संख्यात्मक या पूर्णांक के रूप में संग्रहीत किया जाता है। हम इसे नीचे दिए गए डेटासेट से देख सकते हैं। mtcars एक अंतर्निहित डेटासेट है। यह विभिन्न प्रकार की कार के बारे में जानकारी एकत्र करता है। हम इसे mtcars का उपयोग करके आयात कर सकते हैं और चर mpg के वर्ग की जांच कर सकते हैं, प्रति गैलन मील। यह एक निरंतर चर का संकेत देते हुए एक संख्यात्मक मान लौटाता है।
dataset <- mtcarsclass(dataset$mpg)
उत्पादन
## [1] "numeric"