बार चार्ट & आर में हिस्टोग्राम (उदाहरण के साथ)

विषय - सूची:

Anonim

एक्स-अक्ष में श्रेणीबद्ध चर प्रदर्शित करने के लिए एक बार चार्ट एक शानदार तरीका है। इस प्रकार का ग्राफ y- अक्ष में दो पहलुओं को दर्शाता है।

  1. पहले एक समूह के बीच घटना की संख्या को गिना जाता है।
  2. दूसरा एक y- अक्ष में एक चर का एक सारांश सांख्यिकीय (न्यूनतम, अधिकतम, और इसी तरह) दिखाता है।

आप निम्न चर वाले mtcars डेटासेट का उपयोग करेंगे:

  • सिलेंडर: कार में सिलेंडर की संख्या। संख्यात्मक चर
  • am: ट्रांसमिशन का प्रकार। स्वचालित के लिए 0 और मैनुअल के लिए 1। संख्यात्मक चर
  • mpg: प्रति गैलन मील। संख्यात्मक चर

इस ट्यूटोरियल में, आप सीखेंगे

  • बार चार्ट कैसे बनाये
  • बार का रंग बदलें
  • तीव्रता को बदलें
  • समूहों द्वारा रंग
  • सलाखों में एक समूह जोड़ें
  • प्रतिशत में बार चार्ट
  • कंधे से कंधा मिलाकर
  • हिस्टोग्राम

बार चार्ट कैसे बनाये

R में ग्राफ बनाने के लिए, आप लाइब्रेरी ggplot का उपयोग कर सकते हैं जो रेडी-फॉर-पब्लिशिंग ग्राफ बनाता है। इस लाइब्रेरी का मूल सिंटैक्स है:

ggplot(data, mapping = aes()) +geometric objectarguments:data: dataset used to plot the graphmapping: Control the x and y-axisgeometric object: The type of plot you want to show. The most common objects are:- Point: `geom_point()`- Bar: `geom_bar()`- Line: `geom_line()`- Histogram: `geom_histogram()`

इस ट्यूटोरियल में, आप जियोमेट्रिक ऑब्जेक्ट geom_bar () में रुचि रखते हैं जो बार चार्ट बनाते हैं।

बार चार्ट: गिनती

आपका पहला ग्राफ़, geom_bar () के साथ सिलेंडर की आवृत्ति दिखाता है। नीचे दिया गया कोड सबसे बुनियादी वाक्यविन्यास है।

library(ggplot2)# Most basic bar chartggplot(mtcars, aes(x = factor(cyl))) +geom_bar()

कोड स्पष्टीकरण

  • आप ggplot के लिए डेटासेट mtcars पास करते हैं।
  • एईएस () तर्क के अंदर, आप एक्स-अक्ष को एक कारक चर (सिलेंडर) के रूप में जोड़ते हैं
  • + चिन्ह का अर्थ है कि आप चाहते हैं कि R कोड को पढ़ता रहे। यह कोड को तोड़कर अधिक पठनीय बनाता है।
  • ज्यामितीय ऑब्जेक्ट के लिए geom_bar () का उपयोग करें।

आउटपुट:

नोट : सुनिश्चित करें कि आप चर को एक कारक में परिवर्तित करते हैं अन्यथा R, चर को संख्यात्मक मानता है। नीचे उदाहरण देखें।

ग्राफ को अनुकूलित करें

ग्राफ़ को अनुकूलित करने के लिए चार तर्क दिए जा सकते हैं:

- `stat`: Control the type of formatting. By default, `bin` to plot a count in the y-axis. For continuous value, pass `stat = "identity"`- `alpha`: Control density of the color- `fill`: Change the color of the bar- `size`: Control the size the bar

बार का रंग बदलें

आप बार का रंग बदल सकते हैं। ध्यान दें कि सलाखों के रंग सभी समान हैं।

# Change the color of the barsggplot(mtcars, aes(x = factor(cyl))) +geom_bar(fill = "coral") +theme_classic()

कोड स्पष्टीकरण

  • सलाखों के रंगों को ज्यामितीय वस्तु के अंदर एईएस () मैपिंग द्वारा नियंत्रित किया जाता है (अर्थात ggplot में नहीं) ()। आप रंग भरने वाली दलीलों से बदल सकते हैं। यहाँ, आप कोरल रंग चुनें।

आउटपुट:

आप इस कोड का उपयोग कर सकते हैं:

grDevices::colors() 

R में उपलब्ध सभी रंगों को देखने के लिए लगभग 650 रंग हैं।

तीव्रता को बदलें

आप सलाखों के रंग की तीव्रता को बढ़ा या घटा सकते हैं

# Change intensityggplot(mtcars,aes(factor(cyl))) +geom_bar(fill = "coral",alpha = 0.5) +theme_classic()

कोड स्पष्टीकरण

  • बार की तीव्रता को बढ़ाने / घटाने के लिए, आप अल्फा के मान को बदल सकते हैं। एक बड़ा अल्फा तीव्रता को बढ़ाता है, और कम अल्फा तीव्रता को कम करता है। अल्फा 0 से 1. तक है। यदि 1 है, तो रंग पैलेट के समान है। यदि 0, रंग सफेद है। आप अल्फा = 0.1 चुनें।

आउटपुट:

समूहों द्वारा रंग

आप सलाखों के रंगों को बदल सकते हैं, जिसका अर्थ है प्रत्येक समूह के लिए एक अलग रंग। उदाहरण के लिए, सिलेंडर चर के तीन स्तर हैं, फिर आप तीन रंगों के साथ बार चार्ट को प्लॉट कर सकते हैं।

# Color by groupggplot(mtcars, aes(factor(cyl),fill = factor(cyl))) +geom_bar()

कोड स्पष्टीकरण

  • ऐस के अंदर भरा हुआ तर्क () बार के रंग को बदलने की अनुमति देता है। आप भरण = x- अक्ष चर सेट करके रंग बदलते हैं। आपके उदाहरण में, x- अक्ष चर सिलेंडर है; भरण = कारक (सिलेंडर)

आउटपुट:

सलाखों में एक समूह जोड़ें

आप अन्य कारक स्तर के आधार पर y- अक्ष को और विभाजित कर सकते हैं। उदाहरण के लिए, आप सिलेंडर प्रकार के आधार पर स्वचालित और मैन्युअल ट्रांसमिशन की संख्या की गणना कर सकते हैं।

आप निम्नानुसार आगे बढ़ेंगे:

  • चरण 1: mtcars डेटासेट के साथ डेटा फ़्रेम बनाएं
  • चरण 2: ऑटोमैटिक ट्रांसमिशन के लिए ऑटो और मैनुअल ट्रांसमिशन के लिए आदमी के साथ एम चर को लेबल करें। परिवर्तित करें और एक कारक के रूप में सिलेंडर करें ताकि आपको ggplot () फ़ंक्शन में कारक () का उपयोग करने की आवश्यकता न हो।
  • चरण 3: सिलेंडर द्वारा ट्रांसमिशन की संख्या की गणना करने के लिए बार चार्ट प्लॉट करें
library(dplyr)# Step 1data <- mtcars % > %#Step 2mutate(am = factor(am, labels = c("auto", "man")),cyl = factor(cyl))

आपके पास डाटासेट तैयार है, आप ग्राफ को प्लॉट कर सकते हैं;

# चरण 3

ggplot(data, aes(x = cyl, fill = am)) +geom_bar() +theme_classic()

कोड स्पष्टीकरण

  • Ggpplot () में डेटासेट डेटा और aes () हैं।
  • Aes () में आप चर x- अक्ष शामिल करते हैं और बार (यानी am) भरने के लिए कौन सा चर आवश्यक है
  • geom_bar (): बार चार्ट बनाएं

आउटपुट:

मानचित्रण बार को दो रंगों से भर देगा, प्रत्येक स्तर के लिए एक। यह डेटासेट में अन्य कारक चरों को चुनकर समूह को बदलने के लिए सहज है।

प्रतिशत में बार चार्ट

आप कच्चे गणना के बजाय प्रतिशत में बार की कल्पना कर सकते हैं।

# बार चार्ट प्रतिशत में

ggplot(data, aes(x = cyl, fill = am)) +geom_bar(position = "fill") +theme_classic()

कोड स्पष्टीकरण

  • Geom_bar में स्थिति = "fill" का उपयोग करें (y- अक्ष में प्रतिशत के साथ ग्राफ़िक बनाने के लिए तर्क)।

आउटपुट:

कंधे से कंधा मिलाकर

बार चार्ट को समूह चर पक्ष के साथ पक्ष में करना आसान है।

# Bar chart side by sideggplot(data, aes(x = cyl, fill = am)) +geom_bar(position = position_dodge()) +theme_classic()

कोड स्पष्टीकरण

  • स्थिति = position_dodge (): स्पष्ट रूप से बताता है कि सलाखों को कैसे व्यवस्थित किया जाए

आउटपुट:

हिस्टोग्राम

बार चार्ट ट्यूटोरियल के दूसरे भाग में, आप y- अक्ष में मानों के साथ चर के समूह का प्रतिनिधित्व कर सकते हैं।

आपका उद्देश्य प्रत्येक प्रकार के सिलेंडर के लिए औसत मील प्रति गैलन के साथ एक ग्राफ बनाना है। सूचनात्मक ग्राफ खींचने के लिए, आप इन चरणों का पालन करेंगे:

  • चरण 1: सिलेंडर द्वारा औसत मील प्रति गैलन के साथ एक नया चर बनाएं
  • चरण 2: एक मूल हिस्टोग्राम बनाएं
  • चरण 3: अभिविन्यास बदलें
  • चरण 4: रंग बदलें
  • चरण 5: आकार बदलें
  • चरण 6: ग्राफ़ में लेबल जोड़ें

चरण 1) एक नया चर बनाएं

आप data_histogram नाम से एक डेटा फ़्रेम बनाते हैं जो कार में सिलिंडर की संख्या के हिसाब से औसत मील प्रति गैलन देता है। आप इस नए वेरिएबल माध्य_mpg को कॉल करते हैं, और आप दो डेसीमल के साथ माध्य को गोल करते हैं।

# चरण 1

data_histogram <- mtcars % > %mutate(cyl = factor(cyl)) % > %group_by(cyl) % > %summarize(mean_mpg = round(mean(mpg), 2))

चरण 2) एक मूल हिस्टोग्राम बनाएं

आप हिस्टोग्राम की साजिश कर सकते हैं। यह ग्राहक तक पहुंचाने के लिए संवाद करने के लिए तैयार नहीं है, लेकिन हमें प्रवृत्ति के बारे में एक अंतर्ज्ञान देता है।

ggplot(data_histogram, aes(x = cyl, y = mean_mpg)) +geom_bar(stat = "identity")

कोड स्पष्टीकरण

  • एईएस () के अब दो चर हैं। सिलेंडर चर x- अक्ष को संदर्भित करता है, और mean_mpg y- अक्ष है।
  • आपको संख्यात्मक मान के रूप में y- अक्ष में चर को संदर्भित करने के लिए तर्क स्टेट = "पहचान" को पास करने की आवश्यकता है। geom_bar डिफ़ॉल्ट मान के रूप में stat = "बिन" का उपयोग करता है।

आउटपुट:

चरण 3) अभिविन्यास बदलें

आप ग्राफ के अभिविन्यास को ऊर्ध्वाधर से क्षैतिज में बदलते हैं।

ggplot(data_histogram, aes(x = cyl, y = mean_mpg)) +geom_bar(stat = "identity") +coord_flip()

कोड स्पष्टीकरण

  • आप ग्राफ के ओरिएंटेशन को ord_flip () के साथ नियंत्रित कर सकते हैं।

आउटपुट:

चरण 4) रंग बदलें

आप x- अक्ष चर के कारक स्तर के अनुसार सलाखों के रंगों में अंतर कर सकते हैं।

ggplot(data_histogram, aes(x = cyl, y = mean_mpg, fill = cyl)) +geom_bar(stat = "identity") +coord_flip() +theme_classic()

कोड स्पष्टीकरण

  • आप भरण = सिलेंडर मैपिंग के साथ समूहों द्वारा ग्राफ को प्लॉट कर सकते हैं। सिलेंडर चर के स्तरों के आधार पर रंगों की स्वचालित रूप से देखभाल करता है

आउटपुट:

चरण 5) आकार बदलें

ग्राफ़ को प्रीतिकर दिखाने के लिए, आप बार की चौड़ाई कम करते हैं।

graph <- ggplot(data_histogram, aes(x = cyl, y = mean_mpg, fill = cyl)) +geom_bar(stat = "identity",width = 0.5) +coord_flip() +theme_classic()

कोड स्पष्टीकरण

  • Geom_bar () के अंदर चौड़ाई का तर्क बार के आकार को नियंत्रित करता है। बड़ा मान चौड़ाई बढ़ाता है।
  • ध्यान दें, आप ग्राफ़ को चर ग्राफ़ में संग्रहीत करते हैं। आप ऐसा इसलिए करते हैं क्योंकि अगला चरण चर ग्राफ़ के कोड को नहीं बदलेगा। यह कोड की पठनीयता में सुधार करता है।

आउटपुट:

चरण 6) ग्राफ़ में लेबल जोड़ें

अंतिम चरण में लेबल में वैरिएबल माध्य_एमपीजी का मान जोड़ना होता है।

graph +geom_text(aes(label = mean_mpg),hjust = 1.5,color = "white",size = 3) +theme_classic()

कोड स्पष्टीकरण

  • फ़ंक्शन geom_text () पाठ की सुंदरता को नियंत्रित करने के लिए उपयोगी है।
    • लेबल =: सलाखों के अंदर एक लेबल जोड़ें
    • mean_mpg: लेबल के लिए चर mean_mpg का उपयोग करें
  • hjust लेबल के स्थान को नियंत्रित करता है। 1 के लिए बंद मान बार के शीर्ष पर लेबल को प्रदर्शित करता है, और उच्च मान लेबल को नीचे तक लाता है। यदि ग्राफ़ का ओरिएंटेशन वर्टिकल है, तो hjust को vjust में बदलें।
  • color = "white": पाठ का रंग बदलें। यहां आप सफेद रंग का इस्तेमाल करें।
  • size = 3: टेक्स्ट का आकार सेट करें।

आउटपुट:

सारांश

एक्स-अक्ष एक श्रेणीगत चर है जब एक बार चार्ट उपयोगी होता है। Y- अक्ष या तो एक गिनती या एक सारांश सांख्यिकीय हो सकता है। नीचे दी गई तालिका में बताया गया है कि ggplot2 के साथ बार चार्ट को कैसे नियंत्रित किया जाए:

उद्देश्य

कोड

गिनती

ggplot(df, eas(x= factor(x1)) + geom_bar()

भरण के विभिन्न रंग के साथ गणना

ggplot(df, eas(x= factor(x1), fill = factor(x1))) + geom_bar()

समूह के साथ गणना, स्टैक्ड

ggplot(df, eas(x= factor(x1), fill = factor(x2))) + geom_bar(position=position_dodge())

समूहों के साथ, साथ-साथ गणना करें

ggplot(df, eas(x= factor(x1), fill = factor(x2))) + geom_bar()

समूहों के साथ गणना,% में स्टैक्ड

ggplot(df, eas(x= factor(x1), fill = factor(x2))) + geom_bar(position=position_dodge())

मूल्यों

ggplot(df, eas(x= factor(x1)+ y = x2) + geom_bar(stat="identity")