हाइव में टेबल ऑपरेशन जैसे क्रिएशन, ऑल्टरिंग और ड्रोपिंग टेबल को इस ट्यूटोरियल में देखा जा सकता है।
नीचे स्क्रीनशॉट में, हम स्तंभों के साथ एक तालिका बना रहे हैं और तालिका का नाम बदल रहे हैं।
1. "समान" और "समान" जैसे दो स्तंभ नामों के साथ तालिका गुरु_ नमूना बनाना
2. गुरु99 डेटाबेस में मौजूद टेबल प्रदर्शित करना
3. टेबल के नीचे प्रदर्शित गुरु_ नमूना
4. "गुरु_सम्प्लन" के रूप में "गुरु_सम्पल" को सारणीबद्ध करना
5. फिर जब आप "शो" कमांड निष्पादित करते हैं, तो यह नया नाम प्रदर्शित करेगा Guru_sampleNew
Dropping table guru_sampleNew:
तालिका प्रकार और इसका उपयोग:
टेबल्स में आना उसी तरह है जैसे हम पारंपरिक रिलेशनल डेटाबेस में बनाते हैं। टेबल पर फ़िल्टरिंग, जॉइन जैसे कार्य किए जा सकते हैं।
हाइव , हाइव में स्कीमा के लोडिंग और डिज़ाइन के आधार पर आंतरिक और बाहरी तालिकाओं जैसे दो प्रकार की तालिका संरचनाओं से संबंधित है ।
आंतरिक तालिकाओं
- आंतरिक तालिका प्रकृति में कसकर युग्मित होती है। इस प्रकार की तालिका में, पहले हमें तालिका बनाना होगा और डेटा लोड करना होगा।
- इसे हम स्कीमा के डेटा के रूप में कह सकते हैं ।
- इस तालिका को छोड़ने से, डेटा और स्कीमा दोनों को हटा दिया जाएगा।
- इस तालिका का संग्रहीत स्थान / उपयोगकर्ता / हाइव / गोदाम पर होगा।
आंतरिक तालिका कब चुनें:
- यदि प्रसंस्करण डेटा स्थानीय फ़ाइल सिस्टम में उपलब्ध है
- यदि हम चाहते हैं कि हाइव विलोपन सहित डेटा के संपूर्ण जीवनचक्र का प्रबंधन करे
आंतरिक तालिका के लिए नमूना कोड स्निपेट
1. आंतरिक तालिका बनाने के लिए
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. डेटा को आंतरिक तालिका में लोड करें
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. तालिका की सामग्री प्रदर्शित करें
Hive>select * from guruhive_internaltable;
4. आंतरिक तालिका को गिराने के लिए
Hive>DROP TABLE guruhive_internaltable;
यदि आपने अपने मेटाडेटा सहित गुरुहित_अनंतयोग्य को गिरा दिया और उसका डेटा हाइव से हटा दिया जाएगा।
निम्नलिखित स्क्रीनशॉट से, हम आउटपुट का निरीक्षण कर सकते हैं
उपरोक्त कोड और स्क्रीन शॉट से हम निम्नलिखित बातें करते हैं,
- आंतरिक तालिका बनाएं
- डेटा को आंतरिक तालिका में लोड करें
- तालिका की सामग्री प्रदर्शित करें
- आंतरिक तालिका को गिराने के लिए
बाहरी तालिकाओं
- बाहरी तालिका प्रकृति में शिथिल है। डेटा एचडीएफएस में उपलब्ध होगा। तालिका एचडीएफएस डेटा पर बनाने जा रही है।
- दूसरे तरीके से, हम इसे डेटा पर स्कीमा बनाने की तरह कह सकते हैं ।
- तालिका को छोड़ने के समय यह केवल स्कीमा को गिराता है, डेटा अभी भी एचडीएफएस में पहले की तरह उपलब्ध होगा।
- जब भी स्कीमा अपडेट होता है, हर बार डेटा को हटाने के बजाय एचडीएफएस में संग्रहीत डेटा के लिए बाहरी स्कीमा बनाने के लिए बाहरी तालिकाएं एक विकल्प प्रदान करती हैं
बाहरी तालिका कब चुनें:
- यदि एचडीएफएस में उपलब्ध डेटा को संसाधित करना
- उपयोगी जब फाइलें हाइव के बाहर उपयोग की जा रही हैं
बाहरी तालिका के लिए नमूना कोड स्निपेट
1. बाहरी तालिका बनाएं
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. यदि हम तालिका निर्माण के समय स्थान निर्दिष्ट नहीं कर रहे हैं, तो हम डेटा को मैन्युअल रूप से लोड कर सकते हैं
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. तालिका की सामग्री प्रदर्शित करें
Hive>select * from guruhive_external;
4. आंतरिक तालिका को गिराने के लिए
Hive>DROP TABLE guruhive_external;
निम्नलिखित स्क्रीन शॉट से, हम आउटपुट का निरीक्षण कर सकते हैं
उपरोक्त कोड में, हम निम्नलिखित बातें करते हैं
- बाहरी तालिका बनाएं
- बाहरी तालिका में डेटा लोड करें
- तालिका की सामग्री प्रदर्शित करें
- बाहरी तालिका को गिरा देना
आंतरिक बनाम बाहरी तालिकाओं के बीच अंतर
फ़ीचर | अंदर का | बाहरी |
---|---|---|
योजना | स्कीमा पर डेटा | डेटा पर स्कीमा |
रखने की जगह | / usr / छत्ता / गोदाम | HDFS स्थान |
डेटा उपलब्धता | स्थानीय फ़ाइल सिस्टम के भीतर | HDFS के भीतर |