यहां अक्सर सही नौकरी पाने के लिए नए उम्मीदवारों के साथ-साथ अनुभवी उम्मीदवारों के लिए डेटा इंजीनियर साक्षात्कार प्रश्न पूछे जाते हैं।
1) डाटा इंजीनियरिंग की व्याख्या करें।
डेटा इंजीनियरिंग एक शब्द है जिसका उपयोग बड़े डेटा में किया जाता है। यह डेटा संग्रह और अनुसंधान के अनुप्रयोग पर केंद्रित है। विभिन्न स्रोतों से उत्पन्न डेटा सिर्फ कच्चे डेटा हैं। डेटा इंजीनियरिंग इस कच्चे डेटा को उपयोगी जानकारी में बदलने में मदद करता है।
2) डेटा मॉडलिंग क्या है?
डेटा मॉडलिंग जटिल सॉफ़्टवेयर डिज़ाइन को एक आरेख के रूप में दस्तावेज करने की विधि है ताकि कोई भी आसानी से समझ सके। यह डेटा ऑब्जेक्ट्स का एक वैचारिक प्रतिनिधित्व है जो विभिन्न डेटा ऑब्जेक्ट्स और नियमों के बीच जुड़ा हुआ है।
3) डेटा मॉडलिंग में विभिन्न प्रकार के डिजाइन स्कीमा की सूची बनाएं
डेटा मॉडलिंग में मुख्य रूप से दो प्रकार के स्कीमा होते हैं: 1) स्टार स्कीमा और 2) स्नोफ्लेक स्कीमा।
4) संरचित और असंरचित डेटा के बीच भेद
निम्नलिखित संरचित और असंरचित डेटा के बीच एक अंतर है:
पैरामीटर | संरचित डेटा | असंरचित डेटा |
भंडारण | डीबीएमएस | अप्रबंधित फ़ाइल संरचनाएँ |
मानक | ADO.net, ODBC और SQL | STMP, XML, CSV और SMS |
एकीकरण उपकरण | ईएलटी (अर्क, ट्रांसफॉर्म, लोड) | मैन्युअल डेटा प्रविष्टि या बैच प्रसंस्करण जिसमें कोड शामिल हैं |
स्केलिंग | स्कीमा स्केलिंग मुश्किल है | स्केलिंग बहुत आसान है। |
5) एक Hadoop एप्लिकेशन के सभी घटकों को समझाइए
Hadoop एप्लिकेशन के घटक निम्नलिखित हैं:
- Hadoop Common: यह उपयोगिताओं और पुस्तकालयों का एक सामान्य सेट है जो Hadoop द्वारा उपयोग किया जाता है।
- HDFS: यह Hadoop एप्लिकेशन उस फाइल सिस्टम से संबंधित है जिसमें Hadoop डेटा संग्रहीत है। यह उच्च बैंडविड्थ वाले एक वितरित फ़ाइल सिस्टम है।
- Hadoop MapReduce: यह बड़े पैमाने पर डेटा प्रोसेसिंग के प्रावधान के लिए एल्गोरिदम के अनुसार आधारित है।
- Hadoop YARN: इसका उपयोग Hadoop क्लस्टर के भीतर संसाधन प्रबंधन के लिए किया जाता है। इसे यूजर्स के लिए टास्क शेड्यूलिंग के लिए भी इस्तेमाल किया जा सकता है।
6) NameNode क्या है?
यह एचडीएफएस का केंद्रबिंदु है। यह एचडीएफएस का डेटा संग्रहीत करता है और समूहों में विभिन्न फाइलों को ट्रैक करता है। यहां, वास्तविक डेटा संग्रहीत नहीं है। डेटा को DataNodes में संग्रहीत किया जाता है।
7) Hadoop स्ट्रीमिंग को परिभाषित करें
यह एक उपयोगिता है जो मानचित्र के निर्माण की अनुमति देता है और नौकरियों को कम करता है और उन्हें एक विशिष्ट क्लस्टर में प्रस्तुत करता है।
8) एचडीएफएस का पूर्ण रूप क्या है?
HDFS का मतलब है हडॉप डिस्ट्रीब्यूटेड फाइल सिस्टम।
9) एचडीएफएस में ब्लॉक और ब्लॉक स्कैनर को परिभाषित करें
ब्लॉक एक डेटा फ़ाइल की सबसे छोटी इकाई है। Hadoop स्वचालित रूप से बड़ी फ़ाइलों को छोटे टुकड़ों में विभाजित करता है।
ब्लॉक स्कैनर एक ब्लॉक की सूची की पुष्टि करता है जो कि एक DataNode पर प्रस्तुत की जाती है।
10) ब्लॉक स्कैनर एक दूषित डेटा ब्लॉक का पता लगाने पर क्या कदम उठाता है?
ब्लॉक स्कैनर को दूषित डेटा ब्लॉक मिलने पर निम्न चरण होते हैं:
1) सबसे पहले, जब ब्लॉक स्कैनर एक भ्रष्ट डेटा ब्लॉक पाता है, तो DataNode NameNode को रिपोर्ट करता है
2) NameNode भ्रष्ट ब्लॉक की प्रतिकृति का उपयोग करके एक नई प्रतिकृति बनाने की प्रक्रिया शुरू करता है।
3) सही प्रतिकृतियों की प्रतिकृति गणना प्रतिकृति कारक के साथ मेल खाने की कोशिश करती है। यदि मिलान दूषित डेटा ब्लॉक पाया जाता है तो उसे हटाया नहीं जाएगा।
11) दो नाम बताएं जो NameNode DataNode से प्राप्त होते हैं?
दो संदेश हैं जो NameNode DataNode से प्राप्त करता है। वे 1) ब्लॉक रिपोर्ट और 2) हार्टबीट हैं।
12) Hadoop में विभिन्न XML कॉन्फ़िगरेशन फ़ाइलों की सूची बनाएं?
Hadoop में पाँच XML विन्यास फाइल हैं:
- मैप्ड-साइट
- कोर-साइट
- HDFS- साइट
- सूत-स्थल
13) चार वी बड़े डेटा के क्या हैं?
चार V के बड़े डेटा हैं:
- वेग
- वैराइटी
- आयतन
- सच्चाई
14) Hadoop की विशेषताएं बताइए
Hadoop की महत्वपूर्ण विशेषताएं हैं:
- यह एक ओपन-सोर्स फ्रेमवर्क है जो फ्रीवेयर उपलब्ध है।
- Hadoop कई प्रकार के हार्डवेयर के साथ संगत है और एक विशिष्ट नोड के भीतर नए हार्डवेयर का उपयोग करने में आसान है।
- Hadoop डेटा के तेजी से वितरित प्रसंस्करण का समर्थन करता है।
- यह क्लस्टर में डेटा को संग्रहीत करता है, जो बाकी परिचालन से स्वतंत्र है।
- Hadoop प्रत्येक नोड के लिए अलग-अलग नोड्स के साथ 3 प्रतिकृतियां बनाने की अनुमति देता है।
15) Reducer की मुख्य विधियाँ बताइए
- सेटअप (): इसका उपयोग इनपुट डेटा के आकार और वितरित कैश जैसे मापदंडों को कॉन्फ़िगर करने के लिए किया जाता है।
- सफाई (): इस पद्धति का उपयोग अस्थायी फ़ाइलों को साफ करने के लिए किया जाता है।
- कम करना (): यह reducer का दिल है जिसे संबंधित कम किए गए कार्य के साथ एक बार कुंजी कहा जाता है
16) COSHH का संक्षिप्त नाम क्या है?
COSHH का संक्षिप्त नाम वर्गीकरण और अनुकूलन आधारित कार्यक्रम हैडोजीनस हैडोप सिस्टम है।
17) स्टार स्कीमा की व्याख्या करें
स्टार स्कीमा या स्टार जॉइन स्कीमा डेटा वेयरहाउस स्कीमा का सबसे सरल प्रकार है। इसे स्टार स्कीमा के रूप में जाना जाता है क्योंकि इसकी संरचना एक स्टार की तरह है। स्टार स्कीमा में, स्टार के केंद्र में एक तथ्य तालिका और कई संबद्ध आयाम तालिका हो सकती हैं। इस स्कीमा का उपयोग बड़े डेटा सेट को क्वेरी करने के लिए किया जाता है।
18) एक बड़ा डेटा समाधान कैसे तैनात करें?
एक बड़ा डेटा समाधान तैनात करने के लिए निम्न चरणों का पालन करें।
1) RDBMS, SAP, MySQL, Salesforce जैसे डेटा स्रोतों का उपयोग करके डेटा को एकीकृत करें
2) स्टोर डेटा निकाले गए डेटा को NoSQL डेटाबेस या HDFS में।
3) सुअर, चिंगारी और मेप्रेड्यूस जैसे प्रसंस्करण ढांचे का उपयोग करके बड़े डेटा समाधान को तैनात करें।
19) FSCK की व्याख्या करें
फ़ाइल सिस्टम चेक या FSCK का उपयोग HDFS द्वारा किया जाता है। FSCK कमांड का उपयोग फ़ाइल में विसंगतियों और समस्या की जांच के लिए किया जाता है।
20) स्नोफ्लेक स्कीमा की व्याख्या करें
स्नोफ्लेक स्कीमा एक स्टार स्कीमा का विस्तार है, और यह अतिरिक्त आयाम जोड़ता है। इसे स्नोफ्लेक के रूप में जाना जाता है क्योंकि इसका आरेख स्नोफ्लेक जैसा दिखता है। आयाम तालिकाओं को सामान्यीकृत किया जाता है, जो डेटा को अतिरिक्त तालिकाओं में विभाजित करता है।
21) स्टार और स्नोफ्लेक स्कीमा के बीच अंतर
तारा | स्नोफ्लेक स्कीमा |
आयाम पदानुक्रम को आयामी तालिका में संग्रहीत किया जाता है। | प्रत्येक पदानुक्रम को अलग-अलग तालिकाओं में संग्रहीत किया जाता है। |
डेटा अतिरेक की संभावना अधिक है | डेटा अतिरेक की संभावना कम है। |
यह एक बहुत ही सरल DB डिजाइन है | इसमें एक जटिल डीबी डिज़ाइन है |
घन प्रसंस्करण के लिए एक तेज़ तरीका प्रदान करें | जटिल जुड़ाव के कारण घन प्रसंस्करण धीमा है। |
22) Hadoop द्वारा वितरित फ़ाइल सिस्टम की व्याख्या करें
Hadoop S3, HFTP FS, FS और HDFS जैसी स्केलेबल वितरित फ़ाइल सिस्टम के साथ काम करता है। Hadoop डिस्ट्रीब्यूटेड फाइल सिस्टम Google फाइल सिस्टम पर बना है। यह फाइल सिस्टम इस तरह से बनाया गया है कि यह कंप्यूटर सिस्टम के बड़े क्लस्टर पर आसानी से चल सकता है।
२३) एक डाटा इंजीनियर की मुख्य जिम्मेदारियों को समझाइए
डेटा इंजीनियरों की कई जिम्मेदारियां होती हैं। वे डेटा की स्रोत प्रणाली का प्रबंधन करते हैं। डेटा इंजीनियर जटिल डेटा संरचना को सरल बनाते हैं और डेटा के पुनर्विकास को रोकते हैं। कई बार वे ईएलटी और डेटा परिवर्तन भी प्रदान करते हैं।
24) YARN का पूर्ण रूप क्या है?
YARN का पूर्ण रूप अभी तक एक और संसाधन वार्ताकार है।
25) Hadoop में विभिन्न मोड्स को सूचीबद्ध करें
Hadoop में मोड 1) स्टैंडअलोन मोड 2) स्यूडो वितरित मोड 3) पूरी तरह से वितरित मोड हैं।
26) Hadoop में सुरक्षा कैसे प्राप्त करें?
Hadoop में सुरक्षा प्राप्त करने के लिए निम्न चरणों का पालन करें:
1) पहला कदम क्लाइंट के प्रमाणीकरण चैनल को सर्वर पर सुरक्षित करना है। क्लाइंट को समय-स्टांप प्रदान करें।
2) दूसरे चरण में, ग्राहक सेवा टिकट के लिए TGS का अनुरोध करने के लिए प्राप्त समय-मुद्रांकित का उपयोग करता है।
3) अंतिम चरण में, ग्राहक एक विशिष्ट सर्वर के लिए स्व-प्रमाणीकरण के लिए सेवा टिकट का उपयोग करता है।
27) हडोप में दिल की धड़कन क्या है?
Hadoop में, NameNode और DataNode एक दूसरे के साथ संवाद करते हैं। हार्टबीट एक नियमित आधार पर DataNode द्वारा NameNode को भेजे गए सिग्नल को अपनी उपस्थिति दिखाने के लिए है।
२) हासडॉप में NAS और DAS के बीच भेद
नैस | दास |
बाइट में भंडारण क्षमता 10 9 से 10 12 है। | बाइट में भंडारण क्षमता 10 9 है। |
प्रति जीबी प्रबंधन लागत मध्यम है। | प्रति जीबी प्रबंधन लागत अधिक है। |
ईथरनेट या टीसीपी / आईपी का उपयोग कर डेटा संचारित करें। | आईडीई / एससीएसआई का उपयोग कर डेटा संचारित करें |
29) डेटा इंजीनियर द्वारा उपयोग किए जाने वाले महत्वपूर्ण क्षेत्रों या भाषाओं की सूची बनाएं
डेटा इंजीनियर द्वारा उपयोग किए जाने वाले कुछ क्षेत्र या भाषाएं यहां दी गई हैं:
- संभाव्यता और साथ ही रैखिक बीजगणित
- मशीन लर्निंग
- प्रवृत्ति विश्लेषण और प्रतिगमन
- Hive QL और SQL डेटाबेस
30) बिग डेटा क्या है?
यह संरचित और असंरचित डेटा की एक बड़ी मात्रा है, जिसे पारंपरिक डेटा संग्रहण विधियों द्वारा आसानी से संसाधित नहीं किया जा सकता है। डेटा इंजीनियर बड़े डेटा को प्रबंधित करने के लिए Hadoop का उपयोग कर रहे हैं।
31) फीफो शेड्यूलिंग क्या है?
यह एक Hadoop जॉब शेड्यूलिंग एल्गोरिदम है। इस FIFO शेड्यूलिंग में, एक रिपोर्टर एक काम कतार से नौकरियों का चयन करता है, जो सबसे पुराना काम है।
32) हडोपॉप में टास्क ट्रैकर, NameNode, और जॉब ट्रैकर चलाने पर डिफॉल्ट पोर्ट नंबरों का उल्लेख करें
डिफ़ॉल्ट पोर्ट संख्या जिस पर कार्य ट्रैकर, NameNode, और Hadoop में चलने वाला जॉब ट्रैकर निम्नानुसार हैं:
- टास्क ट्रैकर 50060 पोर्ट पर चलता है
- NameNode 50070 पोर्ट पर चलता है
- जॉब ट्रैकर 50030 पोर्ट पर चलता है
33) HDFS डाटा नोड पर ब्लॉक स्कैनर को कैसे निष्क्रिय करें
HDFS डेटा नोड पर ब्लॉक स्कैनर को अक्षम करने के लिए, dfs.datanode.scan.period.hours को 0 पर सेट करें।
34) Hadoop में दो नोड्स के बीच की दूरी को कैसे परिभाषित करें?
दूरी निकटतम नोड्स की दूरी के योग के बराबर है। दो नोड्स के बीच की दूरी की गणना करने के लिए विधि getDistance () का उपयोग किया जाता है।
35) Hadoop में कमोडिटी हार्डवेयर का उपयोग क्यों करें?
कमोडिटी हार्डवेयर प्राप्त करना आसान और सस्ती है। यह एक ऐसी प्रणाली है जो विंडोज, एमएस-डॉस या लिनक्स के साथ संगत है।
36) एचडीएफएस में प्रतिकृति कारक को परिभाषित करें
प्रतिकृति कारक सिस्टम में किसी फ़ाइल की कुल प्रतिकृतियों की संख्या है।
37) NameNode में कौन सा डेटा संग्रहीत है?
नामेनोड एचडीएफएस के लिए मेटाडेटा को ब्लॉक जानकारी, और नेमस्पेस जानकारी जैसे स्टोर करता है।
38) रैक जागरूकता से आपका क्या अभिप्राय है?
Haddop क्लस्टर में, नामेनोड किसी भी फ़ाइल को पढ़ने या लिखते समय नेटवर्क ट्रैफ़िक को बेहतर बनाने के लिए डेटानोड का उपयोग करता है जो अनुरोध पढ़ने या लिखने के लिए पास के रैक के करीब है। Namenode रैक डेटा की जानकारी प्राप्त करने के लिए प्रत्येक DataNode की रैक आईडी रखता है। इस अवधारणा को Hadoop में रैक जागरूकता के रूप में कहा जाता है।
39) द्वितीयक नाम के कार्य क्या हैं?
माध्यमिक NameNode के कार्य निम्नलिखित हैं:
- FsImage जो EditLog और FsImage फ़ाइल की एक प्रति संग्रहीत करता है।
- NameNode क्रैश: NameNode क्रैश होने पर, NameNode को फिर से बनाने के लिए द्वितीयक NameNode के FsImage का उपयोग किया जा सकता है।
- चेकपॉइंट: यह एचडीएफसी में भ्रष्ट नहीं होने की पुष्टि करने के लिए माध्यमिक नेमोडेशन द्वारा उपयोग किया जाता है।
- अद्यतन: यह स्वचालित रूप से EditLog और FsImage फ़ाइल को अद्यतन करता है। यह माध्यमिक NameNode पर FsImage फ़ाइल को अपडेट रखने में मदद करता है।
40) क्या होता है जब NameNode डाउन होता है, और उपयोगकर्ता एक नई नौकरी जमा करता है?
NameNode Hadoop में विफलता का एकल बिंदु है, इसलिए उपयोगकर्ता नई नौकरी प्रस्तुत नहीं कर सकता है। यदि NameNode डाउन है, तो नौकरी विफल हो सकती है, इस वजह से उपयोगकर्ता को किसी भी नौकरी को चलाने से पहले NameNode को फिर से शुरू करने की प्रतीक्षा करनी होगी।
41) Hadoop में reducer के मूल चरण क्या हैं?
Hadoop में एक reducer के तीन बुनियादी चरण हैं:
1. घसीटना: यहाँ, Reducer Mapper से उत्पादन की प्रतिलिपि बनाता है।
2. सॉर्ट करें: सॉर्ट में, Hadoop उसी कुंजी का उपयोग करके Reducer के इनपुट को सॉर्ट करता है।
3. कम करें: इस चरण में डेटा को अंतिम आउटपुट में समेकित करने के लिए एक कुंजी से जुड़े आउटपुट मान कम हो जाते हैं।
42) हडॉप कॉन्सेप्ट ऑब्जेक्ट का उपयोग क्यों करता है?
शेष प्रणाली के साथ बातचीत करने के लिए हैडोप फ्रेमवर्क मैपर वर्ग के साथ संदर्भ वस्तु का उपयोग करता है। प्रसंग वस्तु को इसके कंस्ट्रक्टर में सिस्टम कॉन्फ़िगरेशन विवरण और कार्य मिलता है।
हम सेटअप (), सफाई () और मानचित्र () विधियों में जानकारी पारित करने के लिए संदर्भ वस्तु का उपयोग करते हैं। यह ऑब्जेक्ट मैप संचालन के दौरान महत्वपूर्ण जानकारी उपलब्ध कराता है।
43) हाडोप में कंबाइन को परिभाषित करें
यह मैप और रिड्यूस के बीच एक वैकल्पिक कदम है। कंबाइन मैप फ़ंक्शन से आउटपुट लेता है, महत्वपूर्ण मूल्य जोड़े बनाता है, और Hadoop Reducer को सबमिट करता है। कंबाइनर का कार्य मानचित्र से अंतिम परिणाम को सारांश कुंजी में समरूप कुंजी के साथ सारांशित करना है।
44) एचडीएफएस में उपलब्ध डिफ़ॉल्ट प्रतिकृति कारक क्या है जो यह इंगित करता है?
HDFS में उपलब्ध डिफ़ॉल्ट प्रतिकृति कारक तीन है। डिफ़ॉल्ट प्रतिकृति कारक इंगित करता है कि प्रत्येक डेटा के तीन प्रतिकृतियां होंगी।
४५) Hadoop में Data Locality का क्या मतलब है?
बिग डेटा सिस्टम में, डेटा का आकार बहुत बड़ा है, और यही कारण है कि नेटवर्क भर में डेटा स्थानांतरित करने का कोई मतलब नहीं है। अब, Hadoop कम्प्यूटेशन को डेटा के करीब ले जाने की कोशिश करता है। इस तरह, डेटा संग्रहीत स्थान पर स्थानीय रहता है।
46) एचडीएफएस में बैलेंसर को परिभाषित करें
एचडीएफएस में, बैलेंसर एक प्रशासनिक प्रशासक है जिसका उपयोग डेटानोड्स में डेटा को रिबैलेंस करने के लिए किया जाता है और ब्लॉक से अतिसूक्ष्म नोड्स तक ले जाता है।
47) एचडीएफएस में सुरक्षित मोड की व्याख्या करें
यह क्लस्टर में NameNode का केवल-पढ़ने के लिए मोड है। प्रारंभ में, NameNode Safemode में है। यह Safemode में फाइल-सिस्टम पर लिखने से रोकता है। इस समय, यह सभी DataNodes से डेटा और आंकड़े एकत्र करता है।
४ is) अपाचे हडोप में वितरित कैश का क्या महत्व है?
Hadoop में एक उपयोगी यूटिलिटी फीचर तथाकथित डिस्ट्रीब्यूटेड कैश है जो अनुप्रयोगों द्वारा उपयोग की जाने वाली फाइलों को कैशिंग करके नौकरियों के प्रदर्शन में सुधार करता है। एक एप्लिकेशन JobConf कॉन्फ़िगरेशन का उपयोग करके कैश के लिए एक फ़ाइल निर्दिष्ट कर सकता है।
Hadoop फ्रेमवर्क इन फाइलों की प्रतिकृति को नोड्स बनाता है जिसे किसी कार्य को निष्पादित करना होता है। यह कार्य शुरू होने से पहले किया जाता है। वितरित कैश केवल पढ़ने के साथ-साथ ज़िप और जर्स फ़ाइलों के वितरण का समर्थन करता है।
49) हाइव में मेटास्टोर क्या है?
यह स्कीमा के साथ-साथ हाइव तालिका स्थान को संग्रहीत करता है।
हाइव टेबल को परिभाषित करता है, मैपिंग, और मेटाडाटा जो मेटास्टोर में संग्रहीत होते हैं। यह JPOX द्वारा समर्थित RDBMS में संग्रहीत किया जा सकता है।
50) हाइव में सर्ड का क्या मतलब है?
SerDe Serializer या Deserializer का संक्षिप्त नाम है। हाइव में, सर्ड टेबल से डेटा को पढ़ने और किसी भी प्रारूप में किसी विशिष्ट क्षेत्र में लिखने की अनुमति देता है जो आप चाहते हैं।
51) सूची के घटक हाइव डेटा मॉडल में उपलब्ध हैं
हाइव डेटा मॉडल में निम्नलिखित घटक हैं:
- टेबल
- विभाजन
- बाल्टी
५२) Hadoop Eco-system में Hive के उपयोग की व्याख्या करें।
Hive, Hadoop Eco-system में संग्रहीत डेटा को प्रबंधित करने के लिए एक इंटरफ़ेस प्रदान करता है। Hive का उपयोग HBase टेबल के साथ मैपिंग और काम करने के लिए किया जाता है। Hive क्वेरीज MapReduce जॉब बनाने और चलाने से जुड़ी जटिलता को छिपाने के लिए MapReduce जॉब्स में बदल जाती हैं।
53) सूची में विभिन्न जटिल डेटा प्रकार / संग्रह हाइव द्वारा समर्थित हैं
हाइव निम्नलिखित जटिल डेटा प्रकारों का समर्थन करता है:
- नक्शा
- struct
- सरणी
- संघ
54) हाइव में .hiverc फ़ाइल का उपयोग कैसे करें?
हाइव में, .hiverc इनिशियलाइज़ेशन फ़ाइल है। जब हम हाइव के लिए कमांड लाइन इंटरफेस (सीएलआई) शुरू करते हैं तो यह फाइल शुरू में लोड होती है। हम .hiverc फ़ाइल में पैरामीटर के प्रारंभिक मान सेट कर सकते हैं।
५५) क्या एक डेटा फ़ाइल के लिए हाइव में एक से अधिक टेबल बनाना संभव है?
हां, हम डेटा फ़ाइल के लिए एक से अधिक तालिका स्कीमा बना सकते हैं। Hive, Hive Metastore में स्कीमा बचाता है। इस स्कीमा के आधार पर, हम एक ही डेटा से भिन्न परिणाम प्राप्त कर सकते हैं।
56) हाइव में उपलब्ध विभिन्न सर्ड कार्यान्वयनों की व्याख्या करें
हाइव में कई सर्डे कार्यान्वयन उपलब्ध हैं। आप अपना स्वयं का कस्टम सर्ड कार्यान्वयन भी लिख सकते हैं। निम्नलिखित कुछ प्रसिद्ध सर्ड कार्यान्वयन हैं:
- OpenCSVSerde
- RegexSerDe
- DelimitedJSONSerDe
- ByteStreamTypedSerDe
57) सूची तालिका निर्माण कार्य हाइव में उपलब्ध है
निम्नलिखित तालिका निर्माण कार्यों की एक सूची है:
- विस्फोट (सरणी)
- JSON_tuple ()
- ढेर()
- विस्फोट (नक्शा)
58) हाइव में एक तिरछा टेबल क्या है?
एक तिरछी तालिका एक तालिका है जिसमें स्तंभ मान अधिक बार होते हैं। हाइव में, जब हम निर्माण के दौरान एक तालिका को SKEWED के रूप में निर्दिष्ट करते हैं, तो तिरछे मान अलग-अलग फ़ाइलों में लिखे जाते हैं, और शेष मान दूसरी फ़ाइल में जाते हैं।
59) MySQL में स्टेटमेंट बनाकर बनाए गए ऑब्जेक्ट्स को सूचीबद्ध करें।
MySQL में create statement द्वारा बनाई गई वस्तुएँ इस प्रकार हैं:
- डेटाबेस
- सूची
- टेबल
- उपयोगकर्ता
- प्रक्रिया
- उत्प्रेरक
- प्रतिस्पर्धा
- राय
- समारोह
60) MySQL में डेटाबेस स्ट्रक्चर कैसे देखें?
MySQL में डेटाबेस संरचना देखने के लिए, आप उपयोग कर सकते हैं
DESCRIBE कमांड। इस कमांड का सिंटैक्स DESCRIBE टेबल नाम है ;;
61) MySQL टेबल कॉलम में एक विशिष्ट स्ट्रिंग की खोज कैसे करें?
MySQL कॉलम में स्ट्रिंग की खोज करने के लिए regex ऑपरेटर का उपयोग करें। यहां, हम विभिन्न प्रकार की नियमित अभिव्यक्ति को परिभाषित कर सकते हैं और रेगेक्स का उपयोग कर सकते हैं।
62) बताएं कि डेटा एनालिटिक्स और बड़ा डेटा कंपनी के राजस्व को कैसे बढ़ा सकते हैं?
डेटा विश्लेषण और बड़े डेटा कंपनी राजस्व में वृद्धि कर सकते हैं कि कैसे तरीके हैं:
- व्यवसाय के विकास को सुनिश्चित करने के लिए कुशलता से डेटा का उपयोग करें।
- ग्राहक मूल्य बढ़ाएँ।
- स्टाफिंग स्तर के पूर्वानुमान को बेहतर बनाने के लिए विश्लेषणात्मक की ओर मुड़ना।
- संगठनों की उत्पादन लागत में कटौती।