ETL क्या है?
ETL एक्सट्रैक्ट, ट्रांसफॉर्म और लोड का संक्षिप्त नाम है। इस प्रक्रिया में, एक ईटीएल उपकरण विभिन्न आरडीबीएमएस स्रोत प्रणालियों से डेटा को निकालता है और फिर डेटा को गणनाओं, निष्कर्षों आदि को लागू करने में बदल देता है और फिर डेटा को डेटा वेयरहाउस सिस्टम में लोड करता है।
ईटीएल में डेटा स्रोत से लक्ष्य तक प्रवाहित होता है। ETL प्रक्रिया में परिवर्तन इंजन किसी भी डेटा परिवर्तन का ख्याल रखता है।
ईएलटी क्या है?
डेटा आंदोलन के लिए टूल दृष्टिकोण को देखने के लिए ELT एक अलग विधि है। डेटा को लिखने से पहले उसे बदलने के बजाय, ELT लक्ष्य प्रणाली को परिवर्तन करने की अनुमति देता है। डेटा पहले लक्ष्य पर कॉपी किया गया और फिर जगह में बदल गया।
ELT आमतौर पर Hadoop क्लस्टर, डेटा उपकरण या क्लाउड इंस्टॉलेशन जैसे No-Sql डेटाबेस के साथ उपयोग किया जाता है।
कुंजी प्रसार
- ETL का मतलब एक्सट्रैक्ट, ट्रांसफॉर्म और लोड होता है जबकि ELT का मतलब एक्सट्रैक्ट, लोड, ट्रांसफॉर्म होता है।
- ETL डेटा को पहले स्टेजिंग सर्वर में और फिर लक्ष्य प्रणाली में लोड करता है जबकि ELT डेटा को सीधे लक्ष्य प्रणाली में लोड करता है।
- ETL मॉडल का उपयोग ऑन-प्रिमाइसेस, रिलेशनल और स्ट्रक्चर्ड डेटा के लिए किया जाता है जबकि ELT का उपयोग स्केलेबल क्लाउड स्ट्रक्चर्ड और अनस्ट्रक्टेड डेटा स्रोतों के लिए किया जाता है।
- ETL मुख्य रूप से डेटा की एक छोटी राशि के लिए उपयोग किया जाता है जबकि ELT का उपयोग बड़ी मात्रा में डेटा के लिए किया जाता है।
- ETL डेटा लेक सपोर्ट प्रदान नहीं करता है जबकि ELT डेटा लेक सपोर्ट प्रदान करता है।
- ईटीएल को लागू करना आसान है जबकि ईएलटी को लागू करने और बनाए रखने के लिए आला कौशल की आवश्यकता होती है।
ईटीएल बनाम ईएलटी के बीच अंतर
ईटीएल और ईएलटी प्रक्रिया निम्नलिखित मापदंडों में भिन्न हैं:
मापदंडों | ईटीएल | ईएलटी |
---|---|---|
प्रोसेस | डेटा को स्टेजिंग सर्वर में बदल दिया जाता है और फिर डेटावेयरहाउस डीबी में स्थानांतरित कर दिया जाता है। | डेटा डेटाहाउस के DB में रहता है। |
कोड उपयोग | के लिए इस्तेमाल होता है
| उच्च मात्रा में डेटा के लिए उपयोग किया जाता है |
परिवर्तन | ETL सर्वर / स्टेजिंग एरिया में ट्रांसफॉर्मेशन किया जाता है। | लक्ष्य प्रणाली में रूपांतरण किए जाते हैं |
समय-भार | डेटा को पहले स्टेजिंग में लोड किया गया और बाद में लक्ष्य प्रणाली में लोड किया गया। गहन समय। | डेटा केवल एक बार लक्ष्य प्रणाली में लोड किया गया। और तेज। |
समय-परिवर्तन | ETL प्रक्रिया को पूरा होने के लिए परिवर्तन की प्रतीक्षा करनी होगी। जैसे-जैसे डेटा का आकार बढ़ता है, परिवर्तन का समय बढ़ता है। | ईएलटी प्रक्रिया में, गति कभी भी डेटा के आकार पर निर्भर नहीं होती है। |
समय- रखरखाव | आपको लोड करने और बदलने के लिए डेटा का चयन करने के लिए उच्च रखरखाव की आवश्यकता होती है। | डेटा के रूप में कम रखरखाव हमेशा उपलब्ध है। |
कार्यान्वयन जटिलता | एक प्रारंभिक चरण में, लागू करना आसान है। | ईएलटी प्रक्रिया को लागू करने के लिए संगठन को उपकरण और विशेषज्ञ कौशल का गहरा ज्ञान होना चाहिए। |
डेटा वेयरहाउस के लिए समर्थन | ETL मॉडल का उपयोग ऑन-प्रिमाइसेस, रिलेशनल और स्ट्रक्चर्ड डेटा के लिए किया जाता है। | स्केलेबल क्लाउड इन्फ्रास्ट्रक्चर में उपयोग किया जाता है जो संरचित, असंरचित डेटा स्रोतों का समर्थन करता है। |
डेटा लेक समर्थन | समर्थन नहीं करता। | असंरचित डेटा के साथ डेटा झील के उपयोग की अनुमति देता है। |
जटिलता | ईटीएल प्रक्रिया केवल महत्वपूर्ण डेटा को लोड करती है, जैसा कि डिजाइन के समय में पहचाना जाता है। | इस प्रक्रिया में आउटपुट-बैकवर्ड से विकास और केवल प्रासंगिक डेटा लोड करना शामिल है। |
लागत | छोटे और मध्यम व्यवसायों के लिए उच्च लागत। | सेवा प्लेटफ़ॉर्म के रूप में ऑनलाइन सॉफ़्टवेयर का उपयोग करके कम प्रवेश लागत। |
लुकअप | ईटीएल प्रक्रिया में, स्टेजिंग क्षेत्र में तथ्यों और आयाम दोनों को उपलब्ध होने की आवश्यकता होती है। | सारा डेटा उपलब्ध होगा क्योंकि एक ही एक्शन में एक्सट्रैक्ट और लोड होता है। |
एकत्रित | डेटासेट में अतिरिक्त मात्रा के साथ जटिलता बढ़ जाती है। | लक्ष्य प्लेटफ़ॉर्म की शक्ति महत्वपूर्ण मात्रा में डेटा को जल्दी से संसाधित कर सकती है। |
गणना | मौजूदा कॉलम को अधिलेखित करें या डेटासेट को जोड़ने और लक्ष्य प्लेटफ़ॉर्म पर धकेलने की आवश्यकता है। | मौजूदा तालिका में गणना किए गए कॉलम को आसानी से जोड़ें। |
परिपक्वता | इस प्रक्रिया का उपयोग दो दशकों से किया जाता है। यह अच्छी तरह से प्रलेखित है और आसानी से उपलब्ध सर्वोत्तम प्रथाओं। | अपेक्षाकृत नई अवधारणा और लागू करने के लिए जटिल। |
हार्डवेयर | अधिकांश उपकरणों में अद्वितीय हार्डवेयर आवश्यकताएं होती हैं जो महंगी होती हैं। | सास हार्डवेयर लागत एक मुद्दा नहीं है। |
असंरचित डेटा के लिए समर्थन | ज्यादातर संबंधपरक डेटा का समर्थन करता है | आसानी से उपलब्ध डेटा असंरचित के लिए समर्थन। |