फ्रेशर्स के साथ-साथ अनुभवी ईटीएल परीक्षक और डेवलपर के लिए साक्षात्कार में अक्सर प्रश्न पूछे जाते हैं।
1) ईटीएल क्या है?
डेटा वेयरहाउसिंग आर्किटेक्चर में, ईटीएल एक महत्वपूर्ण घटक है, जो किसी भी व्यावसायिक प्रक्रिया के लिए डेटा का प्रबंधन करता है। ETL का मतलब एक्सट्रैक्ट, ट्रांसफॉर्म और लोड है । एक्सट्रेक्ट एक डेटाबेस से डेटा पढ़ने की प्रक्रिया करता है। ट्रांसफ़ॉर्म डेटा को एक ऐसे प्रारूप में परिवर्तित करता है जो रिपोर्टिंग और विश्लेषण के लिए उपयुक्त हो सकता है। जबकि, लोड डेटा को लक्ष्य डेटाबेस में लिखने की प्रक्रिया करता है।
2) बताएं कि ईटीएल परीक्षण संचालन में क्या शामिल हैं?
ईटीएल परीक्षण में शामिल हैं
- सत्यापित करें कि डेटा व्यावसायिक आवश्यकताओं के अनुसार सही तरीके से बदल रहा है या नहीं
- सत्यापित करें कि अनुमानित डेटा बिना किसी छंटनी और डेटा हानि के डेटा वेयरहाउस में लोड किया गया है
- सुनिश्चित करें कि ETL एप्लिकेशन अमान्य डेटा की रिपोर्ट करता है और डिफ़ॉल्ट मानों के साथ बदलता है
- सुनिश्चित करें कि मापनीयता और प्रदर्शन को बेहतर बनाने के लिए अपेक्षित समय सीमा पर डेटा लोड होता है
3) उल्लेख करें कि डेटा वेयरहाउस एप्लिकेशन के प्रकार क्या हैं और डेटा माइनिंग और डेटा वेयरहाउसिंग में क्या अंतर है?
डेटा वेयरहाउस एप्लिकेशन के प्रकार हैं
- जानकारी प्रसंस्करण
- विश्लेषणात्मक प्रसंस्करण
- डेटा खनन
डेटा माइनिंग को बड़े डेटाबेस से छिपी भविष्य कहनेवाला जानकारी निकालने की प्रक्रिया के रूप में परिभाषित किया जा सकता है और डेटा की व्याख्या करते समय डेटा वेयरहाउसिंग डेटा की विश्लेषणात्मक प्रक्रिया के लिए एक डेटा खान का उपयोग तेजी से तरीके से कर सकता है। डेटा वेयरहाउसिंग एक सामान्य रिपॉजिटरी में कई स्रोतों से डेटा एकत्र करने की प्रक्रिया है
4) ईटीएल में उपयोग किए जाने वाले विभिन्न उपकरण क्या हैं?
- कॉग्नोस डिसीजन स्ट्रीम
- ओरेकल वेयरहाउस बिल्डर
- व्यापार वस्तुओं XI
- एसएएस व्यापार गोदाम
- SAS एंटरप्राइज ETL सर्वर
5) क्या तथ्य है? तथ्यों के प्रकार क्या हैं?
यह एक बहु-आयामी मॉडल का एक केंद्रीय घटक है जिसमें विश्लेषण किए जाने वाले उपाय शामिल हैं। तथ्य आयामों से संबंधित हैं।
तथ्यों के प्रकार हैं
- योगात्मक तथ्य
- अर्ध-योज्य तथ्य
- गैर-योज्य तथ्य
6) बताइए कि क्यूब्स और OLAP क्यूब्स क्या हैं?
क्यूब्स डेटा प्रोसेसिंग इकाइयाँ हैं जिनमें डेटा वेयरहाउस से फैक्ट टेबल और डायमेंशंस शामिल हैं। यह बहुआयामी विश्लेषण प्रदान करता है।
OLAP का अर्थ है ऑनलाइन एनालिटिक्स प्रोसेसिंग, और OLAP क्यूब बड़े डेटा को म्यूटि-आयामी रूप में रिपोर्टिंग उद्देश्यों के लिए संग्रहीत करता है। इसमें तथ्यों को आयामों द्वारा वर्गीकृत उपायों के रूप में कहा जाता है।
7) बताएं कि अनुरेखण स्तर क्या है और प्रकार क्या हैं?
अनुरेखण स्तर लॉग फ़ाइलों में संग्रहीत डेटा की मात्रा है। ट्रेसिंग स्तर को दो सामान्य और वर्बोज़ में वर्गीकृत किया जा सकता है। सामान्य स्तर अनुरेखण स्तर को विस्तृत तरीके से समझाता है जबकि क्रिया प्रत्येक और हर पंक्ति में अनुरेखण स्तरों की व्याख्या करती है।
8) बताइए कि अनाज क्या है?
अनाज तथ्य को उस स्तर के रूप में परिभाषित किया जा सकता है जिस पर तथ्य जानकारी संग्रहीत होती है। इसे Fact Granularity के नाम से भी जाना जाता है
9) स्पष्ट करें कि तथ्यहीन तथ्य स्कीमा क्या है और माप क्या है?
उपायों के बिना एक तथ्य तालिका को तथ्यहीन तथ्य तालिका के रूप में जाना जाता है। यह होने वाली घटनाओं की संख्या देख सकते हैं। उदाहरण के लिए, किसी कंपनी में कर्मचारी गणना जैसे किसी घटना को रिकॉर्ड करने के लिए इसका उपयोग किया जाता है।
एक तथ्य तालिका में स्तंभों पर आधारित संख्यात्मक डेटा को माप के रूप में जाना जाता है
१०) परिवर्तन क्या है?
परिवर्तन एक रिपॉजिटरी ऑब्जेक्ट है जो डेटा उत्पन्न, संशोधित या पारित करता है। परिवर्तन दो प्रकार के होते हैं सक्रिय और निष्क्रिय
11) लुकअप ट्रांसफॉर्मेशन के उपयोग की व्याख्या कीजिए?
लुकअप परिवर्तन के लिए उपयोगी है
- स्तंभ मान का उपयोग करके तालिका से संबंधित मान प्राप्त करना
- धीरे-धीरे बदलते आयाम तालिका को अपडेट करें
- सत्यापित करें कि क्या तालिका में रिकॉर्ड पहले से मौजूद हैं
12) समझाइए कि विभाजन क्या है, हैश विभाजन और राउंड रॉबिन विभाजन?
प्रदर्शन में सुधार करने के लिए, लेनदेन को उप विभाजित किया जाता है, इसे विभाजन कहा जाता है। विभिन्न स्रोतों के लिए कई कनेक्शन बनाने के लिए Partioning Informatica Server को सक्षम करता है
विभाजन के प्रकार हैं
राउंड-रॉबिन विभाजन:
- सूचनात्मक डेटा द्वारा सभी विभाजन के बीच समान रूप से वितरित किया जाता है
- प्रत्येक पार्टीशन में जहां प्रोसेस करने के लिए पंक्तियों की संख्या लगभग समान होती है, यह विभाजन लागू होता है
हैश विभाजन:
- विभाजनों के बीच समूह डेटा में कुंजियों को विभाजित करने के उद्देश्य से Informatica सर्वर एक हैश फ़ंक्शन लागू करता है
- इसका उपयोग तब किया जाता है जब एक ही विभाजन में एक ही विभाजन कुंजी के साथ पंक्तियों के प्रक्रिया समूहों को सुनिश्चित करने की आवश्यकता होती है
13) उल्लेख करें कि DataReader डेस्टिनेशन अडैप्टर का उपयोग करने का क्या फायदा है?
DataReader डेस्टिनेशन अडैप्टर का उपयोग करने का लाभ यह है कि यह मेमोरी में ADO रिकॉर्डर (रिकॉर्ड और कॉलम से मिलकर) को पॉप्युलेट करता है और DataReader कार्य से डेटा को हटाता है, जिससे DataReader इंटरफ़ेस लागू होता है, ताकि अन्य एप्लिकेशन डेटा का उपभोग कर सकें।
14) SSIS (SQL Server इंटीग्रेशन सर्विस) का उपयोग करके टेबल को अपडेट करने के संभावित तरीके क्या हैं?
SSIS के उपयोग से तालिका को अद्यतन करने के लिए संभावित तरीके हैं:
- SQL कमांड का उपयोग करें
- मंचन तालिका का उपयोग करें
- कैश का उपयोग करें
- स्क्रिप्ट टास्क का उपयोग करें
- यदि MSSQL का उपयोग किया जाता है, तो अद्यतन करने के लिए पूर्ण डेटाबेस नाम का उपयोग करें
15) यदि आपके पास गैर- OLEDB (ऑब्जेक्ट लिंकिंग और एंबेडिंग डेटाबेस) स्रोत है तो आप क्या करेंगे?
यदि आपके पास लुकअप के लिए गैर- OLEBD स्रोत है तो आपको डेटा लोड करने के लिए कैश का उपयोग करना होगा और इसे स्रोत के रूप में उपयोग करना होगा
16) किस मामले में आप जुड़े और असंबद्ध परिवर्तनों में गतिशील कैश और स्थिर कैश का उपयोग करते हैं?
- डायनेमिक कैश का उपयोग तब किया जाता है जब आपको मास्टर टेबल और धीरे-धीरे बदलते आयाम (SCD) टाइप 1 को अपडेट करना होता है
- फ्लैट फ़ाइलों के लिए स्टेटिक कैश का उपयोग किया जाता है
17) बताएं कि असंबद्ध और कनेक्टेड लुकअप के बीच क्या अंतर हैं?
जुड़ा हुआ लुकअप |
असंबद्ध लुकअप |
|
- इसका उपयोग तब किया जाता है जब मैपिंग करते समय अभिव्यक्ति परिवर्तन के बजाय लुकअप फ़ंक्शन का उपयोग किया जाता है |
|
- केवल एक आउटपुट पोर्ट लौटाता है |
|
|
|
|
|
|
|
|
१) डेटा स्रोत दृश्य क्या है?
डेटा स्रोत दृश्य रिलेशनल स्कीमा को परिभाषित करने की अनुमति देता है जिसका उपयोग विश्लेषण सेवाओं के डेटाबेस में किया जाएगा। डेटा स्रोत वस्तुओं से सीधे होने के बजाय, डेटा स्रोत दृश्य से आयाम और क्यूब्स बनाए जाते हैं।
19) बताइए कि OLAP टूल्स और ETL टूल्स में क्या अंतर है?
ETL और OLAP टूल के बीच अंतर यह है कि
ईटीएल उपकरण विरासत प्रणालियों से डेटा की निकासी के लिए है और डेटा को साफ करने की कुछ प्रक्रिया के साथ निर्दिष्ट डेटा बेस में लोड होता है।
उदाहरण: डेटा स्टेज, इंफॉर्मेटिका आदि।
जबकि OLAP बहु-दिशात्मक मॉडल में उपलब्ध OLAP डेटा में रिपोर्टिंग उद्देश्य के लिए है।
उदाहरण: व्यावसायिक वस्तुएँ, कॉग्नोस आदि।
20) कैसे आप Informatica का उपयोग कर SAP डेटा निकाल सकते हैं?
- पावर कनेक्ट विकल्प के साथ आप सूचनात्मक का उपयोग करके एसएपी डेटा निकालते हैं
- PowerConnect टूल को इंस्टॉल और कॉन्फ़िगर करें
- स्रोत विश्लेषक में स्रोत आयात करें। Informatica और SAP पॉवरकनेक्ट के बीच एक गैटवे के रूप में कार्य करता है। अगला कदम मैपिंग के लिए ABAP कोड जनरेट करना है, उसके बाद ही Informatica SAP से डेटा खींच सकता है
- बाहरी सिस्टम से स्रोतों को जोड़ने और आयात करने के लिए पावर कनेक्ट का उपयोग किया जाता है
21) पावर मार्ट और पावर सेंटर के बीच अंतर क्या है?
पावर सेंटर |
पावर मार्ट |
|
|
|
|
|
|
|
|
२२) बताइए कि मंचन क्षेत्र क्या है और मंचन क्षेत्र का उद्देश्य क्या है?
डेटा स्टेजिंग एक ऐसा क्षेत्र है जहां आप डेटा को डेटा वेयरहाउस सर्वर पर अस्थायी रूप से रखते हैं। डेटा स्टेजिंग में निम्नलिखित चरण शामिल हैं
- स्रोत डेटा निष्कर्षण और डेटा परिवर्तन (पुनर्गठन)
- डेटा परिवर्तन (डेटा सफाई, मूल्य परिवर्तन)
- सरोगेट कुंजी असाइनमेंट
२३) बस स्कीमा क्या है?
सामान्य आयामों की पहचान करने के लिए विभिन्न व्यावसायिक प्रक्रिया के लिए, बस स्कीमा का उपयोग किया जाता है। यह जानकारी के मानकीकृत परिभाषा के साथ एक अनुरूप आयाम के साथ आता है
24) बताइए कि डेटा पर्जिंग क्या है?
डेटा शुद्धिकरण डेटा वेयरहाउस से डेटा हटाने की एक प्रक्रिया है। यह जंक डेटा की पंक्तियों को शून्य मान या अतिरिक्त रिक्त स्थान के साथ हटा देता है।
२५) स्कीमा ऑब्जेक्ट्स क्या हैं?
स्कीमा ऑब्जेक्ट तार्किक संरचना है जो सीधे डेटाबेस डेटा को संदर्भित करता है। स्कीमा ऑब्जेक्ट्स में टेबल, व्यू, सीक्वेंस पर्यायवाची, इंडेक्स, क्लस्टर, फ़ंक्शंस पैकेज और डेटाबेस लिंक शामिल हैं
26) इन शब्दों को समझाइए सत्र, कार्यपत्रक, मैपलेट और वर्कफ़्लो?
- मैपलेट: यह परिवर्तन के सेट की व्यवस्था करता है या बनाता है
- वर्कलेट: यह दिए गए कार्यों के एक विशिष्ट सेट का प्रतिनिधित्व करता है
- वर्कफ़्लो: यह निर्देशों का एक सेट है जो सर्वर को कार्यों को निष्पादित करने का तरीका बताता है
- सत्र: यह मापदंडों का एक सेट है जो सर्वर को लक्ष्य से स्रोतों को डेटा स्थानांतरित करने का तरीका बताता है
नि: शुल्क पीडीएफ डाउनलोड: ETL परीक्षण साक्षात्कार प्रश्न और उत्तर