डेटा वेयरहाउस आर्किटेक्चर, कॉन्सेप्ट और कंपोनेंट्स

विषय - सूची:

Anonim

डेटा वेयरहाउस अवधारणाओं

डेटा वेयरहाउस की मूल अवधारणा निर्णय लेने और पूर्वानुमान के लिए कंपनी के लिए सत्य के एकल संस्करण की सुविधा प्रदान करना है। डेटा वेयरहाउस एक सूचना प्रणाली है जिसमें एकल या कई स्रोतों से ऐतिहासिक और कम्यूटेटिव डेटा होता है। डाटा वेयरहाउस संगठनों की रिपोर्टिंग और विश्लेषण प्रक्रिया को सरल बनाता है।

डेटा वेयरहाउस की विशेषताएँ

डेटा वेयरहाउस अवधारणाओं में निम्नलिखित विशेषताएं हैं:

  • विषय उन्मुख
  • को एकीकृत
  • समयांतर
  • गैर वाष्पशील

विषय उन्मुख

एक डेटा वेयरहाउस विषय के रूप में उन्मुख है क्योंकि यह कंपनियों के चल रहे संचालन के बजाय एक विषय के बारे में जानकारी प्रदान करता है। ये विषय बिक्री, विपणन, वितरण आदि हो सकते हैं।

एक डेटा वेयरहाउस कभी भी चालू कार्रवाई पर ध्यान केंद्रित नहीं करता है। इसके बजाय, इसने निर्णय लेने के लिए मॉडलिंग और डेटा के विश्लेषण पर जोर दिया । यह डेटा को छोड़कर विशिष्ट विषय के आसपास एक सरल और संक्षिप्त दृश्य प्रदान करता है जो निर्णय प्रक्रिया का समर्थन करने के लिए सहायक नहीं है।

को एकीकृत

डेटा वेयरहाउस में, एकीकरण का अर्थ है, असमान डेटाबेस से सभी समान डेटा के लिए माप की एक सामान्य इकाई की स्थापना। डेटा को डेटावेयरहाउस में आम और सार्वभौमिक रूप से स्वीकार्य तरीके से संग्रहीत करने की आवश्यकता है।

एक डेटा वेयरहाउस को विभिन्न स्रोतों जैसे मेनफ्रेम, रिलेशनल डेटाबेस, फ्लैट फाइल आदि से डेटा को एकीकृत करके विकसित किया जाता है। इसके अलावा, इसे लगातार नामकरण परंपराओं, प्रारूप और कोडिंग को रखना चाहिए।

यह एकीकरण डेटा के प्रभावी विश्लेषण में मदद करता है। नामकरण सम्मेलनों, विशेषता उपायों, एन्कोडिंग संरचना आदि में स्थिरता सुनिश्चित की जानी चाहिए। निम्नलिखित उदाहरण पर विचार करें:

उपरोक्त उदाहरण में, ए, बी और सी लेबल वाले तीन अलग-अलग अनुप्रयोग हैं। इन अनुप्रयोगों में संग्रहीत जानकारी लिंग, तिथि और शेष हैं। हालाँकि, प्रत्येक एप्लिकेशन के डेटा को अलग तरीके से संग्रहीत किया जाता है।

  • अनुप्रयोग में एक लिंग क्षेत्र तार्किक या एम या एफ जैसे तार्किक मूल्यों को संग्रहीत करता है
  • अनुप्रयोग बी लिंग क्षेत्र में एक संख्यात्मक मान है,
  • अनुप्रयोग C अनुप्रयोग में, लिंग फ़ील्ड को वर्ण मान के रूप में संग्रहीत किया जाता है।
  • वही डेट और बैलेंस के मामले में है

हालांकि, परिवर्तन और सफाई प्रक्रिया के बाद यह सभी डेटा डेटा वेयरहाउस में सामान्य प्रारूप में संग्रहीत किया जाता है।

समयांतर

परिचालन प्रणालियों की तुलना में डेटा वेयरहाउस के लिए समय क्षितिज काफी व्यापक है। डेटा वेयरहाउस में एकत्रित डेटा को एक विशेष अवधि के साथ पहचाना जाता है और ऐतिहासिक दृष्टिकोण से जानकारी प्रदान करता है। इसमें स्पष्ट रूप से या अंतर्निहित रूप से समय का एक तत्व होता है।

एक ऐसी जगह जहां डेटावेयरहाउस डेटा समय विचरण रिकॉर्ड कुंजी की संरचना में है। DW के पास मौजूद प्रत्येक प्राथमिक कुंजी में या तो निहित या स्पष्ट रूप से एक तत्व होना चाहिए। जैसे दिन, सप्ताह का महीना आदि।

समय विचरण का दूसरा पहलू यह है कि एक बार गोदाम में डेटा डालने के बाद उसे अपडेट या बदला नहीं जा सकता है।

गैर वाष्पशील

डेटा वेयरहाउस भी गैर-वाष्पशील होता है, जब नया डेटा इसमें डाला जाता है तो पिछला डेटा मिटाया नहीं जाता है।

डेटा केवल-पढ़ने और समय-समय पर ताज़ा किया जाता है। इससे ऐतिहासिक डेटा का विश्लेषण करने और समझने और समझने में मदद मिलती है कि क्या हुआ और कब हुआ। इसके लिए लेनदेन की प्रक्रिया, रिकवरी और कंसीडर कंट्रोल मैकेनिज्म की आवश्यकता नहीं है।

डिलीट, अपडेट और इंसर्ट जैसी गतिविधियाँ जो एक ऑपरेशनल एप्लिकेशन एनवायरमेंट में की जाती हैं, डेटा वेयरहाउस वातावरण में छोड़ दी जाती हैं। डेटा वेयरहाउसिंग में किए गए केवल दो प्रकार के डेटा ऑपरेशन हैं

  1. डेटा लोड हो रहा है
  2. डेटा प्राप्त करना

यहां, एप्लिकेशन और डेटा वेयरहाउस के बीच कुछ प्रमुख अंतर हैं

परिचालन अनुप्रयोग डेटा वेयरहाउस
यह सुनिश्चित करने के लिए जटिल प्रोग्राम को कोड किया जाना चाहिए कि डेटा अपग्रेड प्रक्रियाएं अंतिम उत्पाद की उच्च अखंडता को बनाए रखती हैं। इस तरह की समस्याएँ नहीं होती हैं क्योंकि डेटा अपडेट नहीं किया जाता है।
न्यूनतम अतिरेक सुनिश्चित करने के लिए डेटा को सामान्यीकृत रूप में रखा गया है। डेटा को सामान्यीकृत रूप में संग्रहीत नहीं किया जाता है।
लेन-देन के मुद्दों, डेटा रिकवरी, रोलबैक और रिज़ॉल्यूशन के समर्थन के लिए प्रौद्योगिकी की आवश्यकता है क्योंकि इसका गतिरोध काफी जटिल है। यह प्रौद्योगिकी में सापेक्ष सादगी प्रदान करता है।

डेटा वेयरहाउस आर्किटेक्चर

डेटा वेयरहाउस आर्किटेक्चर जटिल है क्योंकि यह एक सूचना प्रणाली है जिसमें कई स्रोतों से ऐतिहासिक और स्मारक डेटा शामिल हैं। डेटा वेयरहाउस परतों के निर्माण के लिए 3 दृष्टिकोण हैं: सिंगल टियर, टू टियर और थ्री टियर। डेटा वेयरहाउस की यह 3 स्तरीय वास्तुकला नीचे बताई गई है।

एकल स्तरीय वास्तुकला

एक परत का उद्देश्य संग्रहीत डेटा की मात्रा को कम करना है। यह लक्ष्य डेटा अतिरेक को दूर करना है। इस वास्तुकला को अक्सर अभ्यास में उपयोग नहीं किया जाता है।

दो-स्तरीय वास्तुकला

दो-परत वास्तुकला डेटा वेयरहाउस परतों में से एक है जो भौतिक रूप से उपलब्ध स्रोतों और डेटा वेयरहाउस को अलग करती है। यह आर्किटेक्चर विस्तार योग्य नहीं है और बड़ी संख्या में एंड-यूज़र्स का समर्थन भी नहीं कर रहा है। नेटवर्क सीमाओं के कारण इसमें कनेक्टिविटी समस्याएं भी हैं।

थ्री-टियर डेटा वेयरहाउस आर्किटेक्चर

यह डेटा वेयरहाउस का सबसे अधिक उपयोग किया जाने वाला आर्किटेक्चर है।

इसमें टॉप, मिडिल और बॉटम टियर शामिल हैं।

  1. बॉटम टीयर: डाटवेयरहाउस सर्वर के डेटाबेस को टियर टियर के रूप में। यह आमतौर पर एक रिलेशनल डेटाबेस सिस्टम है। डेटा को बैक-एंड टूल का उपयोग करके इस परत में साफ़, रूपांतरित और लोड किया जाता है।
  2. मिडिल टियर: डेटा वेयरहाउस में मिडिल टियर एक ओएलएपी सर्वर होता है, जिसे रोलैप या मोलैप मॉडल के उपयोग से कार्यान्वित किया जाता है। एक उपयोगकर्ता के लिए, यह एप्लिकेशन टियर डेटाबेस का सार दृश्य प्रस्तुत करता है। यह परत अंत-उपयोगकर्ता और डेटाबेस के बीच मध्यस्थ के रूप में भी काम करती है।
  3. टॉप-टियर: टॉप टियर एक फ्रंट-एंड क्लाइंट लेयर है। शीर्ष स्तरीय उपकरण और एपीआई हैं जो आप कनेक्ट करते हैं और डेटा वेयरहाउस से डेटा प्राप्त करते हैं। यह क्वेरी उपकरण, रिपोर्टिंग टूल, प्रबंधित क्वेरी टूल, विश्लेषण उपकरण और डेटा खनन उपकरण हो सकता है।

डेटावेयरहाउस घटक

हम नीचे दिए गए चित्र के रूप में डेटा वेयरहाउस और डेटा वेयरहाउस की वास्तुकला के बारे में जानेंगे:

डेटा वेयरहाउस आर्किटेक्चर

डेटा वेयरहाउस RDBMS सर्वर पर आधारित है जो एक केंद्रीय सूचना भंडार है जो संपूर्ण पर्यावरण को कार्यात्मक, प्रबंधनीय और सुलभ बनाने के लिए कुछ प्रमुख डेटा वेयरहाउसिंग घटकों से घिरा हुआ है।

मुख्य रूप से पाँच डेटा वेयरहाउस घटक हैं:

डेटा वेयरहाउस डेटाबेस

केंद्रीय डेटाबेस डेटा वेयरहाउसिंग वातावरण की नींव है। यह डेटाबेस RDBMS तकनीक पर लागू किया गया है। हालांकि, इस तरह के कार्यान्वयन को इस तथ्य से विवश किया जाता है कि पारंपरिक आरडीबीएमएस प्रणाली लेनदेन डेटाबेस प्रसंस्करण के लिए अनुकूलित है और डेटा वेयरहाउसिंग के लिए नहीं। उदाहरण के लिए, तदर्थ क्वेरी, मल्टी-टेबल जॉइन, एग्रीगेट संसाधन गहन और धीमा प्रदर्शन हैं।

इसलिए, डेटाबेस के लिए वैकल्पिक दृष्टिकोण नीचे सूचीबद्ध के रूप में उपयोग किए जाते हैं-

  • डेटावेयरहाउस में, स्केलैबिलिटी की अनुमति देने के लिए रिलेशनल डेटाबेस समानांतर में तैनात किए जाते हैं। समानांतर रिलेशनल डेटाबेस विभिन्न मल्टीप्रोसेसर कॉन्फ़िगरेशन या बड़े पैमाने पर समानांतर प्रोसेसर पर साझा मेमोरी या साझा किए गए कुछ भी मॉडल की अनुमति नहीं देते हैं।
  • नए सूचकांक संरचनाओं का उपयोग रिलेशनल टेबल स्कैन को बायपास करने और गति में सुधार करने के लिए किया जाता है।
  • संबंधपरक डेटा वेयरहाउस मॉडल के कारण रखी गई किसी भी सीमा को पार करने के लिए बहुआयामी डेटाबेस (MDDBs) का उपयोग। उदाहरण: ओरेकल से एस्बेस।

सोर्सिंग, अधिग्रहण, सफाई और परिवर्तन उपकरण (ETL)

डेटा सोर्सिंग, ट्रांसफ़ॉर्मेशन और माइग्रेशन टूल सभी रूपांतरणों, सारांशों और डेटा को डेटावेयर में एकीकृत प्रारूप में बदलने के लिए आवश्यक सभी परिवर्तनों का उपयोग करने के लिए उपयोग किए जाते हैं। उन्हें एक्सट्रैक्ट, ट्रांसफॉर्म और लोड (ETL) टूल भी कहा जाता है।

उनकी कार्यक्षमता में शामिल हैं:

  • नियामक शर्तों के अनुसार डेटा को बेनामी।
  • संचालन डेटाबेस में अवांछित डेटा को हटाकर डेटा वेयरहाउस में लोड करने से।
  • विभिन्न स्रोतों से आने वाले डेटा के लिए सामान्य नामों और परिभाषाओं को खोजें और बदलें।
  • सारांश और व्युत्पन्न डेटा की गणना
  • लापता डेटा के मामले में, उन्हें चूक के साथ आबाद करें।
  • कई डेटा स्रोत से आने वाले दोहराया डेटा को दोहराया गया।

ये एक्सट्रैक्ट, ट्रांसफ़ॉर्म और लोड टूल्स क्रोन जॉब्स, बैकग्राउंड जॉब्स, कोबोल प्रोग्राम्स, शेल स्क्रिप्ट्स आदि उत्पन्न कर सकते हैं, जो डेटा को डेट्रेटहाउस में नियमित रूप से अपडेट करते हैं। मेटाडेटा को बनाए रखने के लिए ये उपकरण भी सहायक हैं।

इन ईटीएल टूल्स को डेटाबेस और डेटा विविधता की चुनौतियों से निपटना होगा।

मेटाडाटा

मेटा डेटा नाम कुछ उच्च-स्तरीय तकनीकी डेटा वेयरहाउसिंग अवधारणाओं का सुझाव देता है। हालांकि, यह काफी सरल है। मेटाडेटा डेटा के बारे में डेटा है जो डेटा वेयरहाउस को परिभाषित करता है। इसका उपयोग डेटा वेयरहाउस के निर्माण, रखरखाव और प्रबंधन के लिए किया जाता है।

डेटा वेयरहाउस आर्किटेक्चर में, मेटा-डेटा एक महत्वपूर्ण भूमिका निभाता है क्योंकि यह डेटा वेयरहाउस डेटा के स्रोत, उपयोग, मूल्यों और विशेषताओं को निर्दिष्ट करता है। यह भी परिभाषित करता है कि डेटा को कैसे बदला और संसाधित किया जा सकता है। यह डेटा वेयरहाउस से निकटता से जुड़ा हुआ है।

उदाहरण के लिए, बिक्री डेटाबेस में एक पंक्ति शामिल हो सकती है:

4030 KJ732 299.90

यह एक अर्थहीन डेटा है जब तक हम मेटा से परामर्श करते हैं कि हमें बताएं कि यह था

  • मॉडल संख्या: 4030
  • बिक्री एजेंट आईडी: KJ732
  • $ 299.90 की कुल बिक्री राशि

इसलिए, मेटा डेटा डेटा के ज्ञान में परिवर्तन के लिए आवश्यक तत्व हैं।

मेटाडेटा निम्नलिखित सवालों के जवाब देने में मदद करता है

  • डेटा वेयरहाउस में क्या तालिकाएँ, विशेषताएँ और कुंजियाँ हैं?
  • डेटा कहां से आया?
  • डेटा कितनी बार पुनः लोड किया जाता है?
  • सफाई के साथ क्या परिवर्तन लागू किए गए थे?

मेटाडेटा को निम्न श्रेणियों में वर्गीकृत किया जा सकता है:

  1. तकनीकी मेटा डेटा : इस तरह के मेटाडेटा में वेयरहाउस के बारे में जानकारी होती है जो डेटा वेयरहाउस डिजाइनरों और प्रशासकों द्वारा उपयोग की जाती है।
  2. बिजनेस मेटा डेटा: इस तरह के मेटाडेटा में विस्तार होता है जो एंड-यूजर्स को डेटा वेयरहाउस में संग्रहीत जानकारी को समझने का एक आसान तरीका देता है।

क्वेरी उपकरण

डेटा वेयरहाउसिंग की प्राथमिक वस्तुओं में से एक रणनीतिक निर्णय लेने के लिए व्यवसायों को जानकारी प्रदान करना है। क्वेरी उपकरण उपयोगकर्ताओं को डेटा वेयरहाउस सिस्टम के साथ सहभागिता करने की अनुमति देते हैं।

ये उपकरण चार विभिन्न श्रेणियों में आते हैं:

  1. क्वेरी और रिपोर्टिंग उपकरण
  2. अनुप्रयोग विकास उपकरण
  3. डेटा खनन उपकरण
  4. OLAP उपकरण

1. क्वेरी और रिपोर्टिंग उपकरण:

क्वेरी और रिपोर्टिंग टूल को आगे विभाजित किया जा सकता है

  • रिपोर्टिंग उपकरण
  • प्रबंधित उपकरण

रिपोर्टिंग उपकरण:

रिपोर्टिंग टूल को प्रोडक्शन रिपोर्टिंग टूल और डेस्कटॉप रिपोर्ट राइटर में और विभाजित किया जा सकता है।

  1. रिपोर्ट लेखक: इस तरह के रिपोर्टिंग टूल उनके विश्लेषण के लिए अंतिम उपयोगकर्ताओं के लिए डिज़ाइन किए गए उपकरण हैं।
  2. उत्पादन रिपोर्टिंग: इस तरह के उपकरण संगठनों को नियमित परिचालन रिपोर्ट उत्पन्न करने की अनुमति देते हैं। यह मुद्रण और गणना जैसी उच्च मात्रा बैच नौकरियों का भी समर्थन करता है। कुछ लोकप्रिय रिपोर्टिंग उपकरण ब्रियो, बिजनेस ऑब्जेक्ट्स, ओरेकल, पावरसॉफ्ट, एसएएस इंस्टीट्यूट हैं।

प्रबंधित क्वेरी उपकरण:

इस तरह के एक्सेस टूल उपयोगकर्ताओं और डेटाबेस के बीच मेटा-लेयर डालकर डेटाबेस और एसक्यूएल और डेटाबेस संरचना में झोंपड़ियों को हल करने के लिए अंतिम उपयोगकर्ताओं की मदद करते हैं।

2. अनुप्रयोग विकास उपकरण:

कभी-कभी अंतर्निहित ग्राफ़िकल और विश्लेषणात्मक उपकरण किसी संगठन की विश्लेषणात्मक आवश्यकताओं को पूरा नहीं करते हैं। ऐसे मामलों में, कस्टम रिपोर्ट को एप्लिकेशन डेवलपमेंट टूल का उपयोग करके विकसित किया जाता है।

3. डेटा खनन उपकरण:

डेटा माइनिंग एक बड़ी राशि डेटा माइनिंग द्वारा सार्थक नए सहसंबंध, पैटन और ट्रेंड की खोज करने की एक प्रक्रिया है। इस प्रक्रिया को स्वचालित बनाने के लिए डेटा माइनिंग टूल्स का उपयोग किया जाता है।

4. OLAP उपकरण:

ये उपकरण एक बहुआयामी डेटाबेस की अवधारणाओं पर आधारित हैं। यह उपयोगकर्ताओं को विस्तृत और जटिल बहुआयामी विचारों का उपयोग करके डेटा का विश्लेषण करने की अनुमति देता है।

डेटा वेयरहाउस बस वास्तुकला

डेटा वेयरहाउस बस आपके वेयरहाउस में डेटा के प्रवाह को निर्धारित करता है। डेटा वेयरहाउस में डेटा फ्लो को इन्फ्लो, अपफ्लो, डाउनफ्लो, आउटफ्लो और मेटा फ्लो के रूप में वर्गीकृत किया जा सकता है।

डेटा बस को डिज़ाइन करते समय, किसी को साझा आयामों पर विचार करने की आवश्यकता होती है, डेटा मौसा में तथ्य।

डेटा मार्ट्स

एक डेटा मार्ट एक एक्सेस लेयर है जिसका उपयोग उपयोगकर्ताओं को डेटा प्राप्त करने के लिए किया जाता है। इसे बड़े आकार के डेटा वेयरहाउस के लिए एक विकल्प के रूप में प्रस्तुत किया जाता है क्योंकि इसे बनाने में कम समय और पैसा लगता है। हालांकि, डेटा मार्ट की कोई मानक परिभाषा नहीं है, जो व्यक्ति से दूसरे व्यक्ति में भिन्न हो।

एक सरल शब्द में डेटा मार्ट डेटा वेयरहाउस की सहायक कंपनी है। डेटा मार्ट का उपयोग डेटा के विभाजन के लिए किया जाता है जो उपयोगकर्ताओं के विशिष्ट समूह के लिए बनाया गया है।

डेटा मोर्टार उसी डेटाबेस में बनाया जा सकता है जैसे डेटावेयरहाउस या शारीरिक रूप से अलग डेटाबेस।

डेटा वेयरहाउस आर्किटेक्चर सर्वश्रेष्ठ आचरण

डेटा वेयरहाउस आर्किटेक्चर डिजाइन करने के लिए, आपको नीचे दिए गए सर्वोत्तम प्रथाओं का पालन करना होगा:

  • डेटा वेयरहाउस मॉडल का उपयोग करें जो सूचना पुनर्प्राप्ति के लिए अनुकूलित हैं जो कि आयामी मोड, असामान्य या संकर दृष्टिकोण हो सकता है।
  • डेटा वेयरहाउस में ऊपर और नीचे के दृष्टिकोण के रूप में उपयुक्त डिजाइनिंग दृष्टिकोण चुनें
  • यह आश्वस्त करने की आवश्यकता है कि डेटा जल्दी और सही तरीके से संसाधित किया गया है। उसी समय, आपको एक दृष्टिकोण लेना चाहिए जो डेटा को सत्य के एकल संस्करण में समेकित करता है।
  • डेटा वेयरहाउस के लिए डेटा अधिग्रहण और क्लींजिंग प्रक्रिया को सावधानीपूर्वक डिज़ाइन करें।
  • मेटाडेटा आर्किटेक्चर डिज़ाइन करें जो डेटा वेयरहाउस के घटकों के बीच मेटाडेटा को साझा करने की अनुमति देता है
  • जब डेटा पुनर्प्राप्ति पिरामिड के निचले हिस्से के पास या जब एक्सेस करने के लिए आवश्यक कई ऑपरेशनल सोर्स हों तो ओडीएस मॉडल लागू करने पर विचार करें।
  • यह सुनिश्चित करना चाहिए कि डेटा मॉडल एकीकृत है और न केवल समेकित है। उस स्थिति में, आपको 3NF डेटा मॉडल पर विचार करना चाहिए। यह ईटीएल और डेटा क्लींजिंग टूल प्राप्त करने के लिए भी आदर्श है

सारांश:

  • डेटा वेयरहाउस एक सूचना प्रणाली है जिसमें एकल या कई स्रोतों से ऐतिहासिक और सराहनीय डेटा होता है। ये स्रोत पारंपरिक डेटा वेयरहाउस, क्लाउड डेटा वेयरहाउस या वर्चुअल डेटा वेयरहाउस हो सकते हैं।
  • एक डेटा गोदाम विषय उन्मुख है क्योंकि यह संगठन के चल रहे संचालन के बजाय विषय के बारे में जानकारी प्रदान करता है।
  • डेटा वेयरहाउस में, एकीकरण का अर्थ है विभिन्न डेटाबेस से सभी समान डेटा के लिए माप की एक सामान्य इकाई की स्थापना
  • डेटा वेयरहाउस भी गैर-वाष्पशील होता है, जब नया डेटा इसमें डाला जाता है तो पिछला डेटा मिटाया नहीं जाता है।
  • एक डेटवेयरहाउस टाइम-वैरिएंट है क्योंकि डीडब्ल्यू में डेटा उच्च शेल्फ जीवन है।
  • डेटा वेयरहाउस आर्किटेक्चर के मुख्य रूप से 5 घटक हैं: 1) डेटाबेस 2) ईटीएल टूल्स 3) मेटा डेटा 4) क्वेरी टूल 5) डेटामार्ट्स
  • ये क्वेरी टूल्स की चार मुख्य श्रेणियां हैं 1. क्वेरी और रिपोर्टिंग, टूल्स 2. एप्लिकेशन डेवलपमेंट टूल्स, 3. डेटा माइनिंग टूल्स 4. OLAP टूल्स
  • सभी रूपांतरणों और सारांशों को निष्पादित करने के लिए डेटा सोर्सिंग, परिवर्तन और माइग्रेशन टूल का उपयोग किया जाता है।
  • डेटा वेयरहाउस आर्किटेक्चर में, मेटा-डेटा एक महत्वपूर्ण भूमिका निभाता है क्योंकि यह डेटा वेयरहाउस डेटा के स्रोत, उपयोग, मूल्यों और विशेषताओं को निर्दिष्ट करता है।