उदाहरणों के साथ डेटा वेयरहाउस में स्टार और स्नोफ्लेक स्कीमा

विषय - सूची:

Anonim

बहुआयामी स्कीमा क्या है?

बहुआयामी स्कीमा विशेष रूप से डेटा गोदाम प्रणालियों को मॉडल करने के लिए डिज़ाइन किया गया है। स्कीमा विश्लेषणात्मक उद्देश्य (OLAP) के लिए डिज़ाइन किए गए बहुत बड़े डेटाबेस की अद्वितीय आवश्यकताओं को संबोधित करने के लिए डिज़ाइन किया गया है।

डेटा वेयरहाउस स्कीमा के प्रकार:

निम्नलिखित 3 मुख्य प्रकार के बहुआयामी स्कीमा हैं, जिनमें से प्रत्येक के अनूठे फायदे हैं।

  • स्टार स्कीमा
  • स्नोफ्लेक स्कीमा
  • गैलेक्सी स्कीमा

इस ट्यूटोरियल में, आप के बारे में अधिक जानेंगे-

  • स्टार स्कीमा क्या है?
  • स्नोफ्लेक स्कीमा क्या है?
  • स्टार स्कीमा बनाम स्नोफ्लेक स्कीमा: प्रमुख अंतर
  • गैलेक्सी स्कीमा क्या है?
  • स्टार क्लस्टर स्कीमा क्या है?

स्टार स्कीमा क्या है?

डेटा वेयरहाउस में स्टार स्कीमा , जिसमें स्टार के केंद्र में एक तथ्य तालिका और कई संबंधित आयाम टेबल हो सकते हैं। इसे स्टार स्कीमा के रूप में जाना जाता है क्योंकि इसकी संरचना एक स्टार जैसी होती है। स्टार स्कीमा डेटा मॉडल डेटा वेयरहाउस स्कीमा का सबसे सरल प्रकार है। इसे स्टार जॉइन स्कीमा के रूप में भी जाना जाता है और बड़े डेटा सेट को क्वेरी करने के लिए अनुकूलित किया जाता है।

निम्नलिखित स्टार स्कीमा उदाहरण में, तथ्य तालिका केंद्र में है, जिसमें डीलर आयाम, मॉडल आईडी, Date_ID, Product_ID, Branch_ID और बेची गई और राजस्व जैसी अन्य विशेषताओं की तरह हर आयाम तालिका की कुंजी है।

स्टार स्कीमा आरेख का उदाहरण

स्टार स्कीमा की विशेषताएं:

  • एक स्टार स्कीमा में प्रत्येक आयाम को केवल एक-आयाम तालिका के साथ दर्शाया गया है।
  • आयाम तालिका में विशेषताओं का समूह होना चाहिए।
  • आयाम तालिका एक विदेशी कुंजी का उपयोग करके तथ्य तालिका में शामिल हो जाती है
  • आयाम तालिका एक दूसरे से नहीं जुड़ती हैं
  • तथ्य तालिका में कुंजी और माप शामिल होंगे
  • स्टार स्कीमा को समझना आसान है और इष्टतम डिस्क उपयोग प्रदान करता है।
  • आयाम तालिकाओं को सामान्य नहीं किया जाता है। उदाहरण के लिए, उपरोक्त आंकड़े में, Country_ID में देश खोज तालिका नहीं है क्योंकि OLTP डिज़ाइन होगा।
  • स्कीमा बीआई टूल्स द्वारा व्यापक रूप से समर्थित है

स्नोफ्लेक स्कीमा क्या है?

डेटा वेयरहाउस में स्नोफ्लेक स्कीमा एक बहुआयामी डेटाबेस में तालिकाओं की एक तार्किक व्यवस्था है, जैसे कि ईआर आरेख एक स्नोफ्लेक आकृति जैसा दिखता है। स्नोफ्लेक स्कीमा एक स्टार स्कीमा का विस्तार है, और यह अतिरिक्त आयाम जोड़ता है। आयाम तालिकाओं को सामान्य किया जाता है जो डेटा को अतिरिक्त तालिकाओं में विभाजित करता है।

निम्नलिखित स्नोफ्लेक स्कीमा उदाहरण में, देश को एक व्यक्तिगत तालिका में सामान्यीकृत किया गया है।

स्नोफ्लेक स्कीमा का उदाहरण

स्नोफ्लेक स्कीमा के लक्षण:

  • स्नोफ्लेक स्कीमा का मुख्य लाभ यह छोटे डिस्क स्थान का उपयोग करता है।
  • आयाम लागू करने के लिए स्कीमा में जोड़ा गया है
  • कई तालिकाओं के कारण क्वेरी का प्रदर्शन कम हो जाता है
  • स्नोफ्लेक स्कीमा का उपयोग करते समय आपके सामने आने वाली प्राथमिक चुनौती यह है कि आपको अधिक लुकअप तालिकाओं के कारण अधिक रखरखाव के प्रयासों को करने की आवश्यकता है।

स्टार स्कीमा बनाम स्नोफ्लेक स्कीमा: प्रमुख अंतर

स्टार स्कीमा और स्नोफ्लेक स्कीमा के बीच एक महत्वपूर्ण अंतर निम्नलिखित है:

स्टार स्कीमा स्नोफ्लेक स्कीमा
आयामों के लिए पदानुक्रम आयामी तालिका में संग्रहीत किए जाते हैं। पदानुक्रम को अलग-अलग तालिकाओं में विभाजित किया गया है।
इसमें एक तथ्य तालिका होती है जो आयाम तालिकाओं से घिरी होती है। आयाम तालिका से घिरे एक तथ्य तालिका, जो आयाम तालिका से घिरी हुई है
एक स्टार स्कीमा में, केवल एकल सम्मिलित तथ्य तालिका और किसी भी आयाम तालिकाओं के बीच संबंध बनाता है। स्नोफ्लेक स्कीमा में डेटा लाने के लिए कई जॉइन की आवश्यकता होती है।
सरल डीबी डिजाइन। बहुत जटिल डीबी डिजाइन।
असामान्य डेटा संरचना और क्वेरी भी तेज़ी से चलती हैं। सामान्यीकृत डेटा संरचना।
डेटा अतिरेक का उच्च स्तर बहुत कम-स्तरीय डेटा अतिरेक
एकल आयाम तालिका में कुल डेटा होता है। डेटा अलग-अलग आयाम तालिकाओं में विभाजित होते हैं।
घन प्रसंस्करण तेज है। क्यूब प्रसंस्करण जटिल शामिल होने के कारण धीमा हो सकता है।
Star Join Query Optimization का उपयोग करके उच्च प्रदर्शन वाले प्रश्न प्रदान करता है। तालिकाओं को कई आयामों से जोड़ा जा सकता है। स्नोफ्लेक स्कीमा केंद्रीयकृत तथ्य तालिका द्वारा दर्शाया गया है जो कई आयामों से जुड़ा हुआ नहीं है।

गैलेक्सी स्कीमा क्या है?

एक आकाशगंगा स्कीमा दो तथ्य तालिका कि उन दोनों के बीच शेयर आयाम तालिकाओं में शामिल है। इसे Fact Constellation Schema भी कहा जाता है। स्कीमा को सितारों के संग्रह के रूप में देखा जाता है इसलिए इसका नाम गैलेक्सी स्कीमा है।

गैलेक्सी स्कीमा का उदाहरण

जैसा कि आप ऊपर के उदाहरण में देख सकते हैं, दो तथ्य तालिकाएं हैं

  1. राजस्व
  2. उत्पाद।

गैलेक्सी स्कीमा शेयरों में आयामों को विकृत आयाम कहा जाता है।

गैलेक्सी स्कीमा के लक्षण:

  • इस स्कीमा के आयामों को पदानुक्रम के विभिन्न स्तरों के आधार पर अलग-अलग आयामों में विभाजित किया गया है।
  • उदाहरण के लिए, यदि भूगोल में क्षेत्र, देश, राज्य और शहर जैसे पदानुक्रम के चार स्तर हैं तो गैलेक्सी स्कीमा के चार आयाम होने चाहिए।
  • इसके अलावा, वन-स्टार स्कीमा को अधिक स्टार योजनाओं में विभाजित करके इस प्रकार के स्कीमा का निर्माण करना संभव है।
  • इस स्कीमा में आयाम बड़े हैं जिन्हें पदानुक्रम के स्तरों के आधार पर बनाने की आवश्यकता है।
  • यह स्कीमा बेहतर समझ के लिए तथ्य तालिकाओं को एकत्र करने के लिए सहायक है।

स्टार क्लस्टर स्कीमा क्या है?

स्नोफ्लेक स्कीमा में पूरी तरह से विस्तारित पदानुक्रम शामिल हैं। हालांकि, यह स्कीमा में जटिलता जोड़ सकता है और अतिरिक्त जुड़ाव की आवश्यकता होती है। दूसरी ओर, स्टार स्कीमा में पूरी तरह से ध्वस्त पदानुक्रम शामिल हैं, जिससे अतिरेक हो सकता है। तो, सबसे अच्छा समाधान इन दो स्कीमाओं के बीच एक संतुलन हो सकता है जो स्टार क्लस्टर स्कीमा डिज़ाइन है।

स्टार क्लस्टर स्कीमा का उदाहरण

ओवरलैपिंग आयामों को पदानुक्रम में कांटे के रूप में पाया जा सकता है। कांटा तब होता है जब एक इकाई दो अलग-अलग आयामी पदानुक्रमों में एक माता-पिता के रूप में कार्य करती है। कांटे वाली संस्थाओं को तब एक से कई रिश्तों के वर्गीकरण के रूप में पहचाना जाता है।

सारांश:

  • बहुआयामी स्कीमा विशेष रूप से डेटा वेयरहाउस सिस्टम को मॉडल करने के लिए डिज़ाइन किया गया है
  • स्टार स्कीमा डेटा वेयरहाउस स्कीमा का सबसे सरल प्रकार है। इसे स्टार स्कीमा के रूप में जाना जाता है क्योंकि इसकी संरचना एक स्टार जैसी होती है।
  • स्नोफ्लेक स्कीमा एक स्टार स्कीमा का विस्तार है, और यह अतिरिक्त आयाम जोड़ता है। इसे स्नोफ्लेक कहा जाता है क्योंकि इसका आरेख स्नोफ्लेक जैसा दिखता है।
  • एक स्टार स्कीमा में, केवल सिंगल ज्वाइन तथ्य तालिका और किसी भी आयाम तालिकाओं के बीच संबंध को परिभाषित करता है।
  • स्टार स्कीमा में एक तथ्य तालिका होती है जो आयाम तालिकाओं से घिरी होती है।
  • स्नोफ्लेक स्कीमा आयाम तालिका से घिरा हुआ है जो आयाम तालिका से घिरा हुआ है
  • स्नोफ्लेक स्कीमा में डेटा लाने के लिए कई जॉइन की आवश्यकता होती है।
  • एक गैलेक्सी स्कीमा में दो तथ्य तालिका होती है जो आयाम तालिकाओं को साझा करती है। इसे Fact Constellation Schema भी कहा जाता है।
  • स्टार क्लस्टर स्कीमा में स्टार और स्नोफ्लेक स्कीमा के गुण होते हैं।