बड़ा डेटा 2025, अप्रैल
सामान्य ईटीएल / डेटा वेयरहाउस प्रक्रिया का समर्थन करने के अलावा, जो बड़ी मात्रा में डेटा से संबंधित है, Informatica टूल संपूर्ण डेटा एकीकरण समाधान और डेटा प्रबंधन प्रणाली प्रदान करता है। इस ट्यूटोरियल में, यो
1) बताएं कि माइक्रोस्ट्रैटी क्या है? Microstrategy एक उद्यम व्यापार खुफिया अनुप्रयोग सॉफ्टवेयर विक्रेता है। यह स्कोरकार्ड, इंटरैक्टिव डैशबोर्ड, तदर्थ क्वेरी, उच्च स्वरूपित रिपोर्ट का समर्थन करता है
1. एंटरप्राइज डेटा वेयरहाउसिंग से आपका क्या अभिप्राय है? जब संगठन डेटा एक्सेस के एक बिंदु पर बनाया जाता है, तो इसे एंटरप्राइज़ डेटा वेयरहाउसिंग कहा जाता है। डेटा एक वैश्विक vi के साथ प्रदान किया जा सकता है
नॉर्मलाइज़र परिवर्तन आपके डेटा को अधिक संगठित तरीके से प्रस्तुत करने का एक स्मार्ट तरीका है। इसका उपयोग एकल पंक्ति को कई पंक्तियों में बदलने और इसके विपरीत करने के लिए किया जाता है। यदि एक ही पंक्ति में दोहराव है
योजक परिवर्तन - हमेशा यदि संभव हो तो डेटाबेस में शामिल होने के लिए पसंद करते हैं, क्योंकि डेटाबेस जॉइन्ट्स सूचनात्मक योजक परिवर्तन में बनाए गए जॉन्स की तुलना में तेज़ होते हैं।
लुकअप परिवर्तन स्रोत डेटा में मूल्यों के आधार पर तालिका में मिलान मूल्यों को देखने की सुविधा प्रदान करता है। असल में, यह एक तरह का ज्वाइन ऑपरेशन है, जिसमें ज्वाइनिंग टेबल एक है
रैंक परिवर्तन समूह और रैंक के आधार पर डेटा की फ़िल्टरिंग करता है। उदाहरण के लिए, आप उच्चतम वेतन वाले कर्मचारियों के दस रिकॉर्ड प्राप्त करना चाहते हैं, इस तरह का फ़िल्टर रैंक ट्रे द्वारा किया जा सकता है
अनुक्रम जनरेटर परिवर्तन का उपयोग संख्यात्मक अनुक्रम मानों को उत्पन्न करने के लिए किया जाता है जैसे 1, 2, 3, 4, 5 आदि। उदाहरण के लिए, आप स्रोत रिकॉर्ड के लिए अनुक्रम मान निर्दिष्ट करना चाहते हैं, फिर आप अनुक्रम g का उपयोग कर सकते हैं
योजक परिवर्तन आपको Informatica में जुड़ने का विकल्प प्रदान करता है। जॉइनर ट्रांसफॉर्मेशन का उपयोग करके बनाए गए जॉइन डेटाबेस में जॉइन के समान होते हैं। योजक परिवर्तन का लाभ
फिल्टर ट्रांसफॉर्मेशन के समान राउटर ट्रांसफॉर्मेशन का उपयोग सोर्स डेटा को फिल्टर करने के लिए भी किया जाता है। फ़िल्टरिंग के साथ प्रदान की गई अतिरिक्त कार्यक्षमता यह है कि छोड़े गए डेटा (डेटा को फ़िल्टर्ड)
एग्रीगेटर परिवर्तन कुल, जैसे योग, औसत आदि की गणना करता है। उदाहरण के लिए, यदि आप सभी कर्मचारियों के विभागवार वेतन की राशि की गणना करना चाहते हैं, तो हम एग्र्रेग का उपयोग कर सकते हैं
जब भी हम एक संबंधपरक स्रोत या एक मैपिंग के लिए एक फ्लैट फ़ाइल जोड़ते हैं, तो स्रोत क्वालीफ़ायर परिवर्तन की आवश्यकता होती है। जब हम किसी स्रोत को मैपिंग में जोड़ते हैं, तो सोर्स क्वालिफायर ट्रांसफॉर्मेशन स्वचालित रूप से जुड़ जाता है
जैसा कि हमने पिछले विषयों में चर्चा की थी, एक मैपिंग एक संग्रह का स्रोत है और लक्ष्य ऑब्जेक्ट्स को एक साथ परिवर्तनों के सेट से जोड़ा गया है। इन परिवर्तनों में नियमों का एक समूह शामिल है, जो वें को परिभाषित करता है
सत्र वस्तु निर्देशों का एक सेट है जो इंफॉर्मेटिका को निर्देश देता है कि डेटा को स्रोत से लक्ष्य तक कैसे और कब स्थानांतरित किया जाए। एक सत्र वस्तु एक कार्य है, अन्य कार्यों की तरह जो हम वर्कफ़्लो में बनाते हैं
ट्रांसफॉर्मेशन इंफॉर्मेटिका में ऑब्जेक्ट्स हैं जो परिभाषित लक्ष्य संरचनाओं (टेबल, फाइलें या किसी अन्य लक्ष्य) के लिए डेटा बनाते हैं, संशोधित करते हैं या पास करते हैं। इंफोरा में परिवर्तन का उद्देश्य
एक वर्कफ़्लो निर्देश / निर्देशन का एक समूह है जो एकीकरण सेवा के लिए है। एकीकरण सेवा एक इकाई है जो भंडार से वर्कफ़्लो जानकारी पढ़ती है, स्रोतों और पिछाड़ी से डेटा प्राप्त करती है
वर्कफ़्लो मॉनिटर एक ऐसा उपकरण है जिसकी सहायता से आप वर्कफ़्लो के निष्पादन और वर्कफ़्लो को सौंपे गए कार्य की निगरानी कर सकते हैं।
ETL / डेटा वेयरहाउस में, आप विभिन्न स्रोतों और लक्ष्यों का सामना करेंगे। ईटीएल में एक स्रोत एक इकाई है जहां से आप रिकॉर्ड खींचते हैं, और फिर आप इन रिकॉर्ड्स को अस्थायी तालिकाओं (स्टेजिंग टैब) में संग्रहीत करते हैं
Informatica सर्वर और क्लाइंट को स्थापित करने के बाद, Informatica सर्वर को कॉन्फ़िगर करने की आवश्यकता होती है। Informatica वास्तुकला एक सेवा उन्मुख वास्तुकला (SOA) है। इसलिए, Informatica का उपयोग करने से पहले
मैपिंग स्रोत और लक्ष्य ऑब्जेक्ट्स का एक संग्रह है जो परिवर्तनों के एक सेट द्वारा एक साथ जुड़ा हुआ है। इन परिवर्तनों में नियमों का एक समूह होता है, जो डेटा प्रवाह को परिभाषित करता है और डेटा कैसे लोड होता है
इंफॉर्मेटिका एक सॉफ्टवेयर डेवलपमेंट कंपनी है, जो डेटा इंटीग्रेशन उत्पाद पेश करती है। यदि ETL, डेटा मास्किंग, डेटा क्वालिटी, डेटा प्रतिकृति, डेटा वर्चुअलाइज़ेशन, मास्टर डेटा प्रबंधन के लिए उत्पाद प्रदान करता है
ईटीएल परीक्षण के लिए सभी समाधानों में छोटे और साथ ही बड़े बाजार व्यापार के लिए डेटा एकीकरण, इंफोर्मेटिका पावरकेंटर एक का लाभ उठाता है। Informatica को डाउनलोड और इंस्टॉल करने के लिए, आपको दिए गए लिंक पर जाना होगा
Hadoop इकोसिस्टम के शीर्ष पर एक ETL और डेटा वेयरहाउसिंग टूल के रूप में हाइव, डेटा मॉडलिंग, डेटा हेरफेर, डेटा प्रोसेसिंग और डेटा क्वेरी जैसी कार्यक्षमता प्रदान करता है। हाइव में डेटा एक्सट्रैक्शन का मतलब है
इस ट्यूटोरियल में, आप सीखेंगे- क्वेश्चन ज्वाइन करें अलग-अलग तरह के जॉइन सब क्वेश्चन एंबेडेड कस्टम स्क्रिप्ट UDFs (यूजर डिफाइन फंक्शन्स) क्वैश्चन ज्वाइन करें: ज्वाइन क्वेश्चंस में मौजूद दो टेबल पर परफॉर्म कर सकते हैं
हाइव अंतर्निहित ऑपरेटरों और डेटा संचालन के लिए कार्यों को हाइव गोदाम के अंदर मौजूद तालिकाओं पर लागू करने के लिए प्रदान करता है। इन ऑपरेटरों को ऑपरेंड पर गणितीय कार्यों के लिए उपयोग किया जाता है, और
टेबल कॉलम नामों के ऑपरेंड पर गणितीय, अंकगणितीय, तार्किक और संबंधपरक जैसे कार्यों को करने के लिए एक विशिष्ट उद्देश्य के लिए फ़ंक्शंस बनाए जाते हैं। बिल्ट-इन फ़ंक्शंस ये फ़ंक्शंस थे
Hive, Hadoop फ़ाइल सिस्टम के शीर्ष पर ETL उद्देश्य के लिए SQL टाइप क्वेरी भाषा प्रदान करता है। हाइव क्वेरी लैंग्वेज (HQL) हाइव में SQL प्रकार का वातावरण टेबल, डेटाबेस, प्रश्नों के साथ काम करने के लिए प्रदान करती है। हम सी
इस ट्यूटोरियल में, आप सीखेंगे कि जनरल, टेबल्स मैनेजमेंट, डेटा हेरफेर, स्टेटस, वर्जन, टेबल_एचएलपी (स्कैन, ड्रॉप, गेट, पुट, डिसेबल), क्लोमी रिप्लेसमेंट कमांड्स, वूमामी, क्रिएट, लिस्ट, डिसएबल, डिसेबल, डिसेबल, इनेबल , Enable_all, Drop, Drop_all, Show_filters, Alter, Alter_status, Count, Delete, Delete, all, Truncate, add_peer, remove_peer, start_replication, stop -replication
हाइव दृश्य तालिकाओं के समान हैं, जो आवश्यकताओं के आधार पर उत्पन्न होते हैं। सूचकांक एक तालिका के विशेष स्तंभ नाम के संकेत हैं।
हाइव विभाजन और बाल्टी हाइव डेटा मॉडलिंग के हिस्से हैं। विभाजन में तालिकाओं को व्यवस्थित करने के लिए विभाजन का उपयोग किया जाता है। जो भी बाल्टी कुशल क्वेरी के लिए प्रयोग किया जाता है।