डेटा स्क्रैपिंग क्या है?
डेटा स्क्रैपिंग वह तकनीक है जो HTML वेब पेज से वांछित जानकारी को अपने स्थानीय मशीन में मौजूद स्थानीय फ़ाइल में निकालने में मदद करती है। आम तौर पर, एक स्थानीय फ़ाइल एक एक्सेल फ़ाइल, शब्द फ़ाइल के अनुरूप हो सकती है, या किसी Microsoft कार्यालय अनुप्रयोग को कहने के लिए। यह वेब पेज से महत्वपूर्ण जानकारी को प्रसारित करने में मदद करता है।
दैनिक आधार पर शोध-आधारित परियोजना पर काम करते समय डेटा स्क्रैपिंग सरल हो जाता है, और ऐसी परियोजना पूरी तरह से इंटरनेट और वेबसाइट पर निर्भर होती है। विषय पर आगे की व्याख्या करने के लिए, आइए हम एक ऐसे दिन के व्यापारी का उदाहरण लें, जो एक वित्त वेबसाइट से बाजार की जानकारी खींचने के लिए एक एक्सेल मैक्रो चलाता है, जिसमें VBA का उपयोग किया गया है।
इस ट्यूटोरियल में, आप सीखेंगे:
- डेटा स्क्रैपिंग क्या है?
- इंटरनेट एक्सप्लोरर का उपयोग करके डेटा स्क्रैपिंग करने से पहले एक्सेल मैक्रो कैसे तैयार करें?
- एक्सेल VBA का उपयोग करके इंटरनेट एक्सप्लोरर कैसे खोलें?
- VBA का उपयोग करके इंटरनेट एक्सप्लोरर में वेबसाइट कैसे खोलें?
- VBA का उपयोग करके वेबसाइट से जानकारी कैसे परिमार्जन करें?
इंटरनेट एक्सप्लोरर का उपयोग करके डेटा स्क्रैपिंग करने से पहले एक्सेल मैक्रो कैसे तैयार करें?
कुछ आवश्यक शर्तें हैं जो एक्सेल में डेटा स्क्रैपिंग की प्रक्रिया में आने से पहले एक्सेल मैक्रो फ़ाइल पर प्रदर्शन किया जाना है।
ये शर्तें इस प्रकार हैं: -
चरण 1) एक एक्सेल-आधारित मैक्रो खोलें और एक्सेल के डेवलपर विकल्प तक पहुंचें।
चरण 2) डेवलपर रिबन के तहत विज़ुअल बेसिक विकल्प का चयन करें।
चरण 3) एक नया मॉड्यूल डालें।
चरण 4) एक नए सबरूटीन को प्रारंभ करें
Sub test()End sub
मॉड्यूल इस प्रकार होगा: -
चरण 5) टूल टैब के तहत संदर्भ विकल्प तक पहुँचें और Microsoft HTML ऑब्जेक्ट लाइब्रेरी और Microsoft इंटरनेट नियंत्रण का संदर्भ लें।
निम्न फ़ाइलों को मॉड्यूल को संदर्भित किया जाना है क्योंकि यह इंटरनेट एक्सप्लोरर को खोलने में मदद करता है और मैक्रो स्क्रिप्टिंग के विकास की सुविधा प्रदान करता है।
अब इंटरनेट एक्सप्लोरर के साथ बातचीत करने के लिए एक्सेल फाइल तैयार है। अगला कदम मैक्रो स्क्रिप्ट को शामिल करना होगा जो HTML में डेटा स्क्रैपिंग की सुविधा प्रदान करेगा।
एक्सेल VBA का उपयोग करके इंटरनेट एक्सप्लोरर कैसे खोलें?
चरण 1) नीचे दिखाए गए अनुसार सबरूटीन्स में वैरिएबल को प्रारंभ करें
Sub test()Dim ie As New InternetExplorerDim doc As New HTMLDocument
चरण 2) VBA का उपयोग करके इंटरनेट एक्सप्लोरर खोलने के लिए, दृश्यमान = सही लिखें और F5 दबाएँ ।
Sub test()Dim ie As New InternetExplorerDim doc As New HTMLDocumentIe.visible=true
मॉड्यूल निम्नानुसार दिखेगा: -
VBA का उपयोग करके इंटरनेट एक्सप्लोरर में वेबसाइट कैसे खोलें?
यहां, वीबीए का उपयोग करके इंटरनेट शोषक में वेबसाइट खोलने के चरण हैं
चरण 1) जब आप एक्सेल वीबीए का उपयोग करके इंटरनेट एक्सप्लोरर का उपयोग करने में सक्षम हो जाते हैं, तो अगला कदम एनबीए का उपयोग करके वेबसाइट तक पहुंचना शामिल होगा। यह नेविगेट विशेषता द्वारा सुविधा प्रदान करता है, जिसमें URL को विशेषता में दोहरे उद्धरण चिह्नों के रूप में पास करना होता है। प्रदर्शित के रूप में निम्न चरणों का पालन करें।
Sub test()Dim, ie As New InternetExplorerDim doc As New HTMLDocumentDim ecoll As Objectie.Visible = Trueie.navigate"http://demo.guru99.com/test/web-table-element.php"DoDoEventsLoop Until ie.readyState = READYSTATE_COMPLETE
चरण 2) - मैक्रो को निष्पादित करने के लिए F5 दबाएं। निम्न वेबपेज प्रदर्शित होते ही खुल जाएगा
अब, स्क्रैप मैक्रो स्क्रैपिंग फ़ंक्शन करने के लिए सम्मान के साथ तैयार है। अगला चरण यह प्रदर्शित करेगा कि कैसे VBA का उपयोग करके इंटरनेट एक्सप्लोरर से जानकारी निकाली जा सकती है।
VBA का उपयोग करके वेबसाइट से जानकारी कैसे परिमार्जन करें?
मान लीजिए कि व्यापारी दैनिक आधार पर वेबसाइट से डेटा एक्सेस करना चाहता है। हर बार जब दिन व्यापारी क्लिक बटन दबाता है, तो उसे बाजार डेटा को एक्सेल में ऑटो करना चाहिए।
उपरोक्त वेबसाइट से, एक तत्व का निरीक्षण करना और यह देखना आवश्यक होगा कि डेटा कैसे संरचित है।
चरण 1) नियंत्रण + Shift + I दबाकर HTML के नीचे स्रोत कोड तक पहुंचें
Company | Group | Pre Close (Rs) | Current Price (Rs) | % Change |
---|