उदाहरणों के साथ MongoDB नियमित अभिव्यक्ति (Regex)

पैटर्न मिलान के लिए नियमित अभिव्यक्ति का उपयोग किया जाता है, जो मूल रूप से दस्तावेजों के भीतर निष्कर्ष स्ट्रिंग के लिए है।

कभी-कभी किसी संग्रह में दस्तावेज़ों को पुनर्प्राप्त करते समय, आप शायद नहीं जानते कि खोज करने के लिए सटीक फ़ील्ड मूल्य क्या है। इसलिए, पैटर्न मिलान खोज मूल्यों के आधार पर डेटा को पुनः प्राप्त करने में सहायता के लिए व्यक्ति नियमित अभिव्यक्तियों का उपयोग कर सकता है।

इस ट्यूटोरियल में, आप सीखेंगे -

पैटर्न मिलान के लिए $ रेगेक्स ऑपरेटर का उपयोग करना
$ विकल्पों के साथ पैटर्न मिलान
रेगेक्स ऑपरेटर के बिना पैटर्न मिलान
एक संग्रह से अंतिम 'एन' दस्तावेज प्राप्त करना

पैटर्न मिलान के लिए $ रेगेक्स ऑपरेटर का उपयोग करना

MongoDB में रेगेक्स ऑपरेटर का उपयोग संग्रह में विशिष्ट तारों की खोज के लिए किया जाता है। निम्न उदाहरण दिखाता है कि यह कैसे किया जा सकता है।

मान लेते हैं कि हमारे पास अपना समान कर्मचारी संग्रह है जिसमें "कर्मचारी" और "कर्मचारी नाम" के फील्ड नाम हैं। चलो यह भी मानते हैं कि हमारे संग्रह में निम्नलिखित दस्तावेज हैं।

कर्मचारी आयडी	कर्मचारी का नाम
२२	न्यूमार्टिन
२	मोहन
३	जो
४	मोहन
100	गुरु ९९
६	गुरंग

यहां नीचे दिए गए कोड में हमने खोज मापदंड को निर्दिष्ट करने के लिए regex ऑपरेटर का उपयोग किया है।

db.Employee.find({EmployeeName : {$regex: "Gu" }}).forEach(printjson)

कोड स्पष्टीकरण:

यहां हम सभी कर्मचारी नाम ढूंढना चाहते हैं, जिनमें 'Gu' अक्षर हैं। इसलिए, हम 'गु' के खोज मापदंड को परिभाषित करने के लिए $ रेगेक्स ऑपरेटर को निर्दिष्ट करते हैं
प्रिंटजसन का उपयोग प्रत्येक दस्तावेज़ को प्रिंट करने के लिए किया जा रहा है जो क्वेरी द्वारा बेहतर तरीके से वापस किया जाता है।

यदि कमांड को सफलतापूर्वक निष्पादित किया जाता है, तो निम्न आउटपुट दिखाया जाएगा:

आउटपुट:

आउटपुट से स्पष्ट रूप से पता चलता है कि उन दस्तावेजों में जहां कर्मचारी का नाम 'गु' अक्षर है, वापस आ गए हैं।

यदि मान लें कि आपके संग्रह में एक अतिरिक्त दस्तावेज़ के साथ निम्नलिखित दस्तावेज़ हैं, जिसमें कर्मचारी का नाम "Guru999" है। यदि आप खोज मापदंड "गुरु 99" के रूप में दर्ज करते हैं, तो यह उस दस्तावेज़ को भी लौटा देगा जिसमें "गुरु 999" था। लेकिन मान लीजिए अगर हम ऐसा नहीं चाहते थे और केवल "गुरु 99" के साथ दस्तावेज वापस करना चाहते थे। फिर हम सटीक पैटर्न मिलान के साथ ऐसा कर सकते हैं। एक सटीक पैटर्न मिलान करने के लिए, हम और $ वर्ण का उपयोग करेंगे। हम स्ट्रिंग की शुरुआत में और स्ट्रिंग के अंत में $ जोड़ देंगे।

कर्मचारी आयडी	कर्मचारी का नाम
२२	न्यूमार्टिन
२	मोहन
३	जो
४	मोहन
100	गुरु ९९
६	गुरंग
।	गुरु 999

निम्न उदाहरण दिखाता है कि यह कैसे किया जा सकता है।

db.Employee.find({EmployeeName : {$regex: "^Guru99$"}}).forEach(printjson)

कोड स्पष्टीकरण:

यहां खोज मापदंड में, हम और $ वर्ण का उपयोग कर रहे हैं। का उपयोग यह सुनिश्चित करने के लिए किया जाता है कि स्ट्रिंग एक निश्चित चरित्र से शुरू होती है, और यह सुनिश्चित करने के लिए $ का उपयोग किया जाता है कि स्ट्रिंग एक निश्चित चरित्र के साथ समाप्त होती है। इसलिए जब कोड निष्पादित होता है तो यह केवल "Guru99" नाम के साथ स्ट्रिंग लाएगा।
प्रिंटजसन का उपयोग प्रत्येक दस्तावेज़ को प्रिंट करने के लिए किया जा रहा है जो क्वेरी द्वारा बेहतर तरीके से वापस किया जाता है।

आउटपुट:

आउटपुट में, यह स्पष्ट रूप से दिखाई देता है कि स्ट्रिंग "गुरू 99" लाया जाता है।

$ विकल्पों के साथ पैटर्न मिलान

रेगेक्स ऑपरेटर का उपयोग करते समय कोई भी $ विकल्प कीवर्ड का उपयोग करके अतिरिक्त विकल्प प्रदान कर सकता है । उदाहरण के लिए, मान लें कि आप सभी दस्तावेजों को खोजना चाहते थे, जो उनके कर्मचारी नाम में 'गु' थे, चाहे वह संवेदनशील या असंवेदनशील हो। यदि ऐसा कोई परिणाम वांछित है, तो हमें केस इंस्पिरेशन पैरामीटर के साथ $ विकल्पों का उपयोग करने की आवश्यकता है ।

निम्न उदाहरण दिखाता है कि यह कैसे किया जा सकता है।

मान लेते हैं कि हमारे पास अपना समान कर्मचारी संग्रह है जिसमें "कर्मचारी" और "कर्मचारी नाम" के फील्ड नाम हैं।

चलो यह भी मानते हैं कि हमारे संग्रह में निम्नलिखित दस्तावेज हैं।

कर्मचारी आयडी	कर्मचारी का नाम
२२	न्यूमार्टिन
२	मोहन
३	जो
४	मोहन
100	गुरु ९९
६	गुरंग
।	GURU99

अब यदि हम उसी क्वेरी को अंतिम विषय के रूप में चलाते हैं, तो हम कभी भी परिणाम में "GURU99" के साथ दस्तावेज़ नहीं देखेंगे। यह सुनिश्चित करने के लिए कि परिणाम सेट में आता है, हमें $ विकल्प "I" पैरामीटर को जोड़ना होगा।

db.Employee.find({EmployeeName:{$regex: "Gu",$options:'i'}}).forEach(printjson)

कोड स्पष्टीकरण:

'आई' पैरामीटर (जिसका अर्थ है कि असंवेदनशीलता) के साथ $ विकल्प निर्दिष्ट करते हैं कि हम खोज को कोई फर्क नहीं पड़ना चाहते हैं अगर हमें अक्षर 'गु' कम या ऊपरी मामले में मिलते हैं।

आउटपुट:

आउटपुट स्पष्ट रूप से दिखाता है कि भले ही एक दस्तावेज़ में ऊपरी मामला 'गुजरात' है, फिर भी दस्तावेज़ परिणाम सेट में प्रदर्शित होता है।

रेगेक्स ऑपरेटर के बिना पैटर्न मिलान

रेगेक्स ऑपरेटर के बिना एक पैटर्न मिलान भी कर सकता है। निम्न उदाहरण दिखाता है कि यह कैसे किया जा सकता है।

db.Employee.find({EmployeeName: /Gu/'}).forEach(printjson)

कोड स्पष्टीकरण:

"//" विकल्प मूल रूप से इन सीमांकक के भीतर अपने खोज मानदंडों को निर्दिष्ट करने का मतलब है। इसलिए, हम उन दस्तावेजों को फिर से खोजने के लिए / Gu / निर्दिष्ट कर रहे हैं, जिनके EmployeeName में 'Gu' हैं।

आउटपुट:

एक संग्रह से अंतिम 'एन' दस्तावेज प्राप्त करना

एक संग्रह में अंतिम n दस्तावेज़ प्राप्त करने के विभिन्न तरीके हैं।

आइए निम्नलिखित चरणों के माध्यम से किसी एक तरीके को देखें

निम्न उदाहरण दिखाता है कि यह कैसे किया जा सकता है।

चलो यह भी मानते हैं कि हमारे संग्रह में निम्नलिखित दस्तावेज हैं:

कर्मचारी आयडी	कर्मचारी का नाम
२२	न्यूमार्टिन
२	मोहन
३	जो
४	मोहन
100	गुरु ९९
६	गुरंग
।	GURU99

db.Employee.find().sort({_id:-1}).limit(2).forEach(printjson)

कोड स्पष्टीकरण:

1) दस्तावेज़ों के लिए क्वेरी करते समय, संग्रह में _id फ़ील्ड मान के आधार पर रिकॉर्ड्स को रिवर्स ऑर्डर में सॉर्ट करने के लिए सॉर्ट फ़ंक्शन का उपयोग करें। -1 मूल रूप से दस्तावेजों को रिवर्स ऑर्डर या अवरोही क्रम में क्रमबद्ध करने का संकेत देता है ताकि अंतिम दस्तावेज प्रदर्शित होने वाला पहला दस्तावेज बन जाए।

2) उसके बाद अपने इच्छित रिकॉर्ड की संख्या को प्रदर्शित करने के लिए लिमिट क्लॉज का उपयोग करें। यहां हमने सीमा खंड (2) निर्धारित किया है, इसलिए यह अंतिम दो दस्तावेज लाएगा।

आउटपुट:

आउटपुट स्पष्ट रूप से दिखाता है कि संग्रह में अंतिम दो दस्तावेज़ प्रदर्शित किए गए हैं। इसलिए हमने स्पष्ट रूप से दिखाया है कि संग्रह में अंतिम 'एन' दस्तावेजों को लाने के लिए, हम पहले दस्तावेजों को अवरोही क्रम में सॉर्ट कर सकते हैं और फिर आवश्यक दस्तावेजों की संख्या 'एन' को वापस करने के लिए लिमिट क्लॉज का उपयोग कर सकते हैं।

नोट : यदि खोज एक स्ट्रिंग पर की जाती है जो कि 38,000 वर्णों से अधिक है, तो यह सही परिणाम प्रदर्शित नहीं करेगा।

सारांश:

पैटर्न मिलान $ रेगेक्स ऑपरेटर द्वारा प्राप्त किया जा सकता है। इस ऑपरेटर का उपयोग संग्रह में कुछ तारों को खोजने के लिए किया जा सकता है।
और $ प्रतीक का उपयोग सटीक पाठ खोजों के लिए के साथ किया जा सकता है जिसका उपयोग यह सुनिश्चित करने के लिए किया जा रहा है कि स्ट्रिंग एक निश्चित चरित्र से शुरू होती है और $ यह सुनिश्चित करने के लिए उपयोग किया जाता है कि स्ट्रिंग एक निश्चित चरित्र के साथ समाप्त होती है।
$ Regex ऑपरेटर के साथ 'i' का उपयोग केस असंवेदनशीलता को निर्दिष्ट करने के लिए किया जा सकता है ताकि स्ट्रिंग्स को खोजा जा सके कि वे निचले मामले में हैं या ऊपरी मामले में।
Delimiters // का उपयोग पैटर्न मिलान के लिए भी किया जा सकता है।
संग्रह में अंतिम एन दस्तावेजों को वापस करने के लिए सॉर्ट और सीमा फ़ंक्शन के संयोजन का उपयोग करें। सॉर्ट फ़ंक्शन का उपयोग अवरोही क्रम में दस्तावेजों को वापस करने के लिए किया जा सकता है जिसके बाद सीमा क्लॉज का उपयोग किए जाने वाले दस्तावेजों की संख्या को सीमित करने के लिए किया जा सकता है।