इस ट्यूटोरियल में, आप सीखेंगे -
- विंडोज में एनएलटीके इंस्टॉल करना
- विंडोज में पायथन स्थापित करना
- मैक / लिनक्स में एनएलटीके स्थापित करना
- एनाकोंडा के माध्यम से एनएलटीके स्थापित करना
- एनएलटीके डेटासेट
- एनएलटीके के सभी पैकेज कैसे डाउनलोड करें
- एनएलपी स्क्रिप्ट चला रहा है
- एनएलटीके स्क्रिप्ट कैसे चलाएं
विंडोज में एनएलटीके इंस्टॉल करना
इस भाग में, हम सीखेंगे कि टर्मिनल के माध्यम से सेटअप एनएलटीके कैसे बनाया जाए (विंडोज़ में कमांड प्रॉम्प्ट)।
नीचे दिए गए निर्देश इस धारणा पर आधारित हैं कि आपके पास अजगर स्थापित नहीं है। तो, पहला कदम अजगर स्थापित करना है।
विंडोज में पायथन स्थापित करना:
चरण 1) लिंक https://www.python.org/downloads/ पर जाएं , और विंडोज़ के लिए नवीनतम संस्करण का चयन करें।
नोट : यदि आप नवीनतम संस्करण डाउनलोड नहीं करना चाहते हैं, तो आप डाउनलोड टैब पर जा सकते हैं और सभी रिलीज़ देख सकते हैं।
चरण 2) डाउनलोड की गई फ़ाइल पर क्लिक करें
चरण 3) स्थापना को अनुकूलित करें का चयन करें
स्टेप 4) NEXT पर क्लिक करें
चरण 5) अगली स्क्रीन में
- उन्नत विकल्पों का चयन करें
- एक कस्टम स्थापित स्थान दें। मेरे मामले में, सी ड्राइव पर एक फ़ोल्डर ऑपरेशन में आसानी के लिए चुना जाता है
- इंस्टॉल पर क्लिक करें
स्टेप 6) इंस्टॉल हो जाने के बाद क्लोज बटन पर क्लिक करें।
चरण 7) अपने लिपियों फ़ोल्डर के पथ की प्रतिलिपि बनाएँ।
चरण 8) विंडोज़ कमांड प्रॉम्प्ट में
- पाइप फ़ोल्डर के स्थान पर नेविगेट करें
- एनएलटीके स्थापित करने के लिए कमांड दर्ज करें
pip3 install nltk
- स्थापना सफलतापूर्वक की जानी चाहिए
नोट : Python2 के लिए कमांडपाइप 2 स्थापित करें nltk का उपयोग करें
चरण 9) विंडोज स्टार्ट मेनू में, पायथनशेल को खोजें और खोलें
चरण 10) आप यह सत्यापित कर सकते हैं कि इंस्टॉलेशन नीचे दिए गए कमांड की आपूर्ति कर रहा है या नहीं
import nltk
यदि आप कोई त्रुटि नहीं देखते हैं, तो स्थापना पूर्ण है।
मैक / लिनक्स में एनएलटीके स्थापित करना
मैक / यूनिक्स में एनएलटीके को स्थापित करने के लिए एनटीकेटी स्थापित करने के लिए अजगर पैकेज मैनेजर पाइप की आवश्यकता होती है। यदि पाइप स्थापित नहीं है, तो प्रक्रिया को पूरा करने के लिए कृपया नीचे दिए गए निर्देशों का पालन करें
Step1) पैकेज कमांड को नीचे कमांड टाइप करके अपडेट करें
sudo apt update
चरण 2) पायथन 3 के लिए पाइप स्थापित करना:
sudo apt install python3-pip
आप easy_install का उपयोग करके भी पाइप स्थापित कर सकते हैं।
sudo apt-get install python-setuptools python-dev build-essential
अब easy_install स्थापित हो गया है। पाइप को स्थापित करने के लिए नीचे दिए गए कमांड को चलाएं
sudo easy_install pip
स्टेप 3) एनएलटीके स्थापित करने के लिए निम्नलिखित कमांड का उपयोग करें
sudo pip install -U nltksudo pip3 install -U nltk
एनाकोंडा के माध्यम से एनएलटीके स्थापित करना
चरण 1) कृपया https://www.anaconda.com/products/inditional पर जाकर एनाकोंडा स्थापित करें (जिसका उपयोग विभिन्न पैकेजों को स्थापित करने के लिए भी किया जा सकता है) करें और एनाकोंडा के लिए आपको कौन से संस्करण को स्थापित करने की आवश्यकता है।
नोट: एनाकोंडा स्थापित करने के लिए विस्तृत चरणों के लिए इस ट्यूटोरियल का संदर्भ लें
चरण 2) एनाकोंडा प्रॉम्प्ट में,
- कमांड दर्ज करें
conda install -c anaconda nltk
- पैकेज अपग्रेड की समीक्षा करें, डाउनग्रेड करें, जानकारी स्थापित करें और हां दर्ज करें
- NLTK डाउनलोड और इंस्टॉल किया गया है
एनएलटीके डेटासेट
NLTK मॉड्यूल में कई डेटासेट उपलब्ध हैं जिनका उपयोग करने के लिए आपको डाउनलोड करना होगा। अधिक तकनीकी रूप से इसे कॉर्पस कहा जाता है । उदाहरण में से कुछ हैं stopwords , गुटेनबर्ग , framenet_v15 , large_grammars और इतने पर।
एनएलटीके के सभी पैकेज कैसे डाउनलोड करें
चरण 1) विंडोज या लिनक्स में पायथन इंटरप्रेटर चलाएं
चरण 2)
- कमांड दर्ज करें
import nltknltk.download ()
- एनएलटीके डाउनलोड की गई विंडो खुलती है। डेटासेट डाउनलोड करने के लिए डाउनलोड बटन पर क्लिक करें। आपके इंटरनेट कनेक्शन के आधार पर इस प्रक्रिया में समय लगेगा
नोट: आप फ़ाइल> परिवर्तन डाउनलोड निर्देशिका पर क्लिक करके डाउनलोड स्थान बदल सकते हैं
चरण 3) स्थापित डेटा का परीक्षण करने के लिए निम्नलिखित कोड का उपयोग करें
>>> from nltk.corpus import brown>>>brown.words()
['द', 'फुल्टन', 'काउंटी', 'ग्रैंड', 'जूरी', 'कहा', ...]
एनएलपी स्क्रिप्ट चला रहा है
हम चर्चा करने जा रहे हैं कि हमारे स्थानीय पीसी पर एनएलपी स्क्रिप्ट को कैसे निष्पादित किया जाएगा। बाजार में प्राकृतिक भाषा प्रसंस्करण के लिए कई पुस्तकालय मौजूद हैं। इसलिए एक पुस्तकालय चुनना आपकी आवश्यकताओं को पूरा करने पर निर्भर करता है। यहां एनएलपी पुस्तकालयों की सूची दी गई है।
एनएलटीके स्क्रिप्ट कैसे चलाएं
Step1) अपने पसंदीदा कोड संपादक में, कोड को कॉपी करें और फ़ाइल को " NLTKsample.py " के रूप में सहेजें।
from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)
कोड स्पष्टीकरण:
- इस कार्यक्रम में, उद्देश्य दिए गए पाठ से सभी प्रकार के विराम चिह्नों को हटाना था। हमने "RegexpTokenizer" का आयात किया जो NLTK का एक मॉड्यूल है। यह सभी अभिव्यक्ति, प्रतीक, चरित्र, संख्यात्मक या किसी भी चीज को हटा देता है जो आप चाहते हैं।
- आपने अभी-अभी "RegexpTokenizer" मॉड्यूल के लिए नियमित अभिव्यक्ति पास की है।
- इसके अलावा, हमने "टोकन" मॉड्यूल का उपयोग करके शब्द को टोकन दिया। आउटपुट "फ़िल्टर्ड टेक्स्ट" चर में संग्रहीत किया जाता है।
- और "प्रिंट" () का उपयोग करके उन्हें मुद्रित किया।
Step2) कमांड प्रॉम्प्ट में
- उस स्थान पर नेविगेट करें जहां आपने फ़ाइल को सहेजा है
- कमांड Python NLTKsample.py चलाएँ
यह आउटपुट को इस प्रकार दिखाएगा:
['हैलो', 'गुरु 99', 'यू', 'है', 'बिल्ड', 'ए', 'वेरी', 'अच्छा', 'साइट', 'और', 'आई', 'लव', '' विजिटिंग ',' योर ',' साइट ']