सुपरवाइज्ड मशीन लर्निंग क्या है?
सुपरवाइज़्ड लर्निंग में, आप मशीन को डेटा का उपयोग करके प्रशिक्षित करते हैं जो अच्छी तरह से "लेबल" है । इसका मतलब है कि कुछ डेटा पहले से ही सही उत्तर के साथ टैग किए गए हैं। इसकी तुलना सीखने से की जा सकती है जो पर्यवेक्षक या शिक्षक की उपस्थिति में होता है।
एक पर्यवेक्षित शिक्षण एल्गोरिथ्म लेबल प्रशिक्षण डेटा से सीखता है, आपको अप्रत्याशित डेटा के परिणामों की भविष्यवाणी करने में मदद करता है। सफलतापूर्वक निर्माण, स्केलिंग, और सटीक पर्यवेक्षण मशीन सीखने को तैनात करना डेटा साइंस मॉडल अत्यधिक कुशल डेटा वैज्ञानिकों की एक टीम से समय और तकनीकी विशेषज्ञता लेता है। इसके अलावा, डेटा वैज्ञानिक को यह सुनिश्चित करने के लिए मॉडल को फिर से बनाना होगा कि दी गई अंतर्दृष्टि तब तक सही रहती है जब तक उसका डेटा नहीं बदल जाता।
इस ट्यूटोरियल में, आप सीखेंगे
- सुपरवाइज्ड मशीन लर्निंग क्या है?
- Unsupervised Learning क्या है?
- क्यों सीखना सीखना?
- क्यों अनसुनी सीख दी?
- सुपरवाइज्ड लर्निंग कैसे काम करता है?
- Unsupervised Learning कैसे काम करता है?
- सुपरवाइज्ड मशीन लर्निंग तकनीक के प्रकार
- Unsupervised मशीन लर्निंग तकनीक के प्रकार
- सुपरवाइज्ड बनाम अनसुप्रवाइज्ड लर्निंग
Unsupervised Learning क्या है?
Unsupervised Learning एक मशीन सीखने की तकनीक है, जहाँ आपको मॉडल की देखरेख करने की आवश्यकता नहीं है। इसके बजाय, आपको जानकारी की खोज के लिए मॉडल को स्वयं काम करने की अनुमति देने की आवश्यकता है। यह मुख्य रूप से अनलिस्टेड डेटा से संबंधित है।
पर्यवेक्षित शिक्षण एल्गोरिदम आपको पर्यवेक्षित शिक्षण की तुलना में अधिक जटिल प्रसंस्करण कार्य करने की अनुमति देता है। हालांकि, अन्य प्राकृतिक सीखने की गहरी सीखने और सुदृढीकरण सीखने के तरीकों की तुलना में अप्रकाशित शिक्षा अधिक अप्रत्याशित हो सकती है।
क्यों सीखना सीखना?
- पर्यवेक्षित शिक्षण आपको पिछले अनुभव से डेटा एकत्र करने या डेटा आउटपुट बनाने की अनुमति देता है।
- अनुभव का उपयोग करके प्रदर्शन मानदंड को अनुकूलित करने में आपकी सहायता करता है
- सुपरवाइज्ड मशीन लर्निंग आपको विभिन्न प्रकार की वास्तविक-विश्व संगणना समस्याओं को हल करने में मदद करती है।
क्यों अनसुनी सीख दी?
यहाँ, Unsupervised Learning का उपयोग करने के प्रमुख कारण हैं:
- Unsupervised मशीन लर्निंग से डेटा में सभी प्रकार के अज्ञात पैटर्न मिलते हैं।
- Unsupervised तरीके आपको उन विशेषताओं को खोजने में मदद करते हैं जो वर्गीकरण के लिए उपयोगी हो सकते हैं।
- यह वास्तविक समय में होता है, इसलिए शिक्षार्थियों की उपस्थिति में सभी इनपुट डेटा का विश्लेषण और लेबल किया जाना है।
- लेबल किए गए डेटा की तुलना में कंप्यूटर से अनलिस्टेड डेटा प्राप्त करना आसान है, जिसे मैन्युअल हस्तक्षेप की आवश्यकता होती है।
सुपरवाइज्ड लर्निंग कैसे काम करता है?
उदाहरण के लिए, आप एक मशीन को प्रशिक्षित करने में मदद करना चाहते हैं ताकि आप यह अनुमान लगा सकें कि आपको अपने कार्यस्थल से घर चलाने में कितना समय लगेगा। यहां, आप लेबल किए गए डेटा का एक सेट बनाकर शुरू करते हैं। इस डेटा में शामिल हैं
- मौसम की स्थिति
- दिन के समय
- छुट्टियां
ये सभी विवरण आपके इनपुट हैं। आउटपुट उस विशिष्ट दिन पर घर वापस आने में लगने वाले समय की मात्रा है।
आप सहज रूप से जानते हैं कि अगर बाहर बारिश हो रही है, तो आपको घर चलाने में अधिक समय लगेगा। लेकिन मशीन को डेटा और आंकड़े चाहिए।
आइए अब देखें कि आप इस उदाहरण के पर्यवेक्षित शिक्षण मॉडल को कैसे विकसित कर सकते हैं जो उपयोगकर्ता को कम्यूट समय निर्धारित करने में मदद करता है। पहली चीज जो आपको बनाने की आवश्यकता है वह एक प्रशिक्षण डेटा सेट है। इस प्रशिक्षण सेट में कुल हंगामा समय और इसी तरह के कारक जैसे मौसम, समय आदि शामिल होंगे। इस प्रशिक्षण सेट के आधार पर, आपकी मशीन देख सकती है कि बारिश और घर पहुंचने में लगने वाले समय के बीच सीधा संबंध है।
तो, यह पता चलता है कि जितना अधिक बारिश होगी, उतनी देर आप अपने घर वापस आने के लिए ड्राइविंग करेंगे। यह आपके द्वारा काम छोड़ने के समय और आपके द्वारा सड़क पर आने के समय के बीच संबंध को भी देख सकता है।
आप शाम को 6 बजे के करीब हैं और आपको घर पहुंचने में अधिक समय लगता है। आपके मशीन को आपके लेबल किए गए डेटा के साथ कुछ रिश्ते मिल सकते हैं।
यह आपके डेटा मॉडल की शुरुआत है। यह प्रभावित करना शुरू कर देता है कि बारिश लोगों के ड्राइव करने के तरीके को प्रभावित करती है। यह भी देखने को मिलता है कि दिन के किसी विशेष समय में अधिक लोग यात्रा करते हैं।
Unsupervised Learning कैसे काम करता है?
चलो, एक बच्चे और उसके परिवार के कुत्ते का मामला लें।
वह इस कुत्ते को जानती और पहचानती है। कुछ हफ्तों बाद एक पारिवारिक मित्र कुत्ते के साथ आता है और बच्चे के साथ खेलने की कोशिश करता है।
बेबी ने पहले इस कुत्ते को नहीं देखा है। लेकिन यह कई विशेषताओं को पहचानता है (2 कान, आंखें, 4 पैरों पर चलना) उसके पालतू कुत्ते की तरह हैं। वह कुत्ते की तरह एक नए जानवर की पहचान करता है। यह बिना पढ़ी हुई सीख है, जहाँ आपको पढ़ाया नहीं जाता है, लेकिन आप डेटा से सीखते हैं (इस मामले में कुत्ते के बारे में डेटा।) यदि यह सीखने की निगरानी होती, तो पारिवारिक मित्र ने बच्चे को बताया होता कि यह एक कुत्ता है।
सुपरवाइज्ड मशीन लर्निंग तकनीक के प्रकार
प्रतिगमन:
प्रतिगमन तकनीक प्रशिक्षण डेटा का उपयोग करके एक एकल आउटपुट मूल्य की भविष्यवाणी करता है।
उदाहरण: आप प्रशिक्षण डेटा से घर की कीमत का अनुमान लगाने के लिए प्रतिगमन का उपयोग कर सकते हैं। इनपुट चर स्थानीयता, एक घर का आकार आदि होंगे।
वर्गीकरण:
वर्गीकरण का अर्थ है उत्पादन को एक वर्ग के अंदर समूहित करना। यदि एल्गोरिथ्म इनपुट को दो अलग-अलग वर्गों में लेबल करने की कोशिश करता है, तो इसे बाइनरी वर्गीकरण कहा जाता है। दो से अधिक वर्गों के बीच चयन को मल्टीलैसल वर्गीकरण कहा जाता है।
उदाहरण : यह निर्धारित करना कि कोई ऋण का डिफाल्टर होगा या नहीं।
ताकत : आउटपुट में हमेशा एक संभावित व्याख्या होती है, और ओवरफिटिंग से बचने के लिए एल्गोरिदम को नियमित किया जा सकता है।
कमजोरियाँ : जब कई या गैर-रेखीय निर्णय सीमाएँ होती हैं तो लॉजिस्टिक रिग्रेशन कम हो सकता है। यह विधि लचीली नहीं है, इसलिए यह अधिक जटिल संबंधों पर कब्जा नहीं करती है।
Unsupervised मशीन लर्निंग तकनीक के प्रकार
अव्यवस्थित सीखने की समस्याएं आगे चलकर क्लस्टरिंग और एसोसिएशन की समस्याओं में शामिल हो गईं।
क्लस्टरिंग
अव्यवस्थित सीखने के लिए क्लस्टरिंग एक महत्वपूर्ण अवधारणा है। यह मुख्य रूप से अनियंत्रित डेटा के संग्रह में एक संरचना या पैटर्न खोजने से संबंधित है। क्लस्टरिंग एल्गोरिदम आपके डेटा को संसाधित करेगा और यदि वे डेटा में मौजूद हैं तो प्राकृतिक समूह (समूह) ढूंढेंगे। आप यह भी संशोधित कर सकते हैं कि आपके एल्गोरिदम को कितने समूहों को पहचानना चाहिए। यह आपको इन समूहों की ग्रैन्युलैरिटी को समायोजित करने की अनुमति देता है।
संगति
एसोसिएशन के नियम आपको बड़े डेटाबेस के अंदर डेटा ऑब्जेक्ट्स के बीच जुड़ाव स्थापित करने की अनुमति देते हैं। यह अनुपयोगी तकनीक बड़े डेटाबेस में चर के बीच रोमांचक संबंधों की खोज करने के बारे में है। उदाहरण के लिए, जो लोग एक नया घर खरीदते हैं, वे नए फर्नीचर खरीदने की सबसे अधिक संभावना रखते हैं।
अन्य उदाहरण:
- कैंसर रोगियों का एक उपसमूह उनके जीन अभिव्यक्ति माप द्वारा समूहीकृत
- उनके ब्राउज़िंग और क्रय इतिहास के आधार पर दुकानदार के समूह
- मूवी दर्शकों द्वारा दी गई रेटिंग द्वारा मूवी समूह
सुपरवाइज्ड बनाम अनसुप्रवाइज्ड लर्निंग
मापदंडों | सुपरवाइज्ड मशीन लर्निंग तकनीक | Unsupervised मशीन सीखने की तकनीक |
प्रोसेस | एक पर्यवेक्षित शिक्षण मॉडल में, इनपुट और आउटपुट चर दिए जाएंगे। | बिना पढ़े हुए मॉडल में, केवल इनपुट डेटा दिया जाएगा |
इनपुट डेटा | एल्गोरिदम को लेबल किए गए डेटा का उपयोग करके प्रशिक्षित किया जाता है। | एल्गोरिदम का उपयोग उन डेटा के खिलाफ किया जाता है जो लेबल नहीं है |
एल्गोरिदम का इस्तेमाल किया | समर्थन वेक्टर मशीन, तंत्रिका नेटवर्क, रैखिक और रसद प्रतिगमन, यादृच्छिक वन, और वर्गीकरण पेड़। | Unsupervised एल्गोरिदम को विभिन्न श्रेणियों में विभाजित किया जा सकता है: जैसे क्लस्टर एल्गोरिदम, K- साधन, श्रेणीबद्ध क्लर्किंग, आदि। |
अभिकलनात्मक जटिलता | सुपरवाइज्ड लर्निंग एक सरल विधि है। | अनसुचित शिक्षा कम्प्यूटेशनल रूप से जटिल है |
डेटा का उपयोग | पर्यवेक्षित शिक्षण मॉडल इनपुट और आउटपुट के बीच एक लिंक जानने के लिए प्रशिक्षण डेटा का उपयोग करता है। | अनउपलब्ध शिक्षण आउटपुट डेटा का उपयोग नहीं करता है। |
परिणामों की सटीकता | बेहद सटीक और भरोसेमंद तरीका। | कम सटीक और भरोसेमंद तरीका। |
रियल टाइम लर्निंग | सीखने की विधि ऑफ़लाइन होती है। | सीखने की विधि वास्तविक समय में होती है। |
वर्गों की संख्या | वर्गों की संख्या ज्ञात है। | कक्षाओं की संख्या ज्ञात नहीं है। |
मुख्य दोष | बड़े डेटा को वर्गीकृत करना सुपरवाइज्ड लर्निंग में एक वास्तविक चुनौती हो सकती है। | आपको डेटा सॉर्टिंग के बारे में सटीक जानकारी नहीं मिल सकती है, और बिना पढ़े हुए डेटा में उपयोग किए गए डेटा को लेबल किया गया है और ज्ञात नहीं है। |
सारांश
- सुपरवाइज्ड लर्निंग में, आप मशीन को डेटा का उपयोग करके प्रशिक्षित करते हैं जो अच्छी तरह से "लेबल" है।
- Unsupervised Learning एक मशीन सीखने की तकनीक है, जहाँ आपको मॉडल की देखरेख करने की आवश्यकता नहीं है।
- पर्यवेक्षित शिक्षण आपको पिछले अनुभव से डेटा एकत्र करने या डेटा आउटपुट बनाने की अनुमति देता है।
- Unsupervised मशीन लर्निंग आपको डेटा में सभी प्रकार के अज्ञात पैटर्न खोजने में मदद करती है।
- उदाहरण के लिए, आप मौसम की स्थिति, दिन के समय और छुट्टी के आधार पर वापस आने के लिए निर्धारित समय का निर्धारण करने में सक्षम होंगे।
- उदाहरण के लिए, बेबी पिछले पर्यवेक्षित शिक्षण के आधार पर अन्य कुत्तों की पहचान कर सकता है।
- प्रतिगमन और वर्गीकरण दो प्रकार की पर्यवेक्षित मशीन सीखने की तकनीक है।
- क्लस्टरिंग एंड एसोसिएशन दो प्रकार के अनसुप्रोस्ड लर्निंग हैं।
- पर्यवेक्षित शिक्षण मॉडल में, इनपुट और आउटपुट वेरिएबल्स दिए जाएंगे जबकि अनुपयोगी शिक्षण मॉडल के साथ, केवल इनपुट डेटा दिया जाएगा।