सुपरवाइज्ड लर्निंग की मुख्य परिभाषा: Supervised learning मशीन लर्निंग में उपयोग की जाने वाली एक तकनीक है जिसमें हम स्वचालित मशीन बनाने के लिए label किए गए dataset का उपयोग करते हैं। Supervised learning का उपयोग प्रशिक्षण डेटा (Training data) को समझने और इसके साथ एक मॉडल बनाने के लिए किया जाता है।
सुपरवाइज्ड लर्निंग एक प्रकार की मशीन लर्निंग (ML) तकनीक है जिसमें मानव की कुछ भागीदारी होती है। एक डेटा वैज्ञानिक सुनिश्चित करता है कि डेटा अच्छी तरह से label किया गया है और उच्च गुणवत्ता (मतलब error free) का है।
नीचे आप Supervised learning के बारे में विस्तार से जानेंगे।
Supervised machine learning
Supervised learning मशीन प्रशिक्षण की एक प्रक्रिया है जिसमें हम labeled डेटा का उपयोग करते हैं। यह training डेटा एक supervisor के रूप में कार्य करता है और मशीन को सही output तक पहुंचने में मदद करता है।
Supervised learning में, मशीन लेबल किए गए डेटासेट के अंदर के डेटा को समझती है और एक ऐसा Model बनाती है जो हमें सही आउटपुट देता है।
डेटा को "Tags" और "Classes" की सहायता से label किया जाता है। इस तरह हम सुपरवाइज्ड लर्निंग में Input और Output दोनों को जानते हैं।
सुपरवाइज्ड लर्निंग एल्गोरिदम output variable (y) के साथ input variable (x) को map करने के लिए मैपिंग फंक्शन ढूंढता है। मैपिंग फ़ंक्शन एक formula है जिसका उपयोग दो Variables या Datasets के बीच संबंध खोजने के लिए किया जाता है।
नीचे Supervised learning का एक उदाहरण दिया गया है ताकि हम इसे और आसानी से समझ सकें।
Example of Supervised Learning
उदाहरण: मान लीजिए कि हमारे पास तीन आकृतियों वाला एक डेटासेट है: Circle, Triangle और Pentagon। हम डेटासेट के अंदर प्रत्येक आकृति को उसके सही नाम से label करते हैं और मशीन को डेटासेट देते हैं। अब हमें प्रत्येक आकृति के लिए मशीन मॉडल को प्रशिक्षित करने की आवश्यकता है।
- यदि दी गई आकृति में शून्य भुजाएँ हैं, और यह गोल है (अर्थात सभी बिंदु केंद्र से समान दूरी पर हैं), तो इसे एक Circle label किया जाएगा।
- यदि दी गई आकृति की तीन भुजाएँ हैं और उसके सभी कोणों का योग 180 डिग्री है, तो इसे Triangle label किया जाएगा।
- यदि दी गई आकृति में पाँच भुजाएँ हैं, तो इसे एक Pentagon label किया जाएगा।
Training डेटा के साथ इसे प्रशिक्षित करने के बाद, हम इसका परीक्षण करने के लिए नए डेटा का उपयोग करेंगे। अगर आउटपुट सही है तो हमारा मशीन लर्निंग मॉडल सफल है।
Types of Supervised Learning
समस्या के अनुसार Supervised learning को two types में विभाजित किया जा सकता है:
1. Classification
Classification का उपयोग तब किया जाता है जब आउटपुट variable निश्चित होता है अर्थात यह हाँ या नहीं हो सकता है। इसका उपयोग तब किया जाता है जब हमें डेटा को वर्गीकृत करना होता है। Classification में दो वर्ग जैसे हाँ-नहीं, पुरुष-महिला, सही-गलत, आदि शामिल हैं।
2. Regression
Regression एल्गोरिदम का उपयोग तब किया जाता है जब किसी स्थिति को प्रभावित करने वाले variables continuously बदलते रहते हैं। इसका उपयोग तब भी किया जाता है जब इनपुट वेरिएबल और आउटपुट वेरिएबल के बीच संबंध होता है। Regression एल्गोरिदम का उपयोग मौसम के पूर्वानुमान, बाजार के रुझान, बिक्री आदि में किया जाता है।
Regression में आउटपुट variable निश्चित नहीं होता है।
यह भी पढ़ें: Supervised vs Unsupervised Learning in HIndi
Advantages of Supervised Learning
- सुपरवाइज्ड लर्निंग तकनीक में उच्च सटीकता होती है क्योंकि मशीन इनपुट और आउटपुट दोनों को जानती है।
- Supervised learning में, मशीन प्रशिक्षण (Training) प्रक्रिया तेज होती है।
- Supervised learning एल्गोरिथ्म हमें छवि वर्गीकरण, चेहरे का पता लगाने, धोखाधड़ी का पता लगाने, स्पैम फ़िल्टरिंग आदि जैसी समस्याओं को हल करने में मदद करता है।
Disadvantages of Supervised Learning
- जब हम Supervised learning में डेटा को label करते हैं, तो डेटा का आकार बढ़ जाता है। दूसरे शब्दों में यह अधिक memory लेता है।
- यह Model जटिल कार्यों को संभालने के लिए उपयुक्त नहीं है।
- यदि नया डेटा training डेटासेट से अलग है, तो Supervised learning सही आउटपुट predict नहीं कर सकता।
मुझे उम्मीद है कि अब आप सुपरवाइज्ड मशीन लर्निंग को समझ गए होंगे। यदि आपके कोई प्रश्न हैं तो आप पूछ सकते हैं।
आपको यह पोस्ट पसंद आया?
अगर हाँ तो इसे अपने दोस्तों के साथ या सोशल मीडिया पर शेयर करें, धन्यवाद।
Comments
Post a Comment