आज हम Machine Learning के बारे में जानेंगे, मशीनों को प्रशिक्षित करने के लिए इस्तेमाल की जाने वाली मशीन लर्निंग के प्रकार, मशीन लर्निंग के अनुप्रयोग, और भी बहुत कुछ। तो पढ़ते रहिये।
मशीन लर्निंग क्या है? मशीन लर्निंग एक ऐसा शब्द है जिसका उपयोग मशीन द्वारा बिना किसी मानवीय हस्तक्षेप के किसी कार्य को करने के तरीके सीखने की प्रक्रिया का वर्णन करने के लिए किया जाता है। आप इसे ऐसे देख सकते हैं जैसे इंसान कुछ नया करना सीखता है। उदाहरण के लिए: गणितीय समस्या को हल करना, बोलना सीखना, चेहरा पहचानना आदि।
मशीन लर्निंग में हम केवल मशीन एल्गोरिदम को डेटा प्रदान करते हैं। मशीन खुद सीखती है कि डेटा को कैसे समझना है और उसका उपयोग कैसे करना है।
दूसरे शब्दों में, आप कह सकते हैं कि मशीन लर्निंग में, हम एक एल्गोरिथम बनाते हैं जो मानव मस्तिष्क की तरह निर्णय लेने और सोचने में सक्षम है। हम मशीन के व्यवहार को कुछ हद तक नियंत्रित कर सकते हैं।
मशीन लर्निंग के लिए दो मुख्य प्रोग्रामिंग भाषाओं का उपयोग किया जाता है: Python और R।
आइए अब Machine learning kya hai जाने:
Machine learning kya hai?
Machine learning: मशीन लर्निंग (ML) किसी कंप्यूटर या मशीन की अपने अनुभव के साथ बिना किसी मानवीय हस्तक्षेप के अपने आप सीखने की क्षमता है।
मशीन लर्निंग एल्गोरिदम किसी कार्य को करने के लिए प्रशिक्षण-डेटा की मदद से एक मॉडल बनाता है।
मशीन लर्निंग में हम मशीन को उच्च गुणवत्ता वाला डेटा प्रदान करते हैं।
हम कौन से एल्गोरिदम का उपयोग करते हैं, यह हमारे पास मौजूद डेटा के प्रकार और उस कार्य से निर्धारित होता है जिसे हम स्वचालित(Automate) करने का प्रयास कर रहे हैं।
History
मशीन लर्निंग शब्द Arthur Samuel ने 1959 में दिया था। वह IBM के एक कर्मचारी थे।
रेथियॉन कंपनी ने 1960 के दशक की शुरुआत में सुदृढीकरण सीखने (reinforcement learning) का उपयोग करके सोनार संकेतों और भाषण पैटर्न का विश्लेषण करने के लिए साइबरट्रॉन (छिद्रित टेप मेमोरी के साथ एक सीखने की मशीन) विकसित की।
Tom Mitchell
Tom Michael Mitchell (Tom M. Mitchell) एक कंप्यूटर वैज्ञानिक हैं और कार्नेगी मेलन विश्वविद्यालय (CMU) में मशीन लर्निंग विभाग के पूर्व अध्यक्ष हैं।
Tom Mitchell ने मशीन लर्निंग, आर्टिफिशियल इंटेलिजेंस और कॉग्निटिव न्यूरोसाइंस (cognitive neuroscience) की उन्नति (advancement) में योगदान दिया। वह पाठ्यपुस्तक "मशीन लर्निंग" के लेखक हैं।
टॉम मिशेल द्वारा मशीन लर्निंग की परिभाषा निम्नलिखित है:
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
Machine learning Model
मशीन को प्रशिक्षित करने के लिए मशीन लर्निंग में Model बनाए जाते हैं। एल्गोरिदम प्रशिक्षण डेटा की मदद से मॉडल (गणितीय मॉडल) बनाते हैं।
किसी कार्य को पूरा करने के लिए मशीन लर्निंग में विभिन्न मॉडलों का उपयोग किया जाता है।
मशीन लर्निंग के प्रकार - Types of Machine Learning
मशीन लर्निंग को चार मुख्य श्रेणियों में बांटा गया है। ये श्रेणियां "सिग्नल" या "फीडबैक" के प्रकार पर निर्भर करती हैं जो हम लर्निंग मशीन या सिस्टम को देते हैं। मशीन लर्निंग के प्रकार नीचे दिए गए हैं:
- Supervised Learning
- Unsupervised Learning
- Reinforcement Learning
- Semi-supervised Learning
मशीन को स्वचालित रूप से अपना काम करने के लिए प्रशिक्षित करने के लिए प्रत्येक तकनीक अलग तरह से काम करती है।
आइए अब इन तकनीकों के बारे में और विस्तार से जानें।
Supervised Learning kya hai?
Supervised Machine Learning में, मशीन को अच्छी तरह से "labelled" डेटा इनपुट दिए जाते हैं और इस इनपुट के आधार पर, यह एक मॉडल बनाता है।
जब हम दिए गए डेटा के आधार पर कोई प्रश्न पूछते हैं, तो मशीन उत्तर का अनुमान लगा लेती है।
इस लर्निंग एल्गोरिथम में, लेबल किए गए डेटा का मतलब है कि हमने मशीन को "Tags" या "Classes" का उपयोग करके सही उत्तर के साथ डेटा प्रदान किया है।
प्रशिक्षण डेटा की मदद से, मशीन किसी दिए गए प्रश्न के लिए सही आउटपुट की भविष्यवाणी कर सकती है। इस तरह, प्रशिक्षण डेटा पर्यवेक्षक(Observer) के रूप में कार्य करता है। यह उस स्थिति के समान है जहां आप किसी परीक्षा में प्रश्न का उत्तर जानते हैं।
Supervised Machine Learning मॉडल को इनपुट डेटा के साथ सही आउटपुट डेटा प्रदान करने की एक प्रक्रिया है।
Supervised मशीन लर्निंग तकनीक के बारे में अधिक जानें।
Unsupervised Learning kya hai?
Unsupervised Machine Learning एक प्रकार का एल्गोरिथम है जिसमें हम मशीन को "unlabelled" डेटा इनपुट प्रदान करते हैं।
मॉडल मानवीय हस्तक्षेप के बिना दिए गए डेटा से छिपे हुए पैटर्न और अंतर्दृष्टि(Insights) ढूंढता है।
आप इसकी तुलना तब कर सकते हैं जब मानव नई चीजें सीखता है, जहां मानव मस्तिष्क पैटर्न और अर्थ ढूंढता है। इसमें एक एल्गोरिथम बिना किसी संबद्ध फीडबैक के उदाहरणों से सीखता है।
इस प्रकार का एल्गोरिथम डेटा को उसकी समझ के आधार पर reorganize करता है।
इसे एक उदाहरण से समझते हैं:-
जैसा कि आप नीचे दी गई तस्वीर में देख सकते हैं, हमारे पास दो प्रकार के आकार के साथ एक प्रशिक्षण डेटा सेट है: त्रिकोण और वर्ग।
यहां डेटा "unlabelled" है, इसलिए मशीन को यह नहीं पता कि यह किस प्रकार का डेटा है। इसलिए मॉडल प्रशिक्षण डेटा में पाए गए पैटर्न के आधार पर डेटा को दो अलग-अलग सेटों में फिर से संगठित करता है।
Reinforcement Learning kya hai?
Reinforcement Machine Learning में, हम मशीन को "unlabeled" डेटा देते हैं, जो Unsupervised Machine Learning के समान है।
लेकिन यहां, आप एल्गोरिदम द्वारा प्रस्तावित समाधान के आधार पर सकारात्मक (+) या नकारात्मक (-) प्रतिक्रिया प्रदान कर सकते हैं।
Reinforcement learning में, एल्गोरिदम को परिणामों के साथ निर्णय लेना चाहिए। यह प्रक्रिया उसी तरह है जैसे आप परीक्षण और त्रुटि से सीखते हैं।
Semi-Supervised Learning kya hai?
Semi-supervised machine learning एक एल्गोरिथ्म है जो प्रशिक्षण के दौरान बड़ी मात्रा में "unlabelled" डेटा के साथ "labeled" डेटा की एक छोटी मात्रा को जोड़ती है।
Semi-supervised learning Unsupervised learning (labeled प्रशिक्षण डेटा के बिना) और Supervised learning (केवल labeled प्रशिक्षण डेटा के साथ) के बीच आता है।
लेबल रहित डेटा की एक बड़ी मात्रा में लेबल किए गए डेटा की एक छोटी मात्रा को जोड़ने से सीखने की सटीकता में काफी सुधार हो सकता है।
मशीन लर्निंग कैसे काम करती है? - How machine learning works?
1. Data Collection
सबसे पहले हम किसी भी रूप में डेटा एकत्र करते हैं। डेटा की गुणवत्ता जितनी अधिक होगी, मॉडलिंग के लिए उतना ही बेहतर होगा। यहां उच्च गुणवत्ता वाले डेटा का अर्थ है बिना किसी त्रुटि के करीब डेटा।
2. Data Processing
इस चरण में, हम डेटा में गुम या गलत मान जैसी त्रुटियों को ठीक करते हैं।
यदि डेटा text या image फॉर्म में है, तो इसे न्यूमेरिक फॉर्म में बदलना होगा, चाहे वह list हो या array, या मैट्रिक्स। दूसरे शब्दों में, डेटा को relevant और consistent बनाया जाता है। हम डेटा को उस प्रारूप(format) में बदलते हैं जिसे मशीन समझ सकती है।
3. Dividing the Data Input
यहां हम इनपुट डेटा को training, cross-validation और test सेट में विभाजित करते हैं। इन संबंधित सेटों के बीच का अनुपात 6:2:2 होना चाहिए।
4. Building Models
इस चरण में, हम उपयुक्त एल्गोरिदम और तकनीकों के साथ मॉडल बनाते हैं।
5. Testing
यहां हम डेटा के साथ अपने मॉडल का परीक्षण करते हैं और F1 स्कोर, सटीक और रिकॉल जैसे metrics का उपयोग करके इसके प्रदर्शन(Performance) का मूल्यांकन करते हैं।
मशीन लर्निंग एल्गोरिथम
एल्गोरिथम नियमों का एक समूह है जो किसी कंप्यूटर या मशीन को किसी कार्य को करते समय या किसी समस्या को हल करते समय पालन करना चाहिए।
आमतौर पर इस्तेमाल होने वाले मशीन लर्निंग एल्गोरिदम की सूची नीचे दी गई है:-
- Linear Regression
- Logistics Regression
- Decision Tree
- SVM
- Naive Bayes
- K-Nearest Neighbor
- K-Means
- Random Forest
- Dimensionality Reduction Algorithms
- Gradient Boosting Algorithms
Artificial neural networks
Artificial neural networks (ANNs) जैविक तंत्रिका नेटवर्क से प्रेरित है। इसे इसलिए बनाया गया है ताकि मशीन मानव मस्तिष्क की तरह किसी समस्या का समाधान कर सके। यह एक मशीन लर्निंग मॉडल है।
ANN मॉडल एक दूसरे से जुड़े नोड्स के संग्रह पर आधारित है। ये नोड न्यूरॉन्स के रूप में कार्य करते हैं और इन्हें "कृत्रिम न्यूरॉन्स" कहा जाता है। प्रत्येक कनेक्शन सूचना प्रसारित कर सकता है। जैसे एक कृत्रिम न्यूरॉन से दूसरे में सिग्नल संचारित करना।
ANN में "ट्रांसमिटेड-सिग्नल" एक वास्तविक संख्या (real number) है और प्रत्येक कृत्रिम न्यूरॉन के आउटपुट की गणना इसके इनपुट के योग के "गैर-रैखिक" फ़ंक्शन द्वारा की जाती है।
Artificial neural networks का उपयोग computer vision, speech recognition, translation और social networks में किया जाता है।
Decision trees
डिसीजन ट्री मशीन लर्निंग मॉडल डिसीजन ट्री पर आधारित है जहां ट्री-लीव्स क्लास लेबल्स का प्रतिनिधित्व करते हैं और ट्री-ब्रांच उन विशेषताओं के संयोजन का प्रतिनिधित्व करते हैं जो उन क्लास लेबल्स की ओर ले जाते हैं।
Support-vector machines
Support-vector machines (SVMs) को सपोर्ट-वेक्टर नेटवर्क के रूप में भी जाना जाता है। ये मशीनें या नेटवर्क संबंधित supervised learning विधियों का एक समूह हैं जिनका उपयोग classification और regression के लिए किया जाता है।
यह एल्गोरिदम एक मॉडल बनाता है जो predict करता है कि कोई नया मान एक श्रेणी या दूसरे में आता है या नहीं।
Regression analysis
Regression analysis में हम मूल्यों के बीच संबंध जानने के लिए विभिन्न गणितीय विधियों का उपयोग करते हैं।
सबसे आम regression analysis उदाहरण रैखिक प्रतिगमन (linear regression) है, जहां दिए गए डेटा को गणितीय मानदंड (जैसे सामान्य न्यूनतम वर्ग) के अनुसार सर्वोत्तम संभव तरीके से विभाजित करने के लिए एक एकल रेखा खींची जाती है।
Genetic algorithms
Genetic algorithm (GA) एक खोज एल्गोरिथम और समस्या समाधान तकनीक (हेयुरिस्टिक तकनीक) है जो प्राकृतिक चयन की प्रक्रिया की तरह काम करता है।
इसका इस्तेमाल 1980 और 1990 के दशक में किया गया था।
मशीन लर्निंग में प्रयुक्त Python libraries
Supervised और Unsupervised मशीन लर्निंग के बीच अंतर
Unsupervised Machine Learning: | Supervised Machine Learning: |
इस प्रकार की मशीन लर्निंग में, हम unlabeled डेटा का उपयोग करते हैं। | इस प्रकार की मशीन लर्निंग में, हम labeled डेटा का उपयोग करते हैं। |
यहां, मशीन सही आउटपुट के बारे में नहीं जानती है। | यहां, मशीन को सही आउटपुट के बारे में पता होता है। |
यह supervised machine learning से कम सटीक है। | यह Unsupervised machine learning से ज्यादा सटीक है। |
इसमें Clustering और Associations की समस्याएं शामिल हैं। | इसमें Classification और Regression समस्याएं शामिल हैं। |
यहां हमारे पास केवल इनपुट है। | यहां हमारे पास इनपुट और आउटपुट दोनों हैं। |
Supervised और Unsupervised learning के बीच अंतर के बारे में अधिक जानें।
मशीन लर्निंग के अनुप्रयोग हिंदी में
मशीन लर्निंग के कई अनुप्रयोग हैं। उनमें से कुछ नीचे दिए गए हैं:
- Web Search Engines: आप वेब सर्च इंजन जैसे Google, Bing, Yahoo, आदि में मशीन लर्निंग के अनुप्रयोग(application) को देख सकते हैं। यहाँ वे आपकी query को समझते हैं और relevant परिणाम प्रदान करते हैं।
- Spam Detector: जब आप Gmail में स्पैम ईमेल प्राप्त करते हैं, तो यह स्वचालित रूप से मशीन लर्निंग की मदद से स्पैम सेक्शन में चला जाता है।
- Face Recognition/ Handwriting Recognition: आप मशीन को पर्याप्त डेटा प्रदान करके किसी व्यक्ति के चेहरे और लिखावट की पहचान के लिए मशीन लर्निंग का भी उपयोग कर सकते हैं।
- Virtual Assistant(Artificial Intelligence): Google Assistant, Siri, Cortana, और Alexa इंटरनेट पर कई निजी वर्चुअल असिस्टेंट उपलब्ध हैं जो आपको इंटरनेट पर कोई भी जानकारी खोजने में मदद करते हैं। वे इंटरनेट पर खोज करते हैं और आपके द्वारा पूछे गए प्रश्न के लिए relevant परिणाम प्रदान करते हैं। वे आपका काम बहुत तेजी से पूरा करते हैं। वे डेटा एकत्र करने और refine करने के लिए मशीन लर्निंग का उपयोग करते हैं ताकि परिणाम आपके लिए यथासंभव relevant हों। वे खुद को बेहतर बनाने के लिए पिछले अनुभवों, पिछले प्रश्नों, आप क्या खोजते हैं और ऐप्स के अन्य डेटा से सीखते हैं।
- Social Media Services: Facebook, Instagram और Reddit जैसे सोशल मीडिया प्लेटफॉर्म अत्यधिक व्यस्त पोस्ट की सिफारिश(recommend) करने के लिए मशीन लर्निंग का उपयोग करते हैं ताकि अधिक उपयोगकर्ता उन्हें देख सकें। वे इसका उपयोग आपको आपकी पिछली कार्रवाइयों(actions) से संबंधित विज्ञापन दिखाने के लिए करते हैं।
मशीन लर्निंग के फायदे:
- मशीन लर्निंग बड़ी मात्रा में डेटा की समीक्षा कर सकता है और विशिष्ट रुझानों और पैटर्न की खोज कर सकता है जिन्हें मनुष्य पहचान नहीं सकते हैं।
- मशीन लर्निंग की मदद से आपको हर कदम पर कंप्यूटर को निर्देश देने की जरूरत नहीं है। आपको केवल परिणाम की जांच करने की आवश्यकता है, जो आपके द्वारा प्रदान किए गए डेटा के साथ मशीन द्वारा स्वचालित रूप से उत्पन्न हो जाएगा।
- जैसे-जैसे समय बीतता है और मशीन लर्निंग एल्गोरिदम अनुभव प्राप्त करते हैं, वे अपनी निर्णय लेने की शक्ति और सटीकता में सुधार करना जारी रखेंगे।
मशीन लर्निंग के नुकसान:
- मशीन लर्निंग एल्गोरिदम को बड़ी मात्रा में डेटा की आवश्यकता होती है, और एल्गोरिथम को और बेहतर बनाने के लिए यह डेटा उच्च गुणवत्ता का होना चाहिए।
- मशीन लर्निंग एल्गोरिदम को उनके सुधार के लिए समय की आवश्यकता होती है।
- मशीन लर्निंग त्रुटियों के प्रति अत्यधिक संवेदनशील है। यदि एक भी त्रुटि होती है, तो आपको पूरी तरह से अलग परिणाम मिलेगा।
FAQ About Machine Learning:
प्रश्न: Machine learning kya hai?
उत्तर: मशीन लर्निंग किसी कंप्यूटर या मशीन की अपने अनुभव के साथ बिना किसी मानवीय हस्तक्षेप के अपने आप सीखने की क्षमता है।
प्रश्न: मशीन लर्निंग के प्रकार क्या हैं?
उत्तर: मशीन लर्निंग के 4 प्रकार हैं: 1. सुपरवाइज्ड लर्निंग, 2. अनसुपरवाइज्ड लर्निंग, 3. सेमी-सुपरवाइज्ड लर्निंग, 4. रीइन्फोर्समेंट लर्निंग।
प्रश्न: मशीन लर्निंग (ML) और आर्टिफिशियल इंटेलिजेंस (AI) में क्या अंतर है?
उत्तर: आर्टिफिशियल इंटेलिजेंस एक कंप्यूटर की मनुष्य की तरह सोचने और कार्य करने की क्षमता है। मशीन लर्निंग का उपयोग कंप्यूटर में उस इंटेलिजेंस को विकसित करने के लिए किया जाता है। आर्टिफिशियल इंटेलिजेंस मशीन लर्निंग का एक हिस्सा है।
अब आप जानते हैं कि machine learning kya hai?
आपका इस पोस्ट के बारे में क्या विचार है?
यदि आपके कोई प्रश्न हैं, तो कृपया उन्हें टिप्पणी अनुभाग में छोड़ दें। अगर आप मशीन लर्निंग पर और पोस्ट चाहते हैं, तो आप मुझे कमेंट सेक्शन में बता सकते हैं। मुझे उम्मीद है कि यह पोस्ट आपको वह बताएगी जो आप मशीन लर्निंग के बारे में जानना चाहते हैं। धन्यवाद।
Comments
Post a Comment