Machine learning kya hai?

आज हम Machine Learning के बारे में जानेंगे, मशीनों को प्रशिक्षित करने के लिए इस्तेमाल की जाने वाली मशीन लर्निंग के प्रकार, मशीन लर्निंग के अनुप्रयोग, और भी बहुत कुछ। तो पढ़ते रहिये।

मशीन लर्निंग क्या है? मशीन लर्निंग एक ऐसा शब्द है जिसका उपयोग मशीन द्वारा बिना किसी मानवीय हस्तक्षेप के किसी कार्य को करने के तरीके सीखने की प्रक्रिया का वर्णन करने के लिए किया जाता है। आप इसे ऐसे देख सकते हैं जैसे इंसान कुछ नया करना सीखता है। उदाहरण के लिए: गणितीय समस्या को हल करना, बोलना सीखना, चेहरा पहचानना आदि।

मशीन लर्निंग में हम केवल मशीन एल्गोरिदम को डेटा प्रदान करते हैं। मशीन खुद सीखती है कि डेटा को कैसे समझना है और उसका उपयोग कैसे करना है।

दूसरे शब्दों में, आप कह सकते हैं कि मशीन लर्निंग में, हम एक एल्गोरिथम बनाते हैं जो मानव मस्तिष्क की तरह निर्णय लेने और सोचने में सक्षम है। हम मशीन के व्यवहार को कुछ हद तक नियंत्रित कर सकते हैं।

मशीन लर्निंग के लिए दो मुख्य प्रोग्रामिंग भाषाओं का उपयोग किया जाता है: Python और R।

आइए अब Machine learning kya hai जाने:

Machine learning: मशीन लर्निंग (ML) किसी कंप्यूटर या मशीन की अपने अनुभव के साथ बिना किसी मानवीय हस्तक्षेप के अपने आप सीखने की क्षमता है।

मशीन लर्निंग एल्गोरिदम किसी कार्य को करने के लिए प्रशिक्षण-डेटा की मदद से एक मॉडल बनाता है।

मशीन लर्निंग में हम मशीन को उच्च गुणवत्ता वाला डेटा प्रदान करते हैं।

हम कौन से एल्गोरिदम का उपयोग करते हैं, यह हमारे पास मौजूद डेटा के प्रकार और उस कार्य से निर्धारित होता है जिसे हम स्वचालित(Automate) करने का प्रयास कर रहे हैं।

History

मशीन लर्निंग शब्द Arthur Samuel ने 1959 में दिया था। वह IBM के एक कर्मचारी थे।

रेथियॉन कंपनी ने 1960 के दशक की शुरुआत में सुदृढीकरण सीखने (reinforcement learning) का उपयोग करके सोनार संकेतों और भाषण पैटर्न का विश्लेषण करने के लिए साइबरट्रॉन (छिद्रित टेप मेमोरी के साथ एक सीखने की मशीन) विकसित की।

Machine learning vs traditional learning

Tom Mitchell

Tom Michael Mitchell (Tom M. Mitchell) एक कंप्यूटर वैज्ञानिक हैं और कार्नेगी मेलन विश्वविद्यालय (CMU) में मशीन लर्निंग विभाग के पूर्व अध्यक्ष हैं।

Tom Mitchell ने मशीन लर्निंग, आर्टिफिशियल इंटेलिजेंस और कॉग्निटिव न्यूरोसाइंस (cognitive neuroscience) की उन्नति (advancement) में योगदान दिया। वह पाठ्यपुस्तक "मशीन लर्निंग" के लेखक हैं।

टॉम मिशेल द्वारा मशीन लर्निंग की परिभाषा निम्नलिखित है:

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

Machine learning Model

मशीन को प्रशिक्षित करने के लिए मशीन लर्निंग में Model बनाए जाते हैं। एल्गोरिदम प्रशिक्षण डेटा की मदद से मॉडल (गणितीय मॉडल) बनाते हैं।

किसी कार्य को पूरा करने के लिए मशीन लर्निंग में विभिन्न मॉडलों का उपयोग किया जाता है।

मशीन लर्निंग के प्रकार - Types of Machine Learning

मशीन लर्निंग को चार मुख्य श्रेणियों में बांटा गया है। ये श्रेणियां "सिग्नल" या "फीडबैक" के प्रकार पर निर्भर करती हैं जो हम लर्निंग मशीन या सिस्टम को देते हैं। मशीन लर्निंग के प्रकार नीचे दिए गए हैं:

Supervised Learning
Unsupervised Learning
Reinforcement Learning
Semi-supervised Learning

मशीन को स्वचालित रूप से अपना काम करने के लिए प्रशिक्षित करने के लिए प्रत्येक तकनीक अलग तरह से काम करती है।

आइए अब इन तकनीकों के बारे में और विस्तार से जानें।

Supervised Learning kya hai?

Supervised Machine Learning में, मशीन को अच्छी तरह से "labelled" डेटा इनपुट दिए जाते हैं और इस इनपुट के आधार पर, यह एक मॉडल बनाता है।

जब हम दिए गए डेटा के आधार पर कोई प्रश्न पूछते हैं, तो मशीन उत्तर का अनुमान लगा लेती है।

इस लर्निंग एल्गोरिथम में, लेबल किए गए डेटा का मतलब है कि हमने मशीन को "Tags" या "Classes" का उपयोग करके सही उत्तर के साथ डेटा प्रदान किया है।

प्रशिक्षण डेटा की मदद से, मशीन किसी दिए गए प्रश्न के लिए सही आउटपुट की भविष्यवाणी कर सकती है। इस तरह, प्रशिक्षण डेटा पर्यवेक्षक(Observer) के रूप में कार्य करता है। यह उस स्थिति के समान है जहां आप किसी परीक्षा में प्रश्न का उत्तर जानते हैं।

Supervised Machine Learning मॉडल को इनपुट डेटा के साथ सही आउटपुट डेटा प्रदान करने की एक प्रक्रिया है।

Supervised मशीन लर्निंग तकनीक के बारे में अधिक जानें।

Unsupervised Learning kya hai?

Unsupervised Machine Learning एक प्रकार का एल्गोरिथम है जिसमें हम मशीन को "unlabelled" डेटा इनपुट प्रदान करते हैं।

मॉडल मानवीय हस्तक्षेप के बिना दिए गए डेटा से छिपे हुए पैटर्न और अंतर्दृष्टि(Insights) ढूंढता है।

आप इसकी तुलना तब कर सकते हैं जब मानव नई चीजें सीखता है, जहां मानव मस्तिष्क पैटर्न और अर्थ ढूंढता है। इसमें एक एल्गोरिथम बिना किसी संबद्ध फीडबैक के उदाहरणों से सीखता है।

इस प्रकार का एल्गोरिथम डेटा को उसकी समझ के आधार पर reorganize करता है।

इसे एक उदाहरण से समझते हैं:-

जैसा कि आप नीचे दी गई तस्वीर में देख सकते हैं, हमारे पास दो प्रकार के आकार के साथ एक प्रशिक्षण डेटा सेट है: त्रिकोण और वर्ग।

यहां डेटा "unlabelled" है, इसलिए मशीन को यह नहीं पता कि यह किस प्रकार का डेटा है। इसलिए मॉडल प्रशिक्षण डेटा में पाए गए पैटर्न के आधार पर डेटा को दो अलग-अलग सेटों में फिर से संगठित करता है।

Reinforcement Learning kya hai?

Reinforcement Machine Learning में, हम मशीन को "unlabeled" डेटा देते हैं, जो Unsupervised Machine Learning के समान है।

लेकिन यहां, आप एल्गोरिदम द्वारा प्रस्तावित समाधान के आधार पर सकारात्मक (+) या नकारात्मक (-) प्रतिक्रिया प्रदान कर सकते हैं।

Reinforcement learning में, एल्गोरिदम को परिणामों के साथ निर्णय लेना चाहिए। यह प्रक्रिया उसी तरह है जैसे आप परीक्षण और त्रुटि से सीखते हैं।

Semi-Supervised Learning kya hai?

Semi-supervised machine learning एक एल्गोरिथ्म है जो प्रशिक्षण के दौरान बड़ी मात्रा में "unlabelled" डेटा के साथ "labeled" डेटा की एक छोटी मात्रा को जोड़ती है।

Semi-supervised learning Unsupervised learning (labeled प्रशिक्षण डेटा के बिना) और Supervised learning (केवल labeled प्रशिक्षण डेटा के साथ) के बीच आता है।

लेबल रहित डेटा की एक बड़ी मात्रा में लेबल किए गए डेटा की एक छोटी मात्रा को जोड़ने से सीखने की सटीकता में काफी सुधार हो सकता है।

मशीन लर्निंग कैसे काम करती है? - How machine learning works?

1. Data Collection

सबसे पहले हम किसी भी रूप में डेटा एकत्र करते हैं। डेटा की गुणवत्ता जितनी अधिक होगी, मॉडलिंग के लिए उतना ही बेहतर होगा। यहां उच्च गुणवत्ता वाले डेटा का अर्थ है बिना किसी त्रुटि के करीब डेटा।

2. Data Processing

इस चरण में, हम डेटा में गुम या गलत मान जैसी त्रुटियों को ठीक करते हैं।

यदि डेटा text या image फॉर्म में है, तो इसे न्यूमेरिक फॉर्म में बदलना होगा, चाहे वह list हो या array, या मैट्रिक्स। दूसरे शब्दों में, डेटा को relevant और consistent बनाया जाता है। हम डेटा को उस प्रारूप(format) में बदलते हैं जिसे मशीन समझ सकती है।

3. Dividing the Data Input

यहां हम इनपुट डेटा को training, cross-validation और test सेट में विभाजित करते हैं। इन संबंधित सेटों के बीच का अनुपात 6:2:2 होना चाहिए।

4. Building Models

इस चरण में, हम उपयुक्त एल्गोरिदम और तकनीकों के साथ मॉडल बनाते हैं।

5. Testing

यहां हम डेटा के साथ अपने मॉडल का परीक्षण करते हैं और F1 स्कोर, सटीक और रिकॉल जैसे metrics का उपयोग करके इसके प्रदर्शन(Performance) का मूल्यांकन करते हैं।

मशीन लर्निंग एल्गोरिथम

एल्गोरिथम नियमों का एक समूह है जो किसी कंप्यूटर या मशीन को किसी कार्य को करते समय या किसी समस्या को हल करते समय पालन करना चाहिए।

आमतौर पर इस्तेमाल होने वाले मशीन लर्निंग एल्गोरिदम की सूची नीचे दी गई है:-

Linear Regression
Logistics Regression
Decision Tree
SVM
Naive Bayes
K-Nearest Neighbor
K-Means
Random Forest
Dimensionality Reduction Algorithms
Gradient Boosting Algorithms

Artificial neural networks

Artificial neural networks (ANNs) जैविक तंत्रिका नेटवर्क से प्रेरित है। इसे इसलिए बनाया गया है ताकि मशीन मानव मस्तिष्क की तरह किसी समस्या का समाधान कर सके। यह एक मशीन लर्निंग मॉडल है।

ANN मॉडल एक दूसरे से जुड़े नोड्स के संग्रह पर आधारित है। ये नोड न्यूरॉन्स के रूप में कार्य करते हैं और इन्हें "कृत्रिम न्यूरॉन्स" कहा जाता है। प्रत्येक कनेक्शन सूचना प्रसारित कर सकता है। जैसे एक कृत्रिम न्यूरॉन से दूसरे में सिग्नल संचारित करना।

ANN में "ट्रांसमिटेड-सिग्नल" एक वास्तविक संख्या (real number) है और प्रत्येक कृत्रिम न्यूरॉन के आउटपुट की गणना इसके इनपुट के योग के "गैर-रैखिक" फ़ंक्शन द्वारा की जाती है।

Artificial neural networks का उपयोग computer vision, speech recognition, translation और social networks में किया जाता है।

Decision trees

डिसीजन ट्री मशीन लर्निंग मॉडल डिसीजन ट्री पर आधारित है जहां ट्री-लीव्स क्लास लेबल्स का प्रतिनिधित्व करते हैं और ट्री-ब्रांच उन विशेषताओं के संयोजन का प्रतिनिधित्व करते हैं जो उन क्लास लेबल्स की ओर ले जाते हैं।

Support-vector machines

Support-vector machines (SVMs) को सपोर्ट-वेक्टर नेटवर्क के रूप में भी जाना जाता है। ये मशीनें या नेटवर्क संबंधित supervised learning विधियों का एक समूह हैं जिनका उपयोग classification और regression के लिए किया जाता है।

यह एल्गोरिदम एक मॉडल बनाता है जो predict करता है कि कोई नया मान एक श्रेणी या दूसरे में आता है या नहीं।

Regression analysis

Regression analysis में हम मूल्यों के बीच संबंध जानने के लिए विभिन्न गणितीय विधियों का उपयोग करते हैं।

सबसे आम regression analysis उदाहरण रैखिक प्रतिगमन (linear regression) है, जहां दिए गए डेटा को गणितीय मानदंड (जैसे सामान्य न्यूनतम वर्ग) के अनुसार सर्वोत्तम संभव तरीके से विभाजित करने के लिए एक एकल रेखा खींची जाती है।

Genetic algorithms

Genetic algorithm (GA) एक खोज एल्गोरिथम और समस्या समाधान तकनीक (हेयुरिस्टिक तकनीक) है जो प्राकृतिक चयन की प्रक्रिया की तरह काम करता है।

इसका इस्तेमाल 1980 और 1990 के दशक में किया गया था।

मशीन लर्निंग में प्रयुक्त Python libraries

Supervised और Unsupervised मशीन लर्निंग के बीच अंतर

Unsupervised Machine Learning:	Supervised Machine Learning:
इस प्रकार की मशीन लर्निंग में, हम unlabeled डेटा का उपयोग करते हैं।	इस प्रकार की मशीन लर्निंग में, हम labeled डेटा का उपयोग करते हैं।
यहां, मशीन सही आउटपुट के बारे में नहीं जानती है।	यहां, मशीन को सही आउटपुट के बारे में पता होता है।
यह supervised machine learning से कम सटीक है।	यह Unsupervised machine learning से ज्यादा सटीक है।
इसमें Clustering और Associations की समस्याएं शामिल हैं।	इसमें Classification और Regression समस्याएं शामिल हैं।
यहां हमारे पास केवल इनपुट है।	यहां हमारे पास इनपुट और आउटपुट दोनों हैं।

Supervised और Unsupervised learning के बीच अंतर के बारे में अधिक जानें।

मशीन लर्निंग के अनुप्रयोग हिंदी में

मशीन लर्निंग के कई अनुप्रयोग हैं। उनमें से कुछ नीचे दिए गए हैं:

Web Search Engines: आप वेब सर्च इंजन जैसे Google, Bing, Yahoo, आदि में मशीन लर्निंग के अनुप्रयोग(application) को देख सकते हैं। यहाँ वे आपकी query को समझते हैं और relevant परिणाम प्रदान करते हैं।
Spam Detector: जब आप Gmail में स्पैम ईमेल प्राप्त करते हैं, तो यह स्वचालित रूप से मशीन लर्निंग की मदद से स्पैम सेक्शन में चला जाता है।
Face Recognition/ Handwriting Recognition: आप मशीन को पर्याप्त डेटा प्रदान करके किसी व्यक्ति के चेहरे और लिखावट की पहचान के लिए मशीन लर्निंग का भी उपयोग कर सकते हैं।
Virtual Assistant(Artificial Intelligence): Google Assistant, Siri, Cortana, और Alexa इंटरनेट पर कई निजी वर्चुअल असिस्टेंट उपलब्ध हैं जो आपको इंटरनेट पर कोई भी जानकारी खोजने में मदद करते हैं। वे इंटरनेट पर खोज करते हैं और आपके द्वारा पूछे गए प्रश्न के लिए relevant परिणाम प्रदान करते हैं। वे आपका काम बहुत तेजी से पूरा करते हैं। वे डेटा एकत्र करने और refine करने के लिए मशीन लर्निंग का उपयोग करते हैं ताकि परिणाम आपके लिए यथासंभव relevant हों। वे खुद को बेहतर बनाने के लिए पिछले अनुभवों, पिछले प्रश्नों, आप क्या खोजते हैं और ऐप्स के अन्य डेटा से सीखते हैं।
Social Media Services: Facebook, Instagram और Reddit जैसे सोशल मीडिया प्लेटफॉर्म अत्यधिक व्यस्त पोस्ट की सिफारिश(recommend) करने के लिए मशीन लर्निंग का उपयोग करते हैं ताकि अधिक उपयोगकर्ता उन्हें देख सकें। वे इसका उपयोग आपको आपकी पिछली कार्रवाइयों(actions) से संबंधित विज्ञापन दिखाने के लिए करते हैं।

मशीन लर्निंग के फायदे:

मशीन लर्निंग बड़ी मात्रा में डेटा की समीक्षा कर सकता है और विशिष्ट रुझानों और पैटर्न की खोज कर सकता है जिन्हें मनुष्य पहचान नहीं सकते हैं।
मशीन लर्निंग की मदद से आपको हर कदम पर कंप्यूटर को निर्देश देने की जरूरत नहीं है। आपको केवल परिणाम की जांच करने की आवश्यकता है, जो आपके द्वारा प्रदान किए गए डेटा के साथ मशीन द्वारा स्वचालित रूप से उत्पन्न हो जाएगा।
जैसे-जैसे समय बीतता है और मशीन लर्निंग एल्गोरिदम अनुभव प्राप्त करते हैं, वे अपनी निर्णय लेने की शक्ति और सटीकता में सुधार करना जारी रखेंगे।

मशीन लर्निंग के नुकसान:

मशीन लर्निंग एल्गोरिदम को बड़ी मात्रा में डेटा की आवश्यकता होती है, और एल्गोरिथम को और बेहतर बनाने के लिए यह डेटा उच्च गुणवत्ता का होना चाहिए।
मशीन लर्निंग एल्गोरिदम को उनके सुधार के लिए समय की आवश्यकता होती है।
मशीन लर्निंग त्रुटियों के प्रति अत्यधिक संवेदनशील है। यदि एक भी त्रुटि होती है, तो आपको पूरी तरह से अलग परिणाम मिलेगा।

FAQ About Machine Learning:

प्रश्न: Machine learning kya hai?

उत्तर: मशीन लर्निंग किसी कंप्यूटर या मशीन की अपने अनुभव के साथ बिना किसी मानवीय हस्तक्षेप के अपने आप सीखने की क्षमता है।

प्रश्न: मशीन लर्निंग के प्रकार क्या हैं?

उत्तर: मशीन लर्निंग के 4 प्रकार हैं: 1. सुपरवाइज्ड लर्निंग, 2. अनसुपरवाइज्ड लर्निंग, 3. सेमी-सुपरवाइज्ड लर्निंग, 4. रीइन्फोर्समेंट लर्निंग।

प्रश्न: मशीन लर्निंग (ML) और आर्टिफिशियल इंटेलिजेंस (AI) में क्या अंतर है?

उत्तर: आर्टिफिशियल इंटेलिजेंस एक कंप्यूटर की मनुष्य की तरह सोचने और कार्य करने की क्षमता है। मशीन लर्निंग का उपयोग कंप्यूटर में उस इंटेलिजेंस को विकसित करने के लिए किया जाता है। आर्टिफिशियल इंटेलिजेंस मशीन लर्निंग का एक हिस्सा है।

अब आप जानते हैं कि machine learning kya hai?

आपका इस पोस्ट के बारे में क्या विचार है?

यदि आपके कोई प्रश्न हैं, तो कृपया उन्हें टिप्पणी अनुभाग में छोड़ दें। अगर आप मशीन लर्निंग पर और पोस्ट चाहते हैं, तो आप मुझे कमेंट सेक्शन में बता सकते हैं। मुझे उम्मीद है कि यह पोस्ट आपको वह बताएगी जो आप मशीन लर्निंग के बारे में जानना चाहते हैं। धन्यवाद।

Search

EHB