Multimodal AI Agents और Tool Use का परिचय
शुरू से ही दस्तावेज़ों का विश्लेषण करने, छवियों की व्याख्या करने और बाहरी tools के साथ बातचीत करने में सक्षम बुद्धिमान AI agents बनाना सीखें।
इस कोर्स के बारे में
Artificial intelligence का अगला विकास टेक्स्ट से परे है। Multimodal agents अब छवियों का विश्लेषण कर सकते हैं, जटिल दस्तावेज़ों को पढ़ सकते हैं और बाहरी tools का उपयोग करके कार्रवाई कर सकते हैं। इस बुनियादी लिखित पाठ्यक्रम में, आप सीखेंगे कि ऐसे AI agents को कैसे डिज़ाइन और बनाया जाए जो विज़ुअल और टेक्स्ट डेटा को एक साथ प्रोसेस करते हैं। आप agentic AI और vision-language models की मुख्य अवधारणाओं के साथ शुरुआत करेंगे, फिर दस्तावेज़ निष्कर्षण (document extraction), screenshot विश्लेषण और डायनेमिक tool calling के लिए व्यावहारिक कार्यान्वयन रणनीतियों की ओर बढ़ेंगे।
What you will learn:
- Multimodal AI और agentic workflows की बुनियादी शब्दावली को समझें।
- छवियों, screenshots और जटिल दस्तावेज़ों से संरचित डेटा (structured data) को प्रोसेस और एक्सट्रैक्ट करें।
- अपने agents को बाहरी सिस्टम के साथ इंटरैक्ट करने की अनुमति देने के लिए आधुनिक tool calling पैटर्न लागू करें।
- विशेष रूप से vision-language कार्यों के लिए डिज़ाइन की गई prompt engineering तकनीकों को लागू करें।
- Multimodal डेटा को संभालने के लिए मौलिक Retrieval-Augmented Generation (RAG) अवधारणाओं का पता लगाएं।
- मजबूत agent architectures डिज़ाइन करें जो बहु-चरणीय तर्क (multi-step reasoning) को शालीनता से प्रबंधित करते हैं।
पाठ्यक्रम आवश्यक परिभाषाओं और multimodal सिस्टम के बुनियादी आर्किटेक्चर को स्थापित करने के साथ शुरू होता है। वहां से, आप अपने स्वयं के दस्तावेज़ और विज़न-प्रोसेसिंग agents बनाने के लिए चरण-दर-चरण लिखित ट्यूटोरियल और कोड स्निपेट्स पढ़ेंगे। यह पाठ्यक्रम शुरुआती और AI agents के लिए नए डेवलपर्स के लिए डिज़ाइन किया गया है; machine learning के साथ किसी पूर्व अनुभव की आवश्यकता नहीं है। आज ही बुद्धिमान, कार्रवाई-उन्मुख AI agents की अगली पीढ़ी बनाना शुरू करें।
आपको क्या मिलेगा
-
📜
समापन प्रमाणपत्र
अपने LinkedIn प्रोफ़ाइल में जोड़ें -
🎧
ऑडियो संस्करण शामिल
चलते-फिरते सीखें — स्क्रीन की ज़रूरत नहीं -
♾️
लाइफटाइम एक्सेस
कभी भी लौटें, समाप्ति नहीं -
📱
फ़ोन या कंप्यूटर
कहीं भी, किसी भी डिवाइस पर -
💸
14-दिन वापसी
बिना सवाल -
⚡
छोटा और केंद्रित
1 घंटे 15 मिनट व्यावहारिक सामग्री
समीक्षाएँ
अभी कोई समीक्षा नहीं — अपना अनुभव पहले साझा करें।
शिक्षार्थियों ने यह भी लिया
🎓 सर्टिफिकेट सहित
शिक्षकों के लिए व्यावहारिक AI उपकरण
सर्टिफ़िकेट
व्यावहारिक
₹1,199
→
⚡ शुरुआत के लिए बेस्ट
जेनरेटिव एआई के मूल सिद्धांत: मुख्य अवधारणाएँ और प्रॉम्प्टिंग
सर्टिफ़िकेट
व्यावहारिक
₹1,199
→
💼 जॉब के लिए तैयार
स्थानीय रूप से AI चलाना: LM Studio और Ollama गाइड
सर्टिफ़िकेट
व्यावहारिक
₹1,199
→
🎓 सर्टिफिकेट सहित
ओपनएआई एपीआई के साथ एआई-समर्थित अनुप्रयोगों का निर्माण करें
सर्टिफ़िकेट
व्यावहारिक
₹1,199
→
अक्सर पूछे जाने वाले प्रश्न
इस कोर्स के लिए मुझे क्या चाहिए? +
बस इंटरनेट वाला एक फ़ोन या कंप्यूटर। कोई इंस्टॉल नहीं, कोई विशेष हार्डवेयर नहीं।
मैं भुगतान कैसे करूँ? +
Stripe के माध्यम से कार्ड से। हम कार्ड विवरण स्टोर नहीं करते — Stripe सुरक्षित रूप से संभालता है।
क्या मुझे रिफ़ंड मिल सकता है? +
हाँ — 14 दिनों में पूर्ण रिफ़ंड, बिना सवाल।
मेरा एक्सेस कब तक रहेगा? +
हमेशा के लिए। एक बार खरीदने पर कोर्स आपका है — कभी भी दोबारा देखें।
क्या मुझे प्रमाणपत्र मिलेगा? +
हाँ। पूरा करने पर एक प्रमाणपत्र मिलेगा जिसे आप अपने LinkedIn प्रोफ़ाइल में जोड़ सकते हैं।
इन क्षेत्रों के लिए
टेक
डिज़ाइन
वित्त
मार्केटिंग
स्वास्थ्य
शिक्षा
आतिथ्य
विनिर्माण