DEV Community

Jenil Sheth
Jenil Sheth

Posted on

GenAI Roadmap (By Deeplearning.ai)

अपना खुद का चैटबॉट बनाओ (Build your own Chatbot)

चैटबॉट बनाना न सिर्फ मजेदार है, बल्कि इससे AI के कई बड़े कॉन्सेप्ट्स एकदम क्लियर हो जाते हैं।

  • ट्रेनिंग (Training): LLMs की ट्रेनिंग के दो हिस्से होते हैं। पहला 'Pre-training', जहाँ मॉडल को अगला शब्द गेस करना सिखाया जाता है। दूसरा 'Fine-Tuning', जहाँ उसे किसी खास काम (जैसे बातचीत करना) के लिए तैयार किया जाता है।
  • मेमोरी (Memory): वैसे तो LLM को कुछ याद नहीं रहता, उसे बस उतना ही पता होता है जो प्रॉम्प्ट में लिखा हो। पुरानी बातें याद रखने के लिए हमें उसमें अलग से 'मेमोरी' जोड़नी पड़ती है।
  • गार्डरेल्स (Guardrails): अगर तुम अपना बॉट दुनिया के लिए लाइव (Production) करना चाहते हो, तो उस पर नजर रखनी होगी कि वो कोई ऊटपटांग या गलत बात न करे।

चैटबॉट के लिए कोर्सेज

  • ChatGPT Prompt Engineering for Developers: इसके पहले लेक्चर में LLM की बेसिक बातें और ट्रेनिंग के फर्क समझाए गए हैं। आखिरी लेक्चर 'Chatbot' में तुम स्क्रैच से एक पिज्जा-ऑर्डर करने वाला बॉट बनाना सीखोगे, वो भी GUI के साथ!
  • Langchain for LLM Application Development: Langchain जैसे फ्रेमवर्क से प्रोजेक्ट काफी मजबूत बन जाता है। इसमें तुम्हें अलग-अलग तरह की 'Conversational Memory' के बारे में पता चलेगा।
  • Building Systems With ChatGPT: यहाँ तुम सीखोगे कि OpenAI के 'Moderation Tool' से बातचीत को सेफ कैसे रखते हैं। कोर्स खत्म होते-होते तुम एक सवाल-जवाब करने वाला बॉट बना लोगे।

RAG: डॉक्युमेंट्स से सवाल-जवाब करना (Retrieval Augmented Generation)

RAG के दो मेन स्टेप्स होते हैं। पहले स्टेप में डॉक्युमेंट्स को प्रोसेस करके डेटाबेस (अक्सर Vector Database) में डाला जाता है। दूसरे स्टेप में जरूरत पड़ने पर डेटा वापस निकाला (Retrieve) जाता है।

चलो शॉर्ट में समझते हैं कि ये कैसे काम करता है:

  • Extract: तुम्हारी फाइलें PDF या Word कुछ भी हो सकती हैं। उनमें टेक्स्ट, टेबल या फोटो हो सकते हैं। सबसे पहले इन्हें सही फॉर्मेट में बाहर निकालना होता है।
  • Chunking: बड़े टेक्स्ट को छोटे-छोटे टुकड़ों में तोड़ दिया जाता है, जिसे 'चंकिंग' कहते हैं।
  • Embedding: हर टुकड़े को एक 'Dense Vector' (नंबर्स की लिस्ट) में बदला जाता है, जो उस टेक्स्ट का असली मतलब बताता है।
  • Loading: इस एम्बेडिंग और ओरिजिनल डेटा को डेटाबेस में डाल दिया जाता है।
  • Database: यहाँ डेटा स्टोर होता है। ज्यादातर 'Vector Databases' का इस्तेमाल होता है, पर कभी-कभी Graph या नॉर्मल डेटाबेस भी काम आते हैं।
  • Query (सवाल पूछना):
  • Embedding: तुम्हारे सवाल को भी उसी मॉडल से वेक्टर में बदला जाता है।
  • Retrieval: डेटाबेस में से वो 'k' रिजल्ट्स ढूंढे जाते हैं जो तुम्हारे सवाल के मतलब के सबसे करीब हों।
  • यही रिजल्ट्स LLM को दिए जाते हैं, जिससे वो एक सटीक जवाब तैयार करता है।

RAG के कोर्सेज

जनरल ओवरव्यू (General Overview)

पाइपलाइन की बारीकियां (Pipeline Specifics)


इमेज जनरेट करना (Generating Images)

DALL-E देखकर मन करता होगा कि ये काम कैसे करता है? इसे समझने का सबसे अच्छा तरीका है खुद का मॉडल बनाना।

  • How Diffusion Models Work: इस कोर्स में तुम खुद का 'Diffusion Model' बनाना और उसे ट्रेन करना सीखोगे।

अपने LLM को फाइन-ट्यून करना (Fine-tune your LLM)

LLM को पूरी दुनिया का ज्ञान होता है, लेकिन अगर तुम्हें उसे अपनी कंपनी या किसी खास प्रोफेशन की भाषा सिखानी है, तो 'Fine-tuning' काम आती है।

फाइन-ट्यूनिंग कोर्सेज

  • Finetuning Large Language Models: मॉडल चुनने से लेकर उसे होस्ट करने तक की पूरी जानकारी (Lamaini के साथ)।
  • Efficiently Serving LLMs: यहाँ तुम LoRA और Quantization जैसी टेकनीक सीखोगे जिससे कम मेमोरी में मॉडल तेजी से चले।
  • मॉडल कैसे चुनें: Open Source Models with HuggingFace पर जाकर बेस्ट मॉडल ढूंढना सीखो। इसके अलावा Llama-2 और Mistral पर भी स्पेसिफिक कोर्सेज हैं।

रिसर्च एजेंट (Research Agent)

एजेंट्स वो होते हैं जो सिर्फ बातें नहीं करते, बल्कि टूल्स का इस्तेमाल करके काम भी पूरे करते हैं। एक रिसर्च एजेंट खुद प्लान बनाएगा, सोर्स ढूंढेगा और रिपोर्ट लिखेगा।

रिसर्च एजेंट कोर्सेज

टूल्स की जानकारी (Tools Courses)

  • Functions Tools and Agents with Langchain: यहाँ तुम OpenAI की 'Function Calling' क्षमता का इस्तेमाल करना सीखोगे।
  • NexusFlow Function Calling: (जल्द आ रहा है) छोटे मॉडल्स को टूल्स इस्तेमाल करने में एक्सपर्ट बनाना।

एजेंट बनाने के कोर्सेज (Agent Courses)

  • AI Agentic Design Patterns with Autogen: इसमें ब्लॉग लिखने से लेकर फाइनेंशियल एनालिसिस तक के कई प्रोजेक्ट्स हैं।
  • Multi AI Agent Systems with crewAI: जहाँ कई एजेंट्स मिलकर एक टीम की तरह काम करते हैं।
  • AI Agents in LangGraph: अगर तुम्हें डेटा के बहाव (Flow) पर पूरा कंट्रोल चाहिए, तो ये बेस्ट है।
  • Building Agentic RAG with LlamaIndex: अपने लोकल डॉक्युमेंट्स पर रिसर्च करने वाला एजेंट बनाओ।

Top comments (0)