Jenil Sheth

Posted on Mar 2

GenAI Roadmap (By Deeplearning.ai)

#hindi #genai #deeplearning #ai

अपना खुद का चैटबॉट बनाओ (Build your own Chatbot)

चैटबॉट बनाना न सिर्फ मजेदार है, बल्कि इससे AI के कई बड़े कॉन्सेप्ट्स एकदम क्लियर हो जाते हैं।

ट्रेनिंग (Training): LLMs की ट्रेनिंग के दो हिस्से होते हैं। पहला 'Pre-training', जहाँ मॉडल को अगला शब्द गेस करना सिखाया जाता है। दूसरा 'Fine-Tuning', जहाँ उसे किसी खास काम (जैसे बातचीत करना) के लिए तैयार किया जाता है।
मेमोरी (Memory): वैसे तो LLM को कुछ याद नहीं रहता, उसे बस उतना ही पता होता है जो प्रॉम्प्ट में लिखा हो। पुरानी बातें याद रखने के लिए हमें उसमें अलग से 'मेमोरी' जोड़नी पड़ती है।
गार्डरेल्स (Guardrails): अगर तुम अपना बॉट दुनिया के लिए लाइव (Production) करना चाहते हो, तो उस पर नजर रखनी होगी कि वो कोई ऊटपटांग या गलत बात न करे।

चैटबॉट के लिए कोर्सेज

ChatGPT Prompt Engineering for Developers: इसके पहले लेक्चर में LLM की बेसिक बातें और ट्रेनिंग के फर्क समझाए गए हैं। आखिरी लेक्चर 'Chatbot' में तुम स्क्रैच से एक पिज्जा-ऑर्डर करने वाला बॉट बनाना सीखोगे, वो भी GUI के साथ!
Langchain for LLM Application Development: Langchain जैसे फ्रेमवर्क से प्रोजेक्ट काफी मजबूत बन जाता है। इसमें तुम्हें अलग-अलग तरह की 'Conversational Memory' के बारे में पता चलेगा।
Building Systems With ChatGPT: यहाँ तुम सीखोगे कि OpenAI के 'Moderation Tool' से बातचीत को सेफ कैसे रखते हैं। कोर्स खत्म होते-होते तुम एक सवाल-जवाब करने वाला बॉट बना लोगे।

RAG: डॉक्युमेंट्स से सवाल-जवाब करना (Retrieval Augmented Generation)

RAG के दो मेन स्टेप्स होते हैं। पहले स्टेप में डॉक्युमेंट्स को प्रोसेस करके डेटाबेस (अक्सर Vector Database) में डाला जाता है। दूसरे स्टेप में जरूरत पड़ने पर डेटा वापस निकाला (Retrieve) जाता है।

चलो शॉर्ट में समझते हैं कि ये कैसे काम करता है:

Extract: तुम्हारी फाइलें PDF या Word कुछ भी हो सकती हैं। उनमें टेक्स्ट, टेबल या फोटो हो सकते हैं। सबसे पहले इन्हें सही फॉर्मेट में बाहर निकालना होता है।
Chunking: बड़े टेक्स्ट को छोटे-छोटे टुकड़ों में तोड़ दिया जाता है, जिसे 'चंकिंग' कहते हैं।
Embedding: हर टुकड़े को एक 'Dense Vector' (नंबर्स की लिस्ट) में बदला जाता है, जो उस टेक्स्ट का असली मतलब बताता है।
Loading: इस एम्बेडिंग और ओरिजिनल डेटा को डेटाबेस में डाल दिया जाता है।
Database: यहाँ डेटा स्टोर होता है। ज्यादातर 'Vector Databases' का इस्तेमाल होता है, पर कभी-कभी Graph या नॉर्मल डेटाबेस भी काम आते हैं।
Query (सवाल पूछना):
Embedding: तुम्हारे सवाल को भी उसी मॉडल से वेक्टर में बदला जाता है।
Retrieval: डेटाबेस में से वो 'k' रिजल्ट्स ढूंढे जाते हैं जो तुम्हारे सवाल के मतलब के सबसे करीब हों।
यही रिजल्ट्स LLM को दिए जाते हैं, जिससे वो एक सटीक जवाब तैयार करता है।

RAG के कोर्सेज

जनरल ओवरव्यू (General Overview)

LangChain: Chat with Your Data: पूरा RAG पाइपलाइन और GUI बनाना सीखो।
Building and Evaluating Advanced RAG Applications: यहाँ LlamaIndex का इस्तेमाल होगा और साथ में TruEra टूल से टेस्टिंग भी सिखाई जाएगी।
Building Agentic RAG with LlamaIndex: ये थोड़ा एडवांस लेवल है जहाँ RAG को 'Agent' की तरह इस्तेमाल करते हैं।

पाइपलाइन की बारीकियां (Pipeline Specifics)

Preprocessing Unstructured Data for LLM Applications: डेटा निकालने (Extraction) और उसे तैयार करने पर फोकस।
Embedding: Large Language Models with Semantic Search और Understanding and Applying Text Embeddings (Andrew Ng के साथ) कोर्सेज एम्बेडिंग्स को गहराई से समझाते हैं।
Vector Databases: Vector Databases: from Embeddings to Applications (Weaviate के साथ), Advanced Retrieval for AI with Chroma, और Building Applications with Vector Databases (Pinecone के साथ) तुम्हें अलग-अलग DBs की मास्टर बना देंगे।
Mixed Databases: Knowledge Graphs for RAG में Neo4j का इस्तेमाल करके रिश्तों (Relationships) के आधार पर डेटा स्टोर करना सीखो।

इमेज जनरेट करना (Generating Images)

DALL-E देखकर मन करता होगा कि ये काम कैसे करता है? इसे समझने का सबसे अच्छा तरीका है खुद का मॉडल बनाना।

How Diffusion Models Work: इस कोर्स में तुम खुद का 'Diffusion Model' बनाना और उसे ट्रेन करना सीखोगे।

अपने LLM को फाइन-ट्यून करना (Fine-tune your LLM)

LLM को पूरी दुनिया का ज्ञान होता है, लेकिन अगर तुम्हें उसे अपनी कंपनी या किसी खास प्रोफेशन की भाषा सिखानी है, तो 'Fine-tuning' काम आती है।

फाइन-ट्यूनिंग कोर्सेज

Finetuning Large Language Models: मॉडल चुनने से लेकर उसे होस्ट करने तक की पूरी जानकारी (Lamaini के साथ)।
Efficiently Serving LLMs: यहाँ तुम LoRA और Quantization जैसी टेकनीक सीखोगे जिससे कम मेमोरी में मॉडल तेजी से चले।
मॉडल कैसे चुनें: Open Source Models with HuggingFace पर जाकर बेस्ट मॉडल ढूंढना सीखो। इसके अलावा Llama-2 और Mistral पर भी स्पेसिफिक कोर्सेज हैं।

रिसर्च एजेंट (Research Agent)

एजेंट्स वो होते हैं जो सिर्फ बातें नहीं करते, बल्कि टूल्स का इस्तेमाल करके काम भी पूरे करते हैं। एक रिसर्च एजेंट खुद प्लान बनाएगा, सोर्स ढूंढेगा और रिपोर्ट लिखेगा।

रिसर्च एजेंट कोर्सेज

टूल्स की जानकारी (Tools Courses)

Functions Tools and Agents with Langchain: यहाँ तुम OpenAI की 'Function Calling' क्षमता का इस्तेमाल करना सीखोगे।
NexusFlow Function Calling: (जल्द आ रहा है) छोटे मॉडल्स को टूल्स इस्तेमाल करने में एक्सपर्ट बनाना।

एजेंट बनाने के कोर्सेज (Agent Courses)

AI Agentic Design Patterns with Autogen: इसमें ब्लॉग लिखने से लेकर फाइनेंशियल एनालिसिस तक के कई प्रोजेक्ट्स हैं।
Multi AI Agent Systems with crewAI: जहाँ कई एजेंट्स मिलकर एक टीम की तरह काम करते हैं।
AI Agents in LangGraph: अगर तुम्हें डेटा के बहाव (Flow) पर पूरा कंट्रोल चाहिए, तो ये बेस्ट है।
Building Agentic RAG with LlamaIndex: अपने लोकल डॉक्युमेंट्स पर रिसर्च करने वाला एजेंट बनाओ।

DEV Community