Entorno de desarrollo.
Ollama: Descarga e instalar la versión para Windows, Mac o Linux. Es el servidor que ejecutará los modelos (Llama 3, Mistral, etc.).
Python 3.10+: Es el lenguaje donde vive LangChain.
Entorno Virtual (venv): Fundamental para no romper tu sistema operativo instalando librerías.
VS Code: El editor de código estándar para gestionar tus scripts de automatización.
Los (Modelos de IA)
Para razonar y extraer datos: ollama run llama3:8b
Para documentos rápidos: ollama run phi3 (Muy ligero, ideal poca RAM).
Para el RAG (Embeddings): ollama pull nomic-embed-text (Este es el que traduce tus PDFs a números para ChromaDB).Estructura de Carpetas Sugerida
Para aplicar buenas prácticas de ingeniería de datos, organiza tu proyecto:
/documentos_input: Aquí pones tus PDFs/Excel de administración.
/db_vectorial: Donde ChromaDB guardará los datos procesados.
/scripts: Tus archivos de LangChain para procesar la lógica.
.env: Para guardar rutas y configuraciones sin quemarlas en el código.
Top comments (0)