[IAT-110] Integración de LLMs de pesos abiertos en aplicaciones on-premises
Este curso trata sobre integración de LLMs open source en entornos on-premises. Aborda conceptos clave, comparación de modelos, despliegue en CPU/GPU, uso vía APIs y casos reales. Incluye seguridad, control de respuestas y evaluación de herramientas como LangChain o LlamaIndex para construir aplicaciones de IA eficientes y privadas.
Duración: 15 horas
Perfil: Avanzado
Dirigido a
Esta acción formativa va dirigida a dirigida a técnicos con experiencia en IA Generativa, administradores de sistemas y desarrolladores back-end / full-stack.
Requisitos previos
Los alumnos necesitarán tener conocimientos de programación y de entornos de desarrollo.
Objetivos
Sentar bases técnicas sólidas para el resto del curso.
Elegir el modelo adecuado en función del caso de uso y los recursos disponibles.
Tener el modelo listo y funcionando localmente.
Integrar LLMs en herramientas reales on-premises.
Proteger las llamadas y el retorno de los LLMs.
Elegir la mejor herramienta de orquestación y automatización en IA.
Contenido
Introducción y definición de conceptos clave
Qué es un token, embeddings y cómo se usan
Chunking, ventana de contexto y su impacto en las respuestas
Bases vectoriales open source
Cuantización (int8, gguf…), rendimiento vs precisión
RAG, Agentes, Pipelines
Protocolos MCP (Model Context Protocol), ACP (Agent Communication Protoco), A2A (Angent to Agent)
Comparativa de modelos LLMs de pesos abiertos actuales
Mistral, LlaMA, DeepSeek, Qwen, etc
Parámetros, calidad, licencia, requisitos de hardware
Modelos multilingües, modelos multimodales y modelos adaptados a dominios específicos
Selección, instalación, configuración y despliegue de modelos on-premises
Entornos: Ollama, LM Studio, vLLM, llama.cpp, Docker, HF Text Generation Inference
Ejecución en GPU y CPU (cuantización)
Benchmark y pruebas de rendimiento
Configuración de rutas de acceso, tiempo de respuesta, logs
Acceso mediante API y ejemplos de uso
Exposición del modelo vía REST o websocket
Hacer pruebas con plugins de IA reales:
IA en Rouncube: respuesta de correos
IA en Nextcloud: asistente de escritura
IA en Moodle: generación y resumen de contenidos
Cómo securizar las peticiones y las respuestas a un LLM
Validación y sanitización de entradas
Filtrado de respuestas: toxicidad, hallucinations
Autenticación y autorización en endpoints LLM
Logs, trazabilidad y cumplimiento del AI Act
Comparativa de entornos open-source on-premises de integración de IA
LangChain vs n8n vs Flowise vs LlamaIndex
Cuándo usar cada uno: orquestación, pipelines, agentes
Limitaciones en entornos locales, estrategias híbridas
Documentación Recomendada
Se utilizará la documentación de referencia del proyecto.