[IAT-120] Integración RAGs y Agentes de IA en aplicaciones on-premises

[IAT-120] Integración RAGs y Agentes de IA en aplicaciones on-premises

Este curso enseña a integrar RAGs y agentes de IA en aplicaciones on-premises. Cubre desde la ingesta y procesamiento de datos con webscraping, limpieza y vectorización, hasta la construcción de pipelines RAG con LLM y chatbots internos. También incluye la creación de agentes para automatizar respuestas en Redmine y estrategias de escalado multiusuario.

Duración:                    15 horas

Perfil:                           Avanzado

Dirigido a

Esta acción formativa va dirigida a dirigida a técnicos con experiencia en IA Generativa e integración de LLMs de pesos abiertos en aplicaciones on-premises, administradores de sistemas y desarrolladores back-end / full-stack.

Requisitos previos 

Los alumnos necesitarán tener conocimientos de programación y de entornos de desarrollo.

Objetivos

  • Extraer datos de una web y guardarlos en una base vectorial para que el modelo los entienda y los use.

  • Tener un sistema funcional de generación aumentada por recuperación.

  • Automatizar tareas repetitivas mediante un agente de IA local.

  • Garantizar rendimiento y estabilidad en producción.





Contenido

  1. Ingesta de datos para montar un RAG con ejemplo de webscraping

    1. Webscraping de una web pública (ej. documentación interna)

    2. Limpieza, partición y chunking

    3. Vectorización con embeddings y almacenado en base vectorial

  2. Puesta en marcha de un pipeline RAG

    1. Integración LLM + vector DB + frontend tipo chatbot

    2. RAG server (ej. LangChain o llama-index)

    3. Ejemplo: chat de ayuda de una web interna

  3. Puesta en marcha de un agente de IA con ejemplo en Redmine

    1. Introducción a agentes: arquitectura y límites

    2. Uso de LangChain o AutoGen para montar un agente

    3. Caso práctico: respuestas iniciales automáticas a tickets de Redmine

  4. Cómo escalar la solución para muchos usuarios

    1. Servidores de inferencia paralela (vLLM, TGI)

    2. Pooling, throttling, colas

    3. Balanceo de carga y clustering

    4. Buenas prácticas en entornos multiusuario

 



Documentación Recomendada

Se utilizará la documentación de referencia del proyecto.