Inteligencia Artificial · Serie LLMs y n8n
Agentes inteligentes: cuándo usarlos y cuándo evitarlos
Un agente no solo responde: decide pasos, llama herramientas y ejecuta acciones. La pregunta clave no es “¿puedo?”, sino “¿debo?” y “¿bajo qué límites?”.
En el post anterior conectamos el modelo con tus datos (RAG). Hoy subimos un nivel: agentes que deciden qué hacer, cuándo hacerlo y con qué herramienta. Bien diseñados ahorran tiempo; mal diseñados crean riesgos y costos.
¿Qué es un agente?
Es un sistema guiado por un LLM que planifica y ejecuta una secuencia de pasos: buscar datos, llamar APIs, calcular, resumir, escribir, notificar. Usa “herramientas” (funciones o servicios) con entradas/salidas definidas.
Cuándo sí conviene usar agentes
- Flujos multi-paso con decisiones condicionales (investigar → extraer → validar → reportar).
- Integraciones repetitivas (CRM, correo, calendarios) donde reglas cambian y necesitas flexibilidad.
- Operaciones internas con modo seguro y auditoría (p. ej., preparar borradores, nunca publicar directo).
- Asistentes expertos que recomiendan acciones y piden aprobación humana antes de ejecutarlas.
Cuándo evitarlos (por ahora)
- Tareas deterministas y baratas con reglas fijas (mejor un script o job).
- Acciones críticas sin guardrails (pagos, borrados, cambios masivos).
- Casos con datos sensibles sin anonimización ni control de permisos.
- Sistemas sin observabilidad (no sabrás qué hizo ni por qué).
Diseño seguro de agentes (checklist)
- Lista blanca de herramientas permitidas y parámetros validados.
- Presupuesto por tarea: límite de pasos, tiempo y costo.
- Revisiones: pasos irreversibles requieren confirmación humana.
- Entornos separados (dev/stg/prod) y tokens de solo lectura si es posible.
- Auditoría: log de decisiones, prompts y resultados de herramientas.
- Fallback: si falla, degradar a flujo “manual guiado”.
KPIs que sí importan
- Tasa de éxito por tarea (completa sin intervención humana).
- Profundidad de acción (número de pasos promedio y máximo).
- Fail/Abort rate por herramienta.
- Tiempo y costo por ejecución (p95).
- Escalado humano (% de casos que requirieron aprobación/corrección).
Micro-workflow n8n: “Agente con supervisor”
- Webhook → recibe
{ tarea, contexto }. - LLM (planner) → propone plan de pasos y herramientas.
- IF → si el plan supera límites (pasos/costo) → reject y pedir más contexto.
- Execute → n8n llama herramientas en orden (HTTP, DB, Email, etc.).
- LLM (critic) → revisa el resultado y redacta el informe final.
- Approval → si es “riesgoso”, solicita aprobación humana.
- Audit → guarda plan, pasos, costos y tiempos.
Errores comunes
- Permitir herramientas abiertas sin validación de parámetros.
- No fijar topes de pasos/tiempo/costo.
- Falta de logs y trazas para reconstruir decisiones.
- Usar agentes para todo en lugar de reservarlos para lo que sí aporta.
Conclusión
Los agentes brillan en flujos complejos y cambiantes, pero exigen límites, auditoría y un buen criterio de “cuándo sí/cuándo no”. Empieza pequeño, mide y escala solo donde aporte valor.
← Anterior: RAG no es magia: el verdadero secreto de los chatbots con conocimiento