RAG funciona cuando lo tratas como un pipeline de datos, no como un truco de prompt. Si respondes con fuentes, puedes auditar. Y si puedes auditar, puedes medir calidad y mejorar sin romper producción.
Por qué RAG sigue vigente
En organizaciones con sistemas legacy y conocimiento distribuido, la pregunta rara vez es “qué sabe el modelo”; es “qué sabe tu empresa hoy”. RAG conecta el modelo con información actual y verificable (documentación, políticas, tickets, contratos internos), y permite responder con evidencia.
Tres piezas que separan una demo de un producto
- Recuperación: chunking con estructura, embeddings adecuados y filtros por metadata.
- Citas: devolver IDs o enlaces a la fuente, no solo texto.
- Evaluaciones: un set de preguntas reales con respuestas esperadas y tolerancias.
Señales de un RAG sano
- Si no hay evidencia, responde “no sé” y propone el siguiente paso.
- La fuente es auditable (documento, sección, fecha).
- Cada cambio (documentos, embeddings, prompt) dispara pruebas.
Métrica operativa simple
Mide la tasa de citas válidas: en cuántas respuestas el sistema devuelve una fuente relevante y verificable. Cuando esa tasa cae, normalmente hay drift en documentos, embeddings o chunking.