RAG sin humo: fuentes, citas y evaluaciones

RAG funciona cuando lo tratas como un pipeline de datos, no como un truco de prompt. Si respondes con fuentes, puedes auditar. Y si puedes auditar, puedes medir calidad y mejorar sin romper producción.

Por qué RAG sigue vigente

En organizaciones con sistemas legacy y conocimiento distribuido, la pregunta rara vez es “qué sabe el modelo”; es “qué sabe tu empresa hoy”. RAG conecta el modelo con información actual y verificable (documentación, políticas, tickets, contratos internos), y permite responder con evidencia.

Tres piezas que separan una demo de un producto

Recuperación: chunking con estructura, embeddings adecuados y filtros por metadata.
Citas: devolver IDs o enlaces a la fuente, no solo texto.
Evaluaciones: un set de preguntas reales con respuestas esperadas y tolerancias.

Señales de un RAG sano

Si no hay evidencia, responde “no sé” y propone el siguiente paso.
La fuente es auditable (documento, sección, fecha).
Cada cambio (documentos, embeddings, prompt) dispara pruebas.

Métrica operativa simple

Mide la tasa de citas válidas: en cuántas respuestas el sistema devuelve una fuente relevante y verificable. Cuando esa tasa cae, normalmente hay drift en documentos, embeddings o chunking.