Sesion 14: Arquitecturas hibridas SQL + vectorial para RAG

1. Logro de la sesion

Disenar una arquitectura hibrida para IA generativa que combine PostgreSQL, motores vectoriales y orquestacion de aplicaciones (LangChain/LlamaIndex), incorporando sincronizacion de datos, observabilidad y controles de calidad para sistemas RAG en produccion.


2. Vision integral de la sesion

Capas del sistema:

  1. Datos transaccionales en SQL.
  2. Indexacion semantica vectorial.
  3. Orquestacion del flujo de pregunta-respuesta.
  4. Monitoreo, evaluacion y gobierno.

3. Que es RAG

RAG (Retrieval Augmented Generation) combina:

Pipeline simplificado:

Pregunta -> embedding -> retrieval -> re-rank -> prompt -> respuesta.


4. Por que arquitectura hibrida

Un solo motor no resuelve todo:


5. Componentes tecnicos

5.1 Base SQL (PostgreSQL)

5.2 Vector store

5.3 Orquestacion


6. Flujo de una consulta RAG

  1. Validar identidad y permisos en SQL.
  2. Normalizar consulta del usuario.
  3. Generar embedding de la consulta.
  4. Recuperar top-k chunks en indice vectorial.
  5. Filtrar por metadatos y politicas.
  6. Construir prompt con contexto.
  7. Generar respuesta.
  8. Registrar trazas y feedback.

7. Sincronizacion SQL <-> vectorial

Problema:

cuando cambia documento fuente, embedding queda obsoleto.

Opciones:

Regla:

definir SLA de frescura segun criticidad del dominio.


8. CDC en arquitecturas hibridas

CDC permite detectar:

Uso en RAG:


9. Estrategias de chunking y versionado

Guardar siempre:

Beneficio:

reindexacion incremental confiable y auditable.


10. Seguridad en RAG empresarial

Controles clave:

  1. ACL por documento.
  2. Filtrado de retrieval por permisos.
  3. Evitar exponer secretos en contexto.
  4. Registro de acceso a fragmentos sensibles.

Sin esto, un RAG puede filtrar informacion no autorizada.


11. Calidad de respuesta

Dimensiones:

Metricas:


12. Observabilidad y trazabilidad

Monitorear:

Registrar:


13. Manejo de costos

Costo total de un RAG incluye:

Optimizar:

  1. caching de consultas frecuentes,
  2. top-k ajustado por dominio,
  3. prompt compacto y util.

14. Patrones de despliegue

14.1 Monolito inicial

Rapido para pilotos.

14.2 Servicios separados

Mejor escalado por componente.

14.3 Arquitectura orientada a eventos

Recomendada cuando hay CDC y reindexacion continua.


15. Integracion con LangChain/LlamaIndex

Casos de uso:

Criterio:

usar framework cuando reduce complejidad real, no por moda.


16. PostgreSQL en arquitectura hibrida

Rol de PostgreSQL:


17. Riesgos de implementacion


18. Caso de estudio integrador

Asistente legal interno:

Resultado esperado:


19. Plan de adopcion por fases

Fase 1:

Fase 2:

Fase 3:

Fase 4:


20. Checklist de produccion


21. Mini laboratorio final

  1. Modelar tablas SQL para usuarios, documentos y permisos.
  2. Definir esquema de chunks y embeddings.
  3. Simular una sincronizacion incremental.
  4. Diseñar consulta RAG con filtro de acceso.
  5. Evaluar tres respuestas con rubrica de calidad.

22. Preguntas de autoevaluacion

  1. Por que RAG requiere SQL y vectorial a la vez?
  2. Que problema resuelve CDC en esta arquitectura?
  3. Que metrica detecta degradacion del retrieval?
  4. Que riesgo hay si el filtro de permisos va al final?
  5. Cuando conviene usar pgvector y no un motor separado?

23. Cierre del curso

Competencias integradas logradas:

Proximo paso recomendado:

construir un proyecto capstone con datos reales y evaluacion cuantitativa.


24. Referencias recomendadas

  1. Lewis et al. (2020), Retrieval-Augmented Generation.
  2. Documentacion LangChain.
  3. Documentacion LlamaIndex.
  4. pgvector documentation.
  5. Guías de arquitectura RAG en produccion.