Sesion 12: NoSQL y persistencia poliglota para IA

1. Logro de la sesion

Evaluar modelos NoSQL (documental, key-value, columnar y grafos), comprender sus trade-offs frente a SQL y disenar estrategias de persistencia poliglota para soluciones de analitica e inteligencia artificial.


2. Conexion con el syllabus

Semana 12 corresponde a:


3. Por que surge NoSQL

Limitaciones de sistemas relacionales en ciertos contextos:

NoSQL no reemplaza SQL, lo complementa.


4. SQL vs NoSQL (visión practica)

SQL destaca en:

NoSQL destaca en:


5. Modelo documental

Ejemplos: MongoDB, Couchbase.

Caracteristicas:

Caso de uso:

perfiles de usuario y eventos semiestructurados.


6. Modelo key-value

Ejemplos: Redis, DynamoDB (modo KV).

Caracteristicas:

Caso de uso:

almacenar tokens, sesiones, feature flags.


7. Modelo wide-column / columnar NoSQL

Ejemplos: Cassandra, HBase.

Caracteristicas:

Caso de uso:

telemetria y series de tiempo a gran escala.


8. Modelo de grafos

Ejemplos: Neo4j, JanusGraph.

Caracteristicas:

Caso de uso:

fraude, recomendacion, redes sociales, knowledge graphs.


9. Consistencia y CAP

Teorema CAP en sistemas distribuidos:

En presencia de particiones, se balancea consistencia vs disponibilidad.

Conceptos practicos:


10. NoSQL en IA

Casos frecuentes:

  1. almacenamiento de eventos de inferencia,
  2. perfiles enriquecidos por usuario,
  3. cache de features online,
  4. grafos de conocimiento,
  5. historial semiestructurado de prompts/respuestas.

11. Persistencia poliglota

Es usar mas de un motor segun necesidad.

Ejemplo de arquitectura:


12. Seleccion por patrón de acceso

Pregunta clave:

“Como se consultan y actualizan los datos realmente?”

No elegir motor por tendencia, sino por:


13. Modelado en NoSQL

A diferencia de SQL, se diseña alrededor de queries esperadas.

Principios:


14. Integridad y calidad en NoSQL

Aunque el esquema sea flexible, se requiere:


15. Seguridad en motores NoSQL

Controles minimos:


16. Operacion y observabilidad

Monitorear:


17. Costos y mantenimiento

Dimensionar costo por:

Riesgo tipico:

subestimar costo de indices y replicas.


18. Migracion y convivencia SQL + NoSQL

Estrategia segura:

  1. identificar dominio candidato,
  2. pilotear caso acotado,
  3. definir sincronizacion,
  4. medir impacto,
  5. escalar gradualmente.

19. Errores frecuentes


20. Caso aplicado

Asistente omnicanal:


21. Mini laboratorio

  1. Clasificar 4 casos de uso por tipo de motor.
  2. Disenar documento JSON para perfil enriquecido.
  3. Proponer esquema de cache en key-value.
  4. Definir consulta de grafo para recomendacion.
  5. Justificar arquitectura poliglota final.

22. Checklist de salida


23. Preguntas de autoevaluacion

  1. Cuando prefieres documental sobre relacional?
  2. Que aporta key-value en latencia?
  3. Que riesgo tiene consistencia eventual?
  4. Cuando un grafo supera a SQL?
  5. Como decides entre un motor o varios?

24. Referencias recomendadas

  1. Kleppmann, Designing Data-Intensive Applications.
  2. MongoDB Architecture Guide.
  3. Redis documentation.
  4. Cassandra data modeling guides.
  5. Neo4j graph modeling basics.