De nada sirve un pipeline rápido si entrega datos erróneos. La calidad de datos debe verificarse de forma automática, en cada carga, y no ser descubierta por el usuario en el informe.
Verificaciones que compensan
- Completitud: columnas obligatorias sin nulos.
- Unicidad: claves sin duplicados.
- Rangos: valores dentro de lo esperado.
- Integridad referencial entre tablas.
Cuando una verificación falla, el pipeline debe detenerse y alertar, nunca publicar datos sospechosos en silencio.