De nada serve um pipeline rapido se entrega dados errados. A qualidade de dados deve ser verificada de forma automatica, em cada carga, e nao descoberta pelo utilizador no relatorio.
Verificacoes que compensam
- Completude: colunas obrigatorias sem nulos.
- Unicidade: chaves sem duplicados.
- Intervalos: valores dentro do esperado.
- Integridade referencial entre tabelas.
Quando uma verificacao falha, o pipeline deve parar e alertar, nunca publicar dados suspeitos em silencio.