(+351) 21 24 10006  ·  info@bconcepts.pt
Carnaxide, Lisboa
Slowly Changing Dimensions (SCD): cómo guardar el histórico de datos
Data Engineering

Slowly Changing Dimensions (SCD): cómo guardar el histórico de datos

Equipa bConcepts 17/01/2024 2 min

La dirección de un cliente cambia. El vendedor responsable de una cuenta es sustituido. Un producto pasa de categoría. La pregunta que separa un buen modelo de datos de uno flojo es: ¿guardamos solo el valor actual, o preservamos el histórico? Esto es lo que resuelven las Slowly Changing Dimensions (SCD).

El problema del histórico que se pierde

Imagina que un cliente se muda del Norte al Sur. Si simplemente actualizas la dirección, todas las ventas antiguas pasan a parecer hechas en el Sur — y tu análisis por región queda erróneo hacia atrás. El pasado fue reescrito. Las SCD son la forma disciplinada de manejar estos cambios.

Slowly Changing Dimensions (SCD): cómo guardar el histórico de datos

SCD Tipo 1: sobrescribir

El tipo más simple: cuando el valor cambia, se sustituye el antiguo. Rápido y ligero, pero se pierde el histórico. Sirve cuando el pasado no importa — corregir una errata en el nombre, por ejemplo — pero es peligroso para datos que afectan análisis históricos.

SCD Tipo 2: guardar el histórico

El tipo más usado en BI: en vez de sobrescribir, se crea una nueva fila para el nuevo valor, manteniendo la antigua. Cada versión tiene fechas de inicio y fin y una marca de "actual". Así, las ventas antiguas siguen ligadas al Norte y las nuevas al Sur — el histórico queda intacto.

Cómo distinguirlas en la práctica

  • Tipo 1: solo importa el valor actual — usa cuando el pasado no cuenta.
  • Tipo 2: necesitas analizar "como era a la fecha" — la elección correcta para la mayoría de las dimensiones de negocio.

Por qué esto importa para la confianza

Sin SCD bien pensadas, los informes históricos cambian solos cuando los datos de referencia cambian — y nadie entiende por qué. Con ellas, el análisis del pasado se mantiene fiel a lo que realmente era. Es la diferencia entre un almacén de datos serio y uno que engaña sin querer.

En la práctica

Al diseñar una dimensión, pregunta siempre: si este valor cambia, ¿quiero ver el histórico como era, o solo el actual? La respuesta define el tipo de SCD. Este cuidado, invisible para el usuario final, es lo que hace que tus informes cuenten la verdad a lo largo del tiempo. ¿Tus dimensiones preservan el histórico, o reescriben el pasado en cada cambio?

← Volver a Insights
¿Hablamos?

¿Listo para transformar sus datos?

Reserve una reunión gratuita de 30 minutos y descubra cómo podemos ayudar a su equipo a tomar mejores decisiones.

Agendar Reunión Gratuita
bConcepts