Data warehouse, data lake, lakehouse — três termos que aparecem em qualquer conversa sobre plataformas de dados e que geram confusão constante. Percebê-los não é jargão técnico; é saber onde guardar os dados da tua empresa para que sejam úteis, fiáveis e não custem uma fortuna.
Data warehouse: dados arrumados e prontos a analisar
Um data warehouse guarda dados estruturados e organizados — tabelas limpas, com esquema definido, otimizadas para relatórios e análise. É o armazém arrumado: tudo tem o seu lugar, é rápido de consultar, mas exige preparar os dados antes de entrar. Ideal para BI e KPIs de negócio.

Data lake: guardar tudo, decidir depois
Um data lake guarda dados em bruto e de qualquer tipo — tabelas, ficheiros, logs, imagens, JSON. É barato e flexível: mete-se tudo lá e estrutura-se quando for preciso. O risco é virar um "pântano de dados" sem organização, onde ninguém encontra nada de confiança.
Lakehouse: o melhor dos dois mundos
O lakehouse combina a flexibilidade e o custo do lake com a organização e o desempenho do warehouse. Guarda dados em bruto e estruturados no mesmo sítio, com camadas de governança e formatos que permitem análise fiável sem duplicar tudo para um warehouse à parte. É a arquitetura que ganhou força nos últimos anos.
Como escolher
- Só BI clássico sobre dados estruturados: um data warehouse chega e é simples.
- Muitos dados variados, ciência de dados, custo a controlar: lake ou lakehouse.
- Queres um só sítio para BI e IA, sem silos: o lakehouse é a escolha natural.
Não é só tecnologia
A arquitetura certa depende dos teus casos de uso, não da moda. Muitas empresas acabam com uma combinação — e tudo bem, desde que seja uma decisão consciente e não um acumular de sistemas soltos. O objetivo é sempre o mesmo: dados fiáveis, acessíveis e ao custo certo.
Na prática
Antes de escolher a plataforma, mapeia o que tens (tipos de dados) e o que queres fazer (BI, IA, ambos). A tecnologia serve a estratégia de dados, nunca o contrário. Os teus dados vivem hoje num armazém arrumado, num pântano, ou algures no meio?