OneLake explicado: o lago de dados unificado do Microsoft Fabric
O OneLake é o lago de dados central do Microsoft Fabric. Ao contrário das soluções anteriores (ADLS, Blob Storage, etc.), o OneLake é um único repositório para toda a organização — cada tenant do Microsoft 365 tem exactamente um OneLake, dividido em workspaces.
Arquitectura
Tenant
└── OneLake (único por tenant)
├── Workspace: Analytics
│ ├── Lakehouse: LH_Bronze
│ ├── Lakehouse: LH_Silver
│ └── Warehouse: WH_Prod
└── Workspace: Marketing
└── Lakehouse: LH_Campaigns
Os dados ficam no formato Delta Parquet por omissão, o que garante compatibilidade com Spark, SQL e Power BI Direct Lake.
Shortcuts: acesso sem mover dados
Um Shortcut é como um atalho simbólico — aponta para dados noutro local (outro Lakehouse, ADLS Gen2, S3, GCS) sem os copiar. Diferentes equipas podem aceder aos mesmos dados sem duplicação.
-- Criar shortcut via API Fabric
POST https://api.fabric.microsoft.com/v1/workspaces/{workspaceId}/lakehouses/{lakehouseId}/shortcuts
{
"path": "Tables/FactVendas",
"name": "FactVendas_Shortcut",
"target": {
"type": "AdlsGen2",
"location": "https://myadls.dfs.core.windows.net/container/factovendas"
}
}
Open Mirroring
O Fabric suporta mirroring de bases de dados externas (Azure SQL, Cosmos DB, Snowflake) directamente para o OneLake, com replicação quasi-tempo-real sem necessidade de pipelines ETL complexos.
Conclusão
O OneLake elimina a proliferação de silos de dados. Ao centralizar todos os dados numa única plataforma com acesso unificado, as organizações reduzem a complexidade, os custos de integração e a latência entre equipas de dados.