(+351) 21 24 10006  ·  info@bconcepts.pt
Carnaxide, Lisboa
Microsoft Fabric
Microsoft Fabric 2 min

OneLake explicado: o lago de dados unificado do Microsoft Fabric

João Barros 19 de July de 2024 2 min de leitura

O OneLake é o lago de dados central do Microsoft Fabric. Ao contrário das soluções anteriores (ADLS, Blob Storage, etc.), o OneLake é um único repositório para toda a organização — cada tenant do Microsoft 365 tem exactamente um OneLake, dividido em workspaces.

Arquitectura

Tenant
└── OneLake (único por tenant)
    ├── Workspace: Analytics
    │   ├── Lakehouse: LH_Bronze
    │   ├── Lakehouse: LH_Silver
    │   └── Warehouse: WH_Prod
    └── Workspace: Marketing
        └── Lakehouse: LH_Campaigns

Os dados ficam no formato Delta Parquet por omissão, o que garante compatibilidade com Spark, SQL e Power BI Direct Lake.

Shortcuts: acesso sem mover dados

Um Shortcut é como um atalho simbólico — aponta para dados noutro local (outro Lakehouse, ADLS Gen2, S3, GCS) sem os copiar. Diferentes equipas podem aceder aos mesmos dados sem duplicação.

-- Criar shortcut via API Fabric
POST https://api.fabric.microsoft.com/v1/workspaces/{workspaceId}/lakehouses/{lakehouseId}/shortcuts
{
  "path": "Tables/FactVendas",
  "name": "FactVendas_Shortcut",
  "target": {
    "type": "AdlsGen2",
    "location": "https://myadls.dfs.core.windows.net/container/factovendas"
  }
}

Open Mirroring

O Fabric suporta mirroring de bases de dados externas (Azure SQL, Cosmos DB, Snowflake) directamente para o OneLake, com replicação quasi-tempo-real sem necessidade de pipelines ETL complexos.

Conclusão

O OneLake elimina a proliferação de silos de dados. Ao centralizar todos os dados numa única plataforma com acesso unificado, as organizações reduzem a complexidade, os custos de integração e a latência entre equipas de dados.

Partilhar: