(+351) 21 24 10006  ·  info@bconcepts.pt
Carnaxide, Lisboa
Microsoft Fabric
Microsoft Fabric 2 min

OneLake explicado: el lago de datos unificado de Microsoft Fabric

João Barros 19 de July de 2024 2 min de lectura

OneLake es el lago de datos central de Microsoft Fabric. A diferencia de las soluciones anteriores (ADLS, Blob Storage, etc.), OneLake es un único repositorio para toda la organización — cada tenant de Microsoft 365 tiene exactamente un OneLake, dividido en workspaces.

Arquitectura

Tenant
└── OneLake (único por tenant)
    ├── Workspace: Analytics
    │   ├── Lakehouse: LH_Bronze
    │   ├── Lakehouse: LH_Silver
    │   └── Warehouse: WH_Prod
    └── Workspace: Marketing
        └── Lakehouse: LH_Campaigns

Los datos se almacenan en formato Delta Parquet por defecto, lo que garantiza compatibilidad con Spark, SQL y Power BI Direct Lake.

Shortcuts: acceso sin mover datos

Un Shortcut es como un enlace simbólico — apunta a datos en otra ubicación (otro Lakehouse, ADLS Gen2, S3, GCS) sin copiarlos. Diferentes equipos pueden acceder a los mismos datos sin duplicación.

-- Crear un shortcut vía la API de Fabric
POST https://api.fabric.microsoft.com/v1/workspaces/{workspaceId}/lakehouses/{lakehouseId}/shortcuts
{
  "path": "Tables/FactSales",
  "name": "FactSales_Shortcut",
  "target": {
    "type": "AdlsGen2",
    "location": "https://myadls.dfs.core.windows.net/container/factsales"
  }
}

Open Mirroring

Fabric admite el mirroring de bases de datos externas (Azure SQL, Cosmos DB, Snowflake) directamente a OneLake, con replicación casi en tiempo real y sin necesidad de pipelines ETL complejos.

Conclusión

OneLake elimina la proliferación de silos de datos. Al centralizar todos los datos en una única plataforma con acceso unificado, las organizaciones reducen la complejidad, los costes de integración y la latencia entre equipos de datos.

Compartir: