OneLake explicado: el lago de datos unificado de Microsoft Fabric
OneLake es el lago de datos central de Microsoft Fabric. A diferencia de las soluciones anteriores (ADLS, Blob Storage, etc.), OneLake es un único repositorio para toda la organización — cada tenant de Microsoft 365 tiene exactamente un OneLake, dividido en workspaces.
Arquitectura
Tenant
└── OneLake (único por tenant)
├── Workspace: Analytics
│ ├── Lakehouse: LH_Bronze
│ ├── Lakehouse: LH_Silver
│ └── Warehouse: WH_Prod
└── Workspace: Marketing
└── Lakehouse: LH_Campaigns
Los datos se almacenan en formato Delta Parquet por defecto, lo que garantiza compatibilidad con Spark, SQL y Power BI Direct Lake.
Shortcuts: acceso sin mover datos
Un Shortcut es como un enlace simbólico — apunta a datos en otra ubicación (otro Lakehouse, ADLS Gen2, S3, GCS) sin copiarlos. Diferentes equipos pueden acceder a los mismos datos sin duplicación.
-- Crear un shortcut vía la API de Fabric
POST https://api.fabric.microsoft.com/v1/workspaces/{workspaceId}/lakehouses/{lakehouseId}/shortcuts
{
"path": "Tables/FactSales",
"name": "FactSales_Shortcut",
"target": {
"type": "AdlsGen2",
"location": "https://myadls.dfs.core.windows.net/container/factsales"
}
}
Open Mirroring
Fabric admite el mirroring de bases de datos externas (Azure SQL, Cosmos DB, Snowflake) directamente a OneLake, con replicación casi en tiempo real y sin necesidad de pipelines ETL complejos.
Conclusión
OneLake elimina la proliferación de silos de datos. Al centralizar todos los datos en una única plataforma con acceso unificado, las organizaciones reducen la complejidad, los costes de integración y la latencia entre equipos de datos.