Interoperabilidad del formato de tabla de Delta Lake
En Microsoft Fabric, el formato de tabla de Delta Lake es el estándar para el análisis. Delta Lake es una capa de almacenamiento de código abierto que incorpora transacciones ACID (atomicidad, coherencia, aislamiento y durabilidad) para cargas de trabajo de macrodatos y análisis.
Todas las experiencias de Fabric generan y consumen tablas de Delta Lake, lo que impulsa la interoperabilidad y una experiencia de producto unificada. Las tablas de Delta Lake generadas por un motor de proceso (como Fabric Data Warehouse o Synapse Spark) pueden consumirse en cualquier otro motor (como Power BI). Al ingerir los datos en Fabric, este los almacena como tablas Delta de forma predeterminada. Puede integrar fácilmente datos externos que contienen tablas de Delta Lake mediante los accesos directos de OneLake.
Características de Delta Lake y experiencias de Fabric
Para lograr la interoperabilidad, todas las experiencias de Fabric se alinean con las características de Delta Lake y las funcionalidades de Fabric. Algunas experiencias solo pueden escribir en tablas de Delta Lake, mientras que otras pueden leerlas.
- Escritores: almacenamientos de datos, secuencias de eventos y modelos semánticos de Power BI exportados a OneLake
- Lectores: punto de conexión de análisis SQL y modelos semánticos de Direct Lake de Power BI
- Escritores y lectores: entorno de ejecución de Spark de Fabric, canalizaciones de datos y bases de datos de Kusto Query Language (KQL)
En la matriz siguiente se muestran las características clave de Delta Lake y su compatibilidad con cada funcionalidad de Fabric.
Funcionalidad de Fabric | Asignaciones de columnas basadas en nombres | Vectores de eliminación | Escritura de V-Order | Optimización y mantenimiento de tablas | Escritura de particiones | Lectura de particiones | Agrupación en clústeres líquidos | TIMESTAMP_NTZ | Características de tabla predeterminadas y versión del lector/escritor delta |
---|---|---|---|---|---|---|---|---|---|
Exportación de Delta Lake en un almacenamiento de datos | No | Sí | Sí | Sí | No | Sí | No | No | Lector: 3 Escritor: 7 Vectores de eliminación |
Punto de conexión de análisis SQL | Sí | Sí | N/A (no aplicable) | N/A (no aplicable) | N/A (no aplicable) | Sí | Sí | No | N/A (no aplicable) |
Entorno de ejecución de Fabric Spark 1.3 | Sí | Sí | Sí | Sí | Sí | Sí | Sí | Sí | Lector: 1 Escritor: 2 |
Entorno de ejecución de Fabric Spark 1.2 | Sí | Sí | Sí | Sí | Sí | Sí | Sí, solo de lectura | Sí | Lector: 1 Escritor: 2 |
Entorno de ejecución de Fabric Spark 1.1 | Sí | No | Sí | Sí | Sí | Sí | Sí, solo de lectura | No | Lector: 1 Escritor: 2 |
Flujos de datos | Sí | Sí | Sí | No | Sí | Sí | Sí, solo de lectura | No | Lector: 1 Escritor: 2 |
Canalizaciones de datos | No | No | Sí | No | Sí, solo sobrescribir | Sí | Sí, solo de lectura | No | Lector: 1 Escritor: 2 |
Modelos semánticos de Direct Lake en Power BI | Sí | Sí | N/A (no aplicable) | N/A (no aplicable) | N/A (no aplicable) | Sí | Sí | No | N/A (no aplicable) |
Exportación de modelos semánticos de Power BI a OneLake | Sí | N/A (no aplicable) | Sí | No | Sí | N/A (no aplicable) | No | No | Lector: 2 Escritor: 5 |
Bases de datos KQL | Sí | Sí | No | No* | Sí | Sí | No | No | Lector: 1 Escritor: 1 |
Eventstreams | No | N.º | N.º | No | Sí | N/A (no aplicable) | No | No | Lector: 1 Escritor: 2 |
Las bases de datos KQL * proporcionan ciertas funcionalidades de mantenimiento de tablas, como la retención. Los datos se eliminan al final del período de retención de OneLake. Para más información, consulte Una copia lógica.
Nota:
- Fabric no escribe asignaciones de columnas basadas en nombres de forma predeterminada. La experiencia predeterminada de Fabric genera tablas compatibles en todo el servicio. Delta Lake, generado por servicios de terceros, puede tener características de tabla incompatibles.
- Algunas experiencias de Fabric no tienen funcionalidades de mantenimiento y optimización de tablas heredadas, como compactación de bin, V-Order y limpieza de archivos antiguos a los que no se hace referencia. Las tablas ingeridas mediante esas experiencias usan las técnicas descritas en Uso de la característica de mantenimiento de tablas para administrar tablas delta en Fabric para mantener las tablas de Delta Lake en condiciones óptimas para el análisis.
Limitaciones actuales
Actualmente, Fabric no admite estas características de Delta Lake:
- Delta Lake 3.x UniForm
- Escritura de columnas de identidad (característica propietaria de Databricks)
- Delta Live Tables (característica propietaria de Databricks)
- RLE (codificación de longitud de ejecución) habilitada en el archivo de punto de comprobación
Contenido relacionado
- ¿Qué es Delta Lake?
- Obtenga más información sobre las tablas de Delta Lake en Fabric Lakehouse y Synapse Spark.
- Más información sobre Direct Lake en Power BI y Microsoft Fabric.
- Obtenga más información sobre la consulta de tablas de Warehouse a través de sus registros publicados de Delta Lake.