Compartir a través de


Interoperabilidad del formato de tabla de Delta Lake

En Microsoft Fabric, el formato de tabla de Delta Lake es el estándar para el análisis. Delta Lake es una capa de almacenamiento de código abierto que incorpora transacciones ACID (atomicidad, coherencia, aislamiento y durabilidad) para cargas de trabajo de macrodatos y análisis.

Todas las experiencias de Fabric generan y consumen tablas de Delta Lake, lo que impulsa la interoperabilidad y una experiencia de producto unificada. Las tablas de Delta Lake generadas por un motor de proceso (como Fabric Data Warehouse o Synapse Spark) pueden consumirse en cualquier otro motor (como Power BI). Al ingerir los datos en Fabric, este los almacena como tablas Delta de forma predeterminada. Puede integrar fácilmente datos externos que contienen tablas de Delta Lake mediante los accesos directos de OneLake.

Características de Delta Lake y experiencias de Fabric

Para lograr la interoperabilidad, todas las experiencias de Fabric se alinean con las características de Delta Lake y las funcionalidades de Fabric. Algunas experiencias solo pueden escribir en tablas de Delta Lake, mientras que otras pueden leerlas.

  • Escritores: almacenamientos de datos, secuencias de eventos y modelos semánticos de Power BI exportados a OneLake
  • Lectores: punto de conexión de análisis SQL y modelos semánticos de Direct Lake de Power BI
  • Escritores y lectores: entorno de ejecución de Spark de Fabric, canalizaciones de datos y bases de datos de Kusto Query Language (KQL)

En la matriz siguiente se muestran las características clave de Delta Lake y su compatibilidad con cada funcionalidad de Fabric.

Funcionalidad de Fabric Asignaciones de columnas basadas en nombres Vectores de eliminación Escritura de V-Order Optimización y mantenimiento de tablas Escritura de particiones Lectura de particiones Agrupación en clústeres líquidos TIMESTAMP_NTZ Características de tabla predeterminadas y versión del lector/escritor delta
Exportación de Delta Lake en un almacenamiento de datos No No No No Lector: 3
Escritor: 7
Vectores de eliminación
Punto de conexión de análisis SQL N/A (no aplicable) N/A (no aplicable) N/A (no aplicable) No N/A (no aplicable)
Entorno de ejecución de Fabric Spark 1.3 Lector: 1
Escritor: 2
Entorno de ejecución de Fabric Spark 1.2 Sí, solo de lectura Lector: 1
Escritor: 2
Entorno de ejecución de Fabric Spark 1.1 No Sí, solo de lectura No Lector: 1
Escritor: 2
Flujos de datos No Sí, solo de lectura No Lector: 1
Escritor: 2
Canalizaciones de datos No No No Sí, solo sobrescribir Sí, solo de lectura No Lector: 1
Escritor: 2
Modelos semánticos de Direct Lake en Power BI N/A (no aplicable) N/A (no aplicable) N/A (no aplicable) No N/A (no aplicable)
Exportación de modelos semánticos de Power BI a OneLake N/A (no aplicable) No N/A (no aplicable) No No Lector: 2
Escritor: 5
Bases de datos KQL No No* No No Lector: 1
Escritor: 1
Eventstreams No N.º N.º No N/A (no aplicable) No No Lector: 1
Escritor: 2

Las bases de datos KQL * proporcionan ciertas funcionalidades de mantenimiento de tablas, como la retención. Los datos se eliminan al final del período de retención de OneLake. Para más información, consulte Una copia lógica.

Nota:

  • Fabric no escribe asignaciones de columnas basadas en nombres de forma predeterminada. La experiencia predeterminada de Fabric genera tablas compatibles en todo el servicio. Delta Lake, generado por servicios de terceros, puede tener características de tabla incompatibles.
  • Algunas experiencias de Fabric no tienen funcionalidades de mantenimiento y optimización de tablas heredadas, como compactación de bin, V-Order y limpieza de archivos antiguos a los que no se hace referencia. Las tablas ingeridas mediante esas experiencias usan las técnicas descritas en Uso de la característica de mantenimiento de tablas para administrar tablas delta en Fabric para mantener las tablas de Delta Lake en condiciones óptimas para el análisis.

Limitaciones actuales

Actualmente, Fabric no admite estas características de Delta Lake:

  • Delta Lake 3.x UniForm
  • Escritura de columnas de identidad (característica propietaria de Databricks)
  • Delta Live Tables (característica propietaria de Databricks)
  • RLE (codificación de longitud de ejecución) habilitada en el archivo de punto de comprobación