Runtime di Fabric 1.3 (GA)
Il runtime di Fabric offre un'integrazione perfetta con Azure. Offre un ambiente sofisticato per progetti sia di ingegneria dei dati che di data science che usano Apache Spark. Questo articolo offre una panoramica delle funzionalità e dei componenti essenziali del Runtime 1.3 di Fabric, il runtime più recente per i calcoli di Big Data.
Microsoft Fabric Runtime 1.3 è la versione più recente del runtime ga e incorpora i componenti e gli aggiornamenti seguenti progettati per migliorare le funzionalità di elaborazione dei dati:
- Apache Spark 3.5
- Sistema operativo: Mariner 2.0
- Java: 11
- Scala: 2.12.17
- Python: 3.11
- Delta Lake: 3.2
- R: 4.4.1
Suggerimento
Fabric Runtime 1.3 include il supporto per il motore di esecuzione nativo, che può migliorare significativamente le prestazioni senza costi aggiuntivi. Per abilitare il motore di esecuzione nativo in tutti i processi e i notebook nell'ambiente, passare alle impostazioni dell'ambiente, selezionare Calcolo Spark, passare alla scheda Accelerazione e selezionare Abilita motore di esecuzione nativo. Dopo il salvataggio e la pubblicazione, questa impostazione viene applicata nell'ambiente, quindi tutti i nuovi processi e notebook ereditano e traggono vantaggio automaticamente dalle funzionalità di prestazioni avanzate.
Usare le istruzioni seguenti per integrare il Runtime 1.3 nell'area di lavoro e usare le nuove funzionalità:
- Passare alla scheda Impostazioni area di lavoro all'interno dell'area di lavoro di Fabric.
- Passare alla scheda Ingegneria dei dati / Data science e selezionare Impostazioni di Spark.
- Fare clic sulla scheda Ambiente.
- Nell'elenco a discesa Versioni di runtime espandere l'elenco a discesa.
- Selezionare 1.3 (Spark 3.5, Delta 3.2) e salvare le modifiche. Questa azione imposta 1.3 come runtime predefinito per l'area di lavoro.
È ora possibile iniziare a usare i miglioramenti e le funzionalità più recenti introdotti in Runtime di Fabric 1.3 (Spark 3.5 e Delta Lake 3.2).
In primo piano
Apache Spark 3.5
Apache Spark 3.5.0 è la sesta versione della serie 3.x. Questa versione è un prodotto di ampia collaborazione all'interno della community open source e risolve più di 1.300 problemi come registrato in Jira.
In questa versione è disponibile un aggiornamento della compatibilità per Structured Streaming. Inoltre, questa release amplia le funzionalità all'interno di PySpark e SQL. Aggiunge funzionalità come la clausola dell'identificatore SQL, argomenti denominati in chiamate di funzione SQL e l'inclusione di funzioni SQL per le aggregazioni approssimative HyperLogLog. Altre nuove funzionalità includono funzioni di tabelle definite dall'utente Python, semplificazione del training distribuito tramite DeepSpeed e nuove funzionalità di Structured Streaming come la propagazione della filigrana e l'operazione dropDuplicatesWithinWatermark.
È possibile controllare l'elenco completo e le modifiche dettagliate qui: https://spark.apache.org/releases/spark-release-3-5-0.html.
Delta Spark
Delta Lake 3.2 è un impegno collettivo per rendere l'interoperabilità delta Lake tra formati, più facile da usare e prestazioni più elevate. Delta Spark 3.2 è basato su Apache Spark™ 3.5. L'artefatto Maven di Delta Spark è stato rinominato da delta-core a delta-spark.
È possibile controllare l'elenco completo e le modifiche dettagliate qui: https://docs.delta.io/3.2.0/index.html.
Suggerimento
Per informazioni aggiornate, un elenco dettagliato delle modifiche e le note sulla versione specifiche per i runtime di Fabric, controllare e sottoscrivere Release e aggiornamenti dei runtime di Spark.
Contenuto correlato
- Informazioni su Runtime di Apache Spark in Fabric - Panoramica, controllo delle versioni, supporto di più runtime e aggiornamento del protocollo Delta Lake
- Guida alla migrazione di Spark Core
- Guide alla migrazione di SQL, set di dati e DataFrame
- Guida alla migrazione di Structured Streaming
- Guida alla migrazione di MLlib (Machine Learning)
- Guida alla migrazione di PySpark (Python in Spark)
- Guida alla migrazione di SparkR (R in Spark)