Maggio 2021
Queste funzionalità e i miglioramenti della piattaforma Azure Databricks sono stati rilasciati a maggio 2021.
Nota
Le versioni vengono gestite in staging. L'account Azure Databricks potrebbe non essere aggiornato fino a una settimana o più dopo la data di rilascio iniziale.
Databricks Mosaic AI: una soluzione nativa e collaborativa per il ciclo di vita completo di Machine Learning
27 maggio 2021
Il nuovo tipo di Machine Learning, selezionabile nella barra laterale dell'interfaccia utente di Azure Databricks, consente di accedere facilmente a un nuovo ambiente appositamente creato per ML, tra cui il registro dei modelli e quattro nuove funzionalità in anteprima pubblica:
- Nuova pagina del dashboard con risorse, recenti e collegamenti introduttivi utili.
- Nuova pagina Esperimenti che centralizza l'individuazione e la gestione degli esperimenti.
- autoML, un modo per generate automaticamente i modelli di Machine Learning dai dati e accelerare il percorso di produzione.
- Feature Store, un modo per catalog funzionalità di Machine Learning e renderle disponibili per il training e la gestione, aumentando il riutilizzo. Con una ricerca delle funzionalità basata sulla derivazione dei dati che sfrutta le fonti di dati registrate automaticamente, è possibile rendere disponibili le funzionalità per il training e il servizio con una distribuzione semplificata del modello che non richiede modifiche all'applicazione client.
Per informazioni dettagliate, vedere Intelligenza artificiale e Machine Learning in Databricks.
SQL Analytics viene rinominata in Databricks SQL
27 maggio 2021
SQL Analytics viene rinominata in Databricks SQL. Per altre informazioni, vedere la nota sulla versione di Databricks SQL.
Creare e gestire pipeline ETL con Delta Live Tables (anteprima pubblica)
26 maggio 2021
Databricks è lieta di introdurre Delta Live Tables, un servizio cloud che rende semplice, affidabile e scalabile lo sviluppo di estrazione, trasformazione e caricamento (ETL). Delta Live Tables:
- Fornisce un'interfaccia dichiarativa intuitiva e familiare per la compilazione di pipeline.
- Consente di monitorare le pipeline di elaborazione dati, visualizzare le dipendenze e gestire pipeline e dipendenze in ambienti diversi.
- Consente lo sviluppo basato su test, l'applicazione di vincoli di qualità dei dati e l'applicazione di criteri di gestione degli errori dei dati uniformi
- Automatizza la distribuzione delle pipeline di elaborazione dati in modo da poter aggiornare, eseguire il rollback e rielaborare i dati in modo incrementale.
Consulta Che cos'è Delta Live Tables? per dettagli.
Le Azure Spot VM sono GA
24 maggio 2021
La possibilità di creare cluster di Azure Databricks con Azure Spot Virtual Machines è ora disponibile a livello generale. È possibile ora get sfruttare le istanze spot di Azure a costi notevolmente inferiori, riducendo il costo totale di proprietà di Azure Databricks. È possibile scegliere di usare le istanze spot di Azure quando:
- Si utilizza l'interfaccia utente per creare un cluster, selezionando la casella di controllo Istanze spot.
- Si utilizza l'API per creare un cluster, specificando il campo
azure_attributes
negli attributi del cluster della richiesta. - Si utilizza l'interfaccia utente per creare un pool di istanze, selezionando l'opzione All spot.
- Si utilizza l'API per creare un pool di istanze, specificando il campo
azure_attributes
nella richiesta di creazione del pool di istanze.
Crittografare le query SQL di Databricks e la cronologia delle query usando la propria chiave (anteprima pubblica)
20 maggio 2021
Per informazioni dettagliate, vedere le note sulla versione di Databricks SQL.
Numero di cluster polivalenti terminati aumentato di limit
18 maggio 2021: versione 3.46
È ora possibile avere fino a 150 cluster universali terminati in un'area di lavoro di Azure Databricks. In precedenza il limit era 120. Per informazioni dettagliate, vedere Come terminare un calcolo. Il limit sul numero di cluster all-purpose terminati restituiti dalla richiesta API Clusters è ora di 150.
Aumento limit per il numero di cluster bloccati
18 maggio 2021: versione 3.46
È ora possibile avere fino a 70 cluster segnaposto in un'area di lavoro di Azure Databricks. In precedenza il limit era 50. Per informazioni dettagliate, vedere Associare un calcolo
Gestire where i risultati del notebook vengono archiviati (anteprima pubblica)
18 maggio 2021: versione 3.46
È ora possibile scegliere di archiviare tutti i risultati del notebook nell'istanza radice Archiviazione di Azure indipendentemente dalle dimensioni o dal tipo di esecuzione. Per impostazione predefinita, alcuni risultati per i notebook interattivi vengono archiviati in Azure Databricks. Una nuova configurazione consente di archiviare questi elementi nell'istanza radice Archiviazione di Azure nel proprio account. Per informazioni dettagliate, vedere Configurare la posizione di archiviazione dei risultati del notebook.
Questa funzionalità non ha alcun impatto sui notebook eseguiti come processi, i cui risultati vengono sempre archiviati nell'istanza radice Archiviazione di Azure.
Crittografare i dati del notebook e dei segreti nel piano di controllo con la propria chiave (anteprima pubblica)
10 maggio 2021
Un'area di lavoro di Azure Databricks comprende un piano di controllo ospitato in una sottoscrizione gestita da Azure Databricks e un piano di calcolo distribuito nella sottoscrizione di Azure. Il piano di controllo archivia i dati dei servizi gestiti, inclusi i comandi dei notebook, i segreti e altri dati di configurazione dell'area di lavoro. Per impostazione predefinita, questi dati vengono crittografati con una chiave gestita da Azure Databricks, ma è ora possibile aggiungere una chiave dall'istanza di Azure Key Vault per crittografare questi dati. Vedere Abilitare chiavi gestite dal cliente per servizi gestiti.
Termine del supporto di Databricks Runtime serie 7.4
3 maggio 2021
Il 3 maggio è terminato il supporto per Databricks Runtime 7.4, Databricks Runtime 7.4 per Machine Learning e Databricks Runtime 7.4 per Genomics. Vedere Cicli di vita del supporto di Databricks.
Gli utenti di Repository possono ora eseguire l'integrazione con Azure DevOps usando i token di accesso personali
3-10 maggio 2021: versione 3.45
Oltre ai token di accesso di Microsoft Entra ID, è ora possibile usare un token di accesso personale per eseguire l'autenticazione con Azure DevOps. Per informazioni dettagliate, vedere Set configurare le cartelle Git di Databricks (Repos).