Condividi tramite


Luglio 2024

Queste funzionalità e i miglioramenti della piattaforma Azure Databricks sono stati rilasciati a luglio 2024.

Nota

Le versioni vengono distribuite gradualmente. L’account Azure Databricks potrebbe non essere aggiornato fino a una settimana o più dopo la data di rilascio iniziale.

Maggiore limit per le attività simultanee

31 luglio 2024

L'area di lavoro limit per le attività in esecuzione contemporaneamente è stata aumentata a 2000. Vedere Limiti delle risorse.

Incorporare e trascinare immagini nei notebook

31 luglio 2024

È ora possibile visualizzare le immagini nei notebook incorporandole direttamente nelle celle markdown. Trascinare e rilasciare immagini dal desktop direttamente nelle celle markdown per caricarle e visualizzarle automaticamente. Vedi Visualizzare immagini e trascinare immagini.

Riquadro comandi disponibile nei notebook

31 luglio 2024

È ora possibile eseguire rapidamente azioni nel notebook usando il riquadro comandi. Premere CMD + MAIUSC + P in MacOS o CTRL + MAIUSC + P in Windows mentre si usa un notebook per accedere alle azioni usate di frequente. Vedere il riquadro comandi.

Sistema di flusso di lavoro schema rinominato in lakeflow

31 luglio 2024

Il workflowschema viene aggiornato a lakeflow. È consigliabile passare a lakeflow perché includerà tutti gli attuali tables, oltre a quelli nuovi in futuro, come ad esempio le pipeline. I clienti devono acconsentire esplicitamente al lakeflowschema per renderlo visibile nel metastore. Vedi riferimento al sistema Jobs table.

LakeFlow Connect (anteprima pubblica controllata)

31 luglio 2024

LakeFlow Connect offre connettori nativi che consentono di inserire dati da database e applicazioni aziendali e caricarli in Azure Databricks. LakeFlow Connect sfrutta letture e scritture incrementali efficienti per rendere l’inserimento dei dati più veloce, scalabile e più conveniente, mentre i dati rimangono aggiornati per l’utilizzo downstream.

Salesforce Sales Cloud, database SQL di Microsoft Azure, Amazon RDS per SQL Server e Workday sono attualmente supportati. Consultare LakeFlow Connect.

Il supporto per l’archiviazione di Cloudflare R2 è disponibile a livello generale

30 luglio 2024

La possibilità di usare Cloudflare R2 come archiviazione cloud per i dati registrati in Unity Catalog è ora disponibile a livello generale. Cloudflare R2 è destinato principalmente ai casi d'uso di Delta Sharing in cui si vogliono evitare i costi di uscita dei dati addebitati dal cloud providers quando i dati attraversano le regioni. L’archiviazione R2 supporta tutti gli asset di dati e intelligenza artificiale di Databricks supportati in AWS S3, Azure Data Lake Storage Gen2 e Google Cloud Storage. Il supporto per R2 richiede SQL Warehouse o Databricks Runtime 14.3 o versione successiva. Consultare Usare repliche Cloudflare R2 o eseguire la migrazione dell’archiviazione a R2 e Creare credenziali di archiviazione per la connessione a Cloudflare R2.

Monitorare le attività di Databricks Assistant con il sistema tables (anteprima pubblica)

30 luglio 2024

È ora possibile monitorare le attività di Databricks Assistant in un dashboard usando il sistema tables. Per altre informazioni, vedere table riferimento di sistema di Databricks Assistant ed esempio.

La condivisione degli schemi con la condivisione differenziale è ora disponibile a livello generale

30 luglio 2024

La possibilità di condividere gli schemi usando la condivisione delta è disponibile a livello generale. La condivisione dell'intera schema consente al destinatario di accedere a tutti i tables e views nel schema al momento della condivisione, insieme a qualsiasi tables e views che vengono aggiunti al schema in futuro. L’aggiunta di schemi a una condivisione tramite i comandi SQL richiede un'istanza di SQL Warehouse o un cluster che esegue Databricks Runtime 13.2 o una versione successiva. Usare Catalog Explorer per eseguire la stessa operazione non prevede requisiti di calcolo. Consultare Aggiungere schemi a una condivisione.

Mosaic AI Agent Framework è disponibile in northcentral e centralus

29 luglio 2024

Mosaic AI Agent Framework è ora disponibile nelle northcentral aree e centralus . Consultare Funzionalità con disponibilità a livello di area limitata.

Databricks Assistant può diagnosticare i problemi relativi ai processi (anteprima pubblica)

29 luglio 2024

Databricks Assistant può ora diagnosticare i problemi con i processi non riusciti. Consultare Diagnosticare gli errori nei processi.

Aggiornamenti ai comportamenti di autenticazione e condivisione delle cartelle Git di Databricks

29 luglio 2024

  • Gestione dell’autenticazione basata su finestre di dialogo della cartella Git: l’esperienza utente è ora semplificata per facilitare il ripristino da errori di autenticazione durante l’apertura della finestra di dialogo della cartella Git. Nella finestra di dialogo puoi Git updatecredentials direttamente, il che attiva un tentativo automatico. È possibile usare questo approccio per facilitare la risoluzione degli errori di autenticazione.
    • Quando si verifica un errore di autenticazione, la finestra di dialogo della cartella Git mostra ora il provider e l’URL della cartella Git nell’errore. In precedenza era nascosto, rendendo difficile sapere quali credenziali Git devono essere usate per risolvere l’errore.
  • Condivisione cartelle Git: gli utenti possono ora condividere un collegamento URL ad altri utenti dell’area di lavoro. Quando l'URL viene aperto nel browser del destinatario, Databricks apre e avvia la finestra di dialogo esistente Aggiungi cartella Git con values precompilati, ad esempio il provider Git e l'URL del repository Git. Ciò semplifica la clonazione di cartelle Git per i repository Git di uso comune tra gli utenti dell’area di lavoro. Per altri dettagli, consultare Procedura consigliata: Collaborazione in cartelle Git.
    • Agli utenti viene ora richiesto di creare cartelle Git personalizzate nella propria area di lavoro anziché lavorare in modo collaborativo nella cartella Git di un altro utente.
    • Lo stato della finestra di dialogo della cartella Git è ora fissa nell’URL. Se si copia l’URL dal browser quando la finestra di dialogo della cartella Git è aperta, è possibile aprirla in un secondo momento o condivisa con un altro utente e verranno visualizzate le stesse informazioni.
  • Visualizzazione diff della cartella Git: nella visualizzazione diff della cartella Git è stata aggiunta l’evidenziazione più scura e verde per il testo sostituito e per più righe di modifiche, rendendo più semplice determinare cosa è stato modificato nelle modifiche di cui non è stato eseguito il commit.
    • L’apertura della finestra di dialogo della cartella Git da un notebook o da un editor di file seleziona il notebook o il file nella finestra di dialogo della cartella Git e visualizza le modifiche (differenze) per impostazione predefinita.

Timeout di installazione della libreria cluster

29 luglio 2024

L’installazione della libreria nei cluster ha ora un timeout di 2 ore. Una libreria che ha impiegato più di 2 ore per l’installazione verrà contrassegnata come non riuscita. Per informazioni sulle librerie cluster, consultare Librerie cluster.

Gli indirizzi IP in uscita del sistema di calcolo devono essere aggiunti a una lista di autorizzazioni IP dell'area di lavoro list

29 luglio 2024

Quando si configurano elenchi di accesso IP e connettività del cluster sicuro in una nuova area di lavoro, è necessario aggiungere a un elenco di indirizzi IP pubblici usati dal piano di calcolo per accedere al piano di controllo a un list consentito o configurare collegamento privato back-end. Questa modifica influirà su tutte le nuove aree di lavoro il 29 luglio 2024 e le aree di lavoro esistenti il 26 agosto 2024. Per altre informazioni, consultare Databricks Community post.

Ad esempio, se si abilita la connettività sicura del cluster in un’area di lavoro che usa l’inserimento di reti virtuali, Databricks consiglia che l’area di lavoro disponga di un indirizzo IP pubblico in uscita stabile. Tale indirizzo IP pubblico e qualsiasi altro utente deve essere incluso in un elenco elementi consentiti. Consultare Indirizzi IP in uscita quando si usa la connettività sicura del cluster. In alternativa, se si usa una rete virtuale gestita da Azure Databricks e si configura il gateway NAT gestito per accedere agli indirizzi IP pubblici, tali indirizzi IP devono trovarsi in un elenco di indirizzi consentiti.

Consultare Configurare gli elenchi di accesso IP per le aree di lavoro.

Termine del supporto di Databricks Runtime serie 9.1

26 luglio 2024

Il supporto per Databricks Runtime 9.1 LTS e Databricks Runtime 9.1 LTS per Machine Learning è stato esteso dal 23 settembre 2024 al 19 dicembre 2024.

L’accesso Single Sign-On (SSO) è supportato in Lakehouse Federation per SQL Server

25 luglio 2024

Unity Catalog ora consente di creare connections SQL Server usando l'autenticazione SSO. Vedere Eseguire query federate in Microsoft SQL Server.

La condivisione di modelli con la condivisione delta è ora disponibile a livello generale

26 luglio 2024

Il supporto della condivisione differenziale per la condivisione dei modelli di intelligenza artificiale è ora disponibile a livello generale. Le aree di lavoro del provider e del destinatario devono essere abilitate per Unity Cataloge i modelli devono essere registrati in Unity Catalog.

Consultare Aggiungere modelli a una condivisione.

Condividere commenti e vincoli di chiave primaria usando la condivisione differenziale

25 luglio 2024

La condivisione differenziale supporta ora la condivisione dei metadati degli oggetti, inclusi i commenti e i vincoli di chiave primaria:

  • I commenti del modello e i commenti sulla versione del modello sono stati inclusi da tempo in Databricks-to-Databricks shares, ma non sono stati annunciati.

  • Table commenti, commenti column, vincoli di chiave primaria e commenti del volume sono ora inclusi in Databricks-to-Databricks shares che sono stati condivisi con il destinatario a partire dal 25 luglio 2024.

    Se si desidera includere commenti o vincoli in una condivisione che è stata condivisa con un destinatario prima di tale data, è necessario revoke e ri-grant accesso del destinatario per attivare la possibilità di commentare e constraint la condivisione.

Vedere Creare e gestire shares per la condivisione delta.

Nuovo driver JDBC di Databricks (OSS)

25 luglio 2024

È stato rilasciato un nuovo driver JDBC di Databricks open source per l’anteprima pubblica. Questo driver ha implementato le API JDBC e fornisce altre funzionalità fondamentali, tra cui OAuth, Cloud Fetch e l'inserimento di volumi Unity Catalog. Per altre informazioni, consultare Databricks JDBC Driver (OSS).

Databricks Runtime 15.4 LTS (Beta)

23 luglio 2024

Databricks Runtime 15.4 LTS e Databricks Runtime 15.4 LTS ML sono ora disponibili come versioni beta.

Consultare Databricks Runtime 15.4 LTS e Databricks Runtime 15.4 LTS per Machine Learning.

Scala è disponibile per il rilascio generale su Unity Catalog per il calcolo condiviso

23 luglio 2024

In Databricks Runtime 15.4 LTS e versioni successive, Scala è generalmente disponibile in modalità di accesso condiviso su computazione abilitata da Unity Catalog, incluso il supporto per funzioni scalari definite dall'utente (UDF). Le funzioni di aggregazione Structured Streaming, Hive UDF e Hive definite dall’utente non sono supportate. Per un list completo delle limitazioni, vedere Limitazioni della modalità di accesso alle risorse di calcolo per Unity Catalog.

L'ambiente di calcolo con utente singolo supporta il controllo di accesso a grana fine, la materializzazione di viewse lo streaming di tables.

23 luglio 2024

Databricks Runtime 15.4 LTS introduce il supporto per il controllo di accesso con granularità fine su un singolo ambiente di calcolo utente, purché l'area di lavoro sia abilitata per il calcolo serverless. Quando una query accede a una delle risorse di calcolo seguenti, la singola risorsa di calcolo utente in Databricks Runtime 15.4 LTS passa la query al calcolo serverless per eseguire il filtro dei dati:

  • Views costruita su tables in cui l'utente non dispone del privilegio SELECT
  • views dinamica
  • Tables con filtri di riga o maschere di column applicate
  • views materializzati e tables di streaming

Queste query non sono supportate nel calcolo a singolo utente in esecuzione in Databricks Runtime 15.3 e versioni successive.

Per altre informazioni, vedere Controllo di accesso con granularità fine per il calcolo di un singolo utente.

Il sistema sequenza temporale dei nodi table è ora disponibile (anteprima pubblica)

23 luglio 2024

Il system.computeschema include ora un node_timelinetable. Questo table registra minuto per minuto le metriche di utilizzo delle risorse di calcolo per scopi generici e processi eseguiti nell'account. Vedere sequenza temporale del nodo tableschema.

Nota

Per accedere a questa table, un amministratore deve abilitare il computeschema se non lo è già. Vedere Abilitare gli schemi di sistema table.

Meta Llama 3.1 è ora supportato in Model Serving

23 luglio 2024

Mosaic AI Model Serving ha collaborato con Meta per supportare Meta Llama 3.1, un'architettura del modello creata e sottoposta a training da Meta ed è distribuita da Azure Machine Learning usando il modello azureML Catalog. Llama 3.1 è supportato come parte delle API del modello di base. Consultare Usare le API del modello foundation.

  • Meta-Llama-3.1-405B-Instruct e Meta-Llama-3.1-70B-Instruct sono disponibili nelle aree dell’endpoint di gestione con pagamento per token.
  • L’utilizzo di produzione della suite completa di modelli Llama 3.1 (8B, 70B e 405B) è disponibile negli Stati Uniti usando la velocità effettiva con provisioning.

A partire dal 23 luglio 2024, Meta-Llama-3.1-70B-Instruct sostituisce il supporto per gli endpoint Meta-Llama-3-70B-Instruct in Foundation Model API con pagamento per token.

Notebook: attivare o disattivare i titoli delle celle visibili

18 luglio 2024

Gli utenti possono abilitare Mostra titoli di cella alzati di livello nelle impostazioni di sviluppo per rendere i titoli delle celle del notebook più visibili nell’interfaccia utente. Consultare Titoli delle celle alzati di livello

/ nei nomi degli asset dell’area di lavoro è deprecato

17 luglio 2024

Per evitare ambiguità nelle stringhe di percorso, l’uso di “/” nei nomi dei nuovi asset dell’area di lavoro (ad esempio notebook, cartelle e query) è stato deprecato. Gli asset esistenti con "/" nei nomi non sono interessati, ma la ridenominazione degli asset esistenti segue le stesse regole dei nuovi asset.

La condivisione delta consente di condividere tables che usano clustering liquido

16 luglio 2024

La funzione Delta Sharing ora consente di condividere tables, abilitati per il clustering liquido, e di eseguire query batch su di essi tramite recipients. Il clustering liquido semplifica le decisioni relative al layout dei dati e ottimizza le prestazioni delle query. Vedere Usare clustering liquido per delta tables e matrice di supporto delle funzionalità Delta Lake.

Il sistema della cronologia delle query table è ora disponibile (Pubblica Anteprima)

16 luglio 2024

Il sistema Azure Databricks tables ora include una cronologia delle interrogazioni table. Questo table registra i record dettagliati di ogni interrogazione eseguita in un magazzino di dati SQL nell'account. Per accedere alla table, gli amministratori devono abilitare il nuovo sistema queryschema. Vedere il riferimento del sistema cronologia query table.

I report di analisi della vulnerabilità vengono ora inoltrati tramite posta elettronica agli amministratori

16 luglio 2024

I report di analisi della vulnerabilità vengono ora inoltrati tramite posta elettronica agli amministratori dell’area di lavoro nelle aree di lavoro che consentono il monitoraggio della sicurezza avanzato. In precedenza, gli amministratori dell’area di lavoro dovevano richiederli da Azure Databricks. Consultare Monitoraggio della sicurezza avanzato.

Partition la registrazione dei metadati per Unity Catalogtables esterni

15 luglio 2024

In Databricks Runtime 13.3 LTS e versioni successive è possibile abilitare facoltativamente partition registrazione dei metadati per tables esterni registrati in Unity Catalog che usano Parquet, ORC, CSV o JSON. Partition La registrazione dei metadata è una strategia di scoperta partition coerente con il metastore Hive. Consultare la scoperta Partition per tablesesterni.

Il calcolo serverless per i flussi di lavoro è disponibile a livello generale

15 luglio 2024

Il calcolo serverless per i flussi di lavoro è ora disponibile a livello generale. Il calcolo serverless per i flussi di lavoro consente di eseguire il processo di Azure Databricks senza configurare e distribuire l’infrastruttura. Con il calcolo serverless per i flussi di lavoro, Azure Databricks gestisce in modo efficiente le risorse di calcolo che eseguono il processo, inclusa l’ottimizzazione e la scalabilità del calcolo per i carichi di lavoro. Consultare Eseguire il processo di Azure Databricks con calcolo serverless per i flussi di lavoro.

L’ambiente di calcolo serverless per i notebook è disponibile a livello generale

15 luglio 2024

L’ambiente di calcolo serverless per i notebook è ora disponibile a livello generale. L’ambiente di calcolo serverless per notebook offre l’accesso su richiesta alle risorse di calcolo scalabili nei notebook, consentendo di scrivere ed eseguire immediatamente il codice Python o SQL. Consultare Calcolo serverless per notebook.

Databricks Connect per Python supporta ora l’ambiente di calcolo serverless

15 luglio 2024

Databricks Connect per Python supporta ora la connessione al calcolo serverless. Questa funzionalità è disponibile come Anteprima Pubblica. Consultare Configurare una connessione al calcolo serverless.

Filtrare gli output dei dati usando i prompt del linguaggio naturale

11 luglio 2024

È ora possibile usare Databricks Assistant per filtrare gli output dei dati usando i prompt del linguaggio naturale. Ad esempio, per filtrare i dati dei sopravvissuti del Titanic table, è possibile digitare "Mostra solo maschi oltre 70". Consultare Filtrare i dati con i prompt del linguaggio naturale.

Supporto dei segreti in testo non crittografato per i modelli esterni

11 luglio 2024

È ora possibile immettere direttamente le chiavi API come stringhe di testo non crittografato per modellare gli endpoint che ospitano modelli esterni. Consultare Configurare il provider per un endpoint.

Prevedere i dati delle serie temporali usando ai_forecast()

11 luglio 2024

Funzioni di intelligenza artificiale supporta ai_forecast()ora , una nuova funzione SQL di Databricks per analisti e data scientist progettati per estrapolare i dati delle serie temporali in futuro. Consultare ai_forecast funzione.

Il supporto delle attività file SQL per i file con query SQL con più istruzioni è disponibile a livello generale

10 luglio 2024

Il supporto per l'uso di file che contengono query SQL con più istruzioni con l'attività File SQL è ora disponibile a livello generale. Questa modifica consente di eseguire più istruzioni SQL da un singolo file. In precedenza, era necessario aggiungere un file separato per ogni istruzione. Per altre informazioni sull'attività File SQL, vedere Attività SQL per i processi.

Lakehouse Federation supporta Salesforce Data Cloud (anteprima pubblica)

10 luglio 2024

È ora possibile eseguire query federate sui dati gestiti da Salesforce Data Cloud. Consultare Eseguire query federate in Salesforce Data Cloud.

sistema Databricks Assistant table ora disponibile (anteprima pubblica)

10 luglio 2024

Gli eventi di Databricks Assistant vengono ora registrati in un sistema table situato presso system.access.assistant_events. Vedere riferimento table di sistema di Databricks Assistant ed esempio.

API SCIM account v2.1 (anteprima pubblica)

10 luglio 2024

Le API SCIM account vengono aggiornate dalla versione 2.0 alla versione 2.1 per garantire velocità e affidabilità. È possibile scaricare un PDF delle informazioni di riferimento sull’API SCIM v2.1 dell’account.

Aumento della quota di risorse per tables per il metastore di Unity Catalog

3 luglio 2024

Il metastore Catalog Unity può ora registrare fino a un milione di tables. Vedere Quote di risorse.

Databricks Assistant può diagnosticare automaticamente gli errori del notebook

2 luglio 2024

Databricks Assistant può ora essere eseguito /fix automaticamente nei notebook quando rileva un messaggio di errore. Assistant usa l’intelligenza artificiale generativa per analizzare il codice e il messaggio di errore per suggerire una correzione direttamente nel notebook. Per altre informazioni, consultare Eseguire il debug del codice Python ed esempi SQL.

Il supporto per la sintassi :param con l'attività file SQL è disponibile a livello generale

1 luglio 2024

Il supporto per l'uso della sintassi :param con query con parametri nell'attività Processi SQL di Azure Databricks è disponibile a livello generale. È ora possibile fare riferimento alla query parameters anteponendo i relativi nomi con due punti (:parameter_name). Questa sintassi è oltre al supporto esistente per la sintassi delle parentesi graffe doppie ({{parameter_name}}). Per ulteriori informazioni sull'uso delle query parametrizzate con l'attività File SQL, vedi Configurare l'attività parameters.