Condividi tramite


Confronto tra volumes esterne e gestite

Questo articolo illustra le differenze tra volumes gestito e volumes esterno e i motivi per cui si potrebbe scegliere di utilizzare volumesesterni. Databricks consiglia di gestire volumes come soluzione più semplice per l'archiviazione e la gestione dell'accesso a dati non tabulari.

Per altre indicazioni sull'uso di Unity Catalog per configurare l'accesso all'archiviazione di oggetti cloud, vedere Connettersi all'archiviazione di oggetti cloud e ai servizi usando Unity Catalog.

Differenze di comportamento tra volumes gestite e esterne

Le volumes gestite ed esterne offrono esperienze quasi identiche quando si usano strumenti, interfacce utente e API di Azure Databricks. Di seguito sono riportate le differenze tra questi tipi di volume.

Le volumes gestite offrono un'esperienza di archiviazione completamente gestita. Ciò comporta quanto segue:

  • Tutte le interazioni con i file gestiti in volumes devono essere effettuate tramite Unity Catalog.
  • La denominazione della directory e il layout dei dati sono gestiti da Unity Catalog. I nomi di directory includono hash per evitare conflitti negli account di archiviazione degli oggetti cloud sottostanti.
  • Quando si elimina un volume gestito, Azure Databricks elimina i dati sottostanti entro 30 giorni.

I volumes esterni portano la governance dei dati nell'archiviazione di oggetti cloud. Ciò comporta quanto segue:

  • È possibile usare gli URI cloud in Azure Databricks o sistemi esterni per interagire con i file nei sistemi esterni volumes.
  • Tutte le directory create all'interno di un volume esterno o i file caricati sono relativi all'oggetto specificato al momento della LOCATION creazione.
  • Quando si rilascia un volume esterno, è remove il volume da Unity Catalog ma i dati sottostanti rimangono invariati nella posizione esterna.

Perché usare volumesesterno?

Le volumes esterne consentono di aggiungere la governance dei dati di Unity Catalog alle directory di archiviazione degli oggetti cloud esistenti. Di seguito sono riportati alcuni casi d'uso per volumes esterni:

  • Aggiunta della governance ai file di dati senza migrazione.
  • Governance dei file prodotti da altri sistemi a cui è necessario inserire o accedere da Azure Databricks.
  • Governance dei dati prodotti da Azure Databricks a cui è necessario accedere direttamente dall'archiviazione di oggetti cloud da altri sistemi.

Databricks consiglia di usare volumes esterni per archiviare file di dati non tabulari letti o scritti da sistemi esterni oltre ad Azure Databricks. Unity Catalog non regola le letture e le scritture eseguite direttamente nell'archiviazione di oggetti cloud da sistemi esterni, pertanto è necessario configurare criteri aggiuntivi e credentials nell'account cloud per garantire che i criteri di governance dei dati vengano rispettati all'esterno di Azure Databricks.