Condividi tramite


Esportare i dati in Archiviazione BLOB di Azure

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Questo articolo descrive come usare l'opzione Esporta in Archiviazione BLOB di Azure, nel modulo Esporta dati in Machine Learning Studio (versione classica).

Nota

Si applica a: Machine Learning Studio (versione classica)

Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.

Questa opzione è utile quando si vogliono esportare i dati da un esperimento di Machine Learning Archiviazione BLOB di Azure. Ad esempio, è possibile condividere gli output dei dati di Machine Learning con altre applicazioni o archiviare dati intermedi o set di dati puliti da usare in altri esperimenti.

È possibile accedere ai BLOB di Azure da qualsiasi posizione, tramite HTTP o HTTPS. Poiché Archiviazione BLOB di Azure è un archivio dati non strutturato, è possibile esportare i dati in vari formati. Attualmente sono supportati i formati CSV, TSV e ARFF.

Per esportare i dati nel BLOB di Azure per l'uso da parte di altre applicazioni, usare il modulo Export Data (Esporta dati) per salvare i dati Archiviazione BLOB di Azure. Usare quindi qualsiasi strumento in grado di leggere i dati da Archiviazione di Azure, ad esempio Excel, utilità di archiviazione cloud o altri servizi cloud, per caricare e usare i dati.

Nota

I moduli Import Data (Importa dati ) ed Export Data (Esporta dati) possono leggere e scrivere dati solo dall'archiviazione di Azure creata usando il modello di distribuzione classica. In altre parole, il nuovo tipo di account Archiviazione BLOB di Azure che offre livelli di accesso ad accesso più caldo e ad accesso limitato non è ancora supportato.

In genere gli account di archiviazione di Azure creati prima che fosse disponibile questa opzione non dovrebbero essere influenzati.

Tuttavia, se è necessario creare un nuovo account da usare con Machine Learning, è consigliabile selezionare Classica per Modello di distribuzione oppure usare Gestione risorse e per Tipo di account selezionare Utilizzo generico anziché Archiviazione BLOB.

Come esportare i dati in Archiviazione BLOB di Azure

Il servizio BLOB di Azure è per l'archiviazione di grandi quantità di dati, inclusi i dati binari. Esistono due tipi di archiviazione BLOB: BLOB pubblici e BLOB che richiedono credenziali di accesso.

  1. Aggiungere il modulo Export Data (Esporta dati) all'esperimento. È possibile trovare questo modulo nella categoria Input e output dei dati in Studio (versione classica).

  2. Connessione esportare i dati nel modulo che produce i dati da esportare in Archiviazione BLOB di Azure.

  3. Aprire il riquadro Proprietà di Esporta dati. Per la destinazione dei dati, selezionare Archiviazione BLOB di Azure.

  4. Per Tipo di autenticazione scegliere Pubblico (URL di firma di accesso condiviso) se si è a sapere che l'archiviazione supporta l'accesso tramite un URL di firma di accesso condiviso.

    Un URL di firma di accesso condiviso è un tipo speciale di URL che può essere generato tramite un'utilità di archiviazione di Azure ed è disponibile solo per un periodo di tempo limitato. Contiene tutte le informazioni necessarie per l'autenticazione e il download.

    Per URI digitare o incollare l'URI completo che definisce l'account e il BLOB pubblico.

  5. Per gli account privati, scegliere Account e specificare il nome dell'account e la chiave dell'account, in modo che l'esperimento possa scrivere nell'account di archiviazione.

    • Nome account: digitare o incollare il nome dell'account in cui si vogliono salvare i dati. Ad esempio, se l'URL completo dell'account di archiviazione è https://myshared.blob.core.windows.net, digitare myshared.

    • Chiave dell'account: incollare la chiave di accesso alle risorse di archiviazione associata all'account.

  6. Percorso del contenitore, della directory o del BLOB: digitare il nome del BLOB in cui verranno archiviati i dati esportati. Ad esempio, per salvare i risultati dell'esperimento in un nuovo BLOB denominato results01.csv nelle stime del contenitore in un account denominato mymldata, l'URL completo per il BLOB sarà https://mymldata.blob.core.windows.net/predictions/results01.csv.

    Pertanto, nel campo Percorso del contenitore, della directory o del BLOB è necessario specificare il nome del contenitore e del BLOB come indicato di seguito: predictions/results01.csv

  7. Se si specifica il nome di un BLOB che non esiste già, Azure crea automaticamente il BLOB.

    Quando si scrive in un BLOB esistente, è possibile specificare che il contenuto corrente del BLOB deve essere sovrascritto impostando la proprietà Archiviazione BLOB di Azure modalità di scrittura. Per impostazione predefinita, questa proprietà è impostata su Error, vale a dire che viene generato un errore ogni volta che viene trovato un file BLOB esistente con lo stesso nome.

  8. In Formato file per file BLOB selezionare il formato in cui archiviare i dati.

    • CSV: i valori delimitati da virgole (CSV) sono il formato di archiviazione predefinito. Per esportare le intestazioni di colonna insieme ai dati, selezionare l'opzione Scrivi riga intestazione BLOB. Per altre informazioni sul formato delimitato da virgole usato in Machine Learning, vedere Convertire in CSV.

    • TSV: il formato TSV (Tab-Separated Values) è compatibile con molti strumenti di Machine Learning. Per esportare le intestazioni di colonna insieme ai dati, selezionare l'opzione Scrivi riga intestazione BLOB. Per altre informazioni sul formato delimitato da tabulazioni usato in Machine Learning, vedere Convertire in TSV.

    • ARFF: questo formato supporta il salvataggio di file nel formato usato dal set di strumenti Weka. Questo formato non è supportato per i file archiviati in un URL di firma di accesso condiviso. Per altre informazioni sul formato ARFF, vedere Convertire in ARFF.

  9. Usa risultati memorizzati nella cache: selezionare questa opzione se si vuole evitare di riscrivere i risultati nel file BLOB ogni volta che si esegue l'esperimento. Se non sono presenti altre modifiche ai parametri del modulo, l'esperimento scrive i risultati solo alla prima esecuzione del modulo o in caso di modifiche ai dati.

Esempio

Per esempi su come usare il modulo Export Data (Esporta dati), vedere il Azure AI Gallery:

Note tecniche

Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.

Domande frequenti

Come è possibile evitare di scrivere i dati se l'esperimento non è stato modificato

Quando i risultati dell'esperimento cambiano, Esporta dati salva sempre il nuovo set di dati. Tuttavia, se l'esperimento viene eseguito ripetutamente senza apportare modifiche che influiscono sui dati di output, è possibile selezionare l'opzione Usa risultati memorizzati nella cache .

Il modulo controlla se l'esperimento è stato eseguito in precedenza usando gli stessi dati e le stesse opzioni e, se viene trovata un'esecuzione precedente, l'operazione di scrittura non viene ripetuta.

È possibile salvare i dati in un account in un'area geografica diversa

Sì, è possibile scrivere dati in account in aree diverse. Tuttavia, se l'account di archiviazione si trova in un'area diversa dal nodo di calcolo usato per l'esperimento di Machine Learning, l'accesso ai dati potrebbe essere più lento. Vengono inoltre addebitati i costi per i dati in ingresso e in uscita nella sottoscrizione.

Parametri del modulo

Opzioni generali

Nome Intervallo Type Predefinito Descrizione
Origine dati Elenco Origine dati o sink Archiviazione BLOB di Azure La destinazione può essere un file nell'archivio BLOB di Azure, una tabella di Azure, una tabella o una vista in un database SQL di Azure o una tabella Hive.
Usare i risultati memorizzati nella cache VERO/FALSO Boolean FALSE Il modulo viene eseguito solo se non esiste una cache valida. in caso contrario, usare i dati memorizzati nella cache dell'esecuzione precedente.
Please specify authentication type FIRMA DI ACCESSO CONDIVISO/Account AuthenticationType Account Indica se usare la firma di accesso condiviso o le credenziali dell'account per l'autorizzazione di accesso

Public o SAS - Opzioni di archiviazione pubblica

Nome Intervallo Type Predefinito Descrizione
SAS URI for blob any string Nessuno URI di firma di accesso condiviso del BLOB in cui scrivere (obbligatorio)
File format for SAS file ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Indica se il file è CSV, TSV o ARFF. (obbligatorio)
Write SAS header row VERO/FALSO Boolean FALSE Indica se le intestazioni di colonna devono essere scritte nel file

Account - Opzioni di archiviazione privata

Nome Intervallo Type Predefinito Descrizione
Azure account name any string Nessuno Nome dell'account utente di Azure
Azure account key any SecureString Nessuno Chiave di archiviazione di Azure
Path to blob beginning with container any string Nessuno Nome del file BLOB, che inizia con il nome del contenitore
Archiviazione BLOB di Azure di scrittura Elenco: Errore, Sovrascrittura enum:BlobFileWriteMode Errore Scegliere il metodo di scrittura dei file BLOB
File format for blob file ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Indica se il file BLOB è CSV, TSV o ARFF
Write blob header row VERO/FALSO Boolean FALSE Indica se il file BLOB deve avere una riga di intestazione

Eccezioni

Eccezione Descrizione
Errore 0027 Viene generata un'eccezione quando due oggetti che dovrebbero essere delle stesse dimensioni sono differenti.
Errore 0003 Si verifica un'eccezione se uno o più input sono Null o vuoti.
Errore 0029 Viene generata un'eccezione quando viene passato un URI non valido.
Errore 0030 Viene generata un'eccezione se non è possibile scaricare un file.
Errore 0002 Viene generata un'eccezione se non è stato possibile analizzare o convertire uno o più parametri dal tipo specificato nel tipo richiesto dal metodo di destinazione.
Errore 0009 Viene generata un'eccezione se il nome dell'account di Archiviazione di Azure o il nome del contenitore non è stato specificato correttamente.
Errore 0048 Viene generata un'eccezione quando non è possibile aprire un file.
Errore 0046 Viene generata un'eccezione quando non è possibile creare una directory nel percorso specificato.
Errore 0049 Viene generata un'eccezione quando non è possibile analizzare un file.

Per un elenco di errori specifici dei moduli di Studio (versione classica), vedere l'Machine Learning codici di errore.

Per un elenco delle eccezioni API, vedere l'Machine Learning di errore dell'API REST.

Vedi anche

Importazione dei dati
Esportazione dei dati
Esportare in database SQL di Azure
Esportare in una query Hive
Esportare in una tabella di Azure