Condividi tramite


Modulo 1: Creare una pipeline con Data Factory

Questo modulo richiede 10 minuti, l'inserimento di dati non elaborati dall'archivio di origine nella tabella Bronze di un data Lakehouse usando il attività Copy in una pipeline.

La procedura generale nel modulo 1 è la seguente:

  1. Creazione di una pipeline di dati.
  2. Usare un'attività di copia nella pipeline per caricare dati di esempio in un data Lakehouse.

Creazione di una pipeline di dati

  1. Un account tenant Microsoft Fabric con una sottoscrizione attiva è richiesto. Creare un account gratuito.

  2. Assicurarsi di disporre di un'area di lavoro abilitata per Microsoft Fabric: Creare un'area di lavoro.

  3. Accedi a Power BI.

  4. Selezionare l'icona predefinita di Power BI nella parte inferiore sinistra della schermata e passare all'esperienza data factory.

    Screenshot showing the selection of the Data Factory experience.Screenshot che mostra la selezione dell'esperienza data factory.

  5. Selezionare Pipeline di dati e specificare un nome di pipeline. Selezionare Crea.

    Screenshot of the Data Factory start page with the button to create a new data pipeline selected.Screenshot della pagina iniziale di Data Factory con il pulsante per creare una nuova pipeline di dati selezionata.

    Screenshot showing the dialog to give the new pipeline a name.Screenshot che mostra la finestra di dialogo per assegnare un nome alla nuova pipeline.

Usare un attività Copy nella pipeline per caricare dati di esempio in un data Lakehouse

Passaggio 1: Usare l'assistente copia per configurare un'attività di copia.

Selezionare Assistente di copia dei dati per aprire lo strumento di assistente copia.

Screenshot showing the selection of the Copy data activity from the new pipeline start page.Screenshot che mostra la selezione dell'attività Copia dati dalla nuova pagina iniziale della pipeline.

Passaggio 2: Configurare le impostazioni nell'Assistente copia.

  1. La finestra di dialogo Copia dati viene visualizzata con il primo passaggio, Scegliere l'origine dati, evidenziata. Selezionare dati di esempio dalle opzioni nella parte superiore della finestra di dialogo e quindi selezionare NYC Taxi - Green.

    Screenshot che mostra la selezione dei dati NYC Taxi - Verde nell'assistente di copia nella scheda Scegli origine dati.

  2. L'anteprima dell'origine dati appare successivamente sulla pagina Connetti all'origine dati. Rivedere e quindi selezionare Avanti.

    Screenshot che mostra i dati di anteprima del dataset di esempio NYC Taxi - Green.

  3. Per il passaggio Scegli destinazione dati dell'Assistente copia selezionare Lakehouse e quindi Avanti.

    Screenshot showing the selection of the Lakehouse destination on the Choose data destination tab of the Copy data assistant.Screenshot che mostra la selezione della destinazione Lakehouse nella scheda Scegli destinazione dati dell'Assistente copia dati.

  4. Selezionare Crea nuovo Lakehouse nella pagina di configurazione della destinazione dati visualizzata e immettere un nome per il nuovo Lakehouse. Quindi selezionare nuovamente Avanti.

    Screenshot showing the data destination configuration page of the Copy assistant, choosing the Create new Lakehouse option and providing a Lakehouse name.Screenshot che mostra la pagina di configurazione della destinazione dati dell'Assistente copia, scegliendo l'opzione Crea nuova Lakehouse e specificando un nome Lakehouse.

  5. Configurare ora i dettagli della destinazione Lakehouse nella pagina Seleziona ed esegui il mapping al percorso o alla tabella della cartella. Selezionare Tabelle per la cartella Radice, specificare un nome di tabella e scegliere l'azione Sovrascrivi. Non selezionare la casella di controllo Abilita partizione visualizzata dopo aver selezionato l'azione della tabella Sovrascrivi.

    Screenshot showing the Connect to data destination tab of the Copy data assistant, on the Select and map to folder path or table step.Screenshot che mostra la scheda Connetti alla destinazione dati dell'Assistente copia dati nel passaggio Seleziona ed esegui il mapping al percorso della cartella o della tabella.

  6. Infine, nella pagina Rivedi e salva dell'Assistente copia dati, esaminare la configurazione. Per questa esercitazione deselezionare la casella di controllo Avvia trasferimento dati immediatamente, perché l'attività viene eseguita manualmente nel passaggio successivo. Quindi, seleziona OK.

    Screenshot showing the Copy data assistant on the Review + save page.Screenshot che mostra l'Assistente copia dati nella pagina Rivedi e salva.

Passaggio 3: Eseguire e visualizzare i risultati del attività Copy.

  1. Selezionare la scheda Esegui nell'editor della pipeline. Selezionare quindi il pulsante Esegui, quindi Salva ed eseguie al prompt per eseguire il attività Copy.

    Screenshot showing the pipeline Run tab with the Run button highlighted.Screenshot che mostra la pipeline della scheda Esegui, con il pulsante Esegui evidenziato.

    Screenshot showing the Save and run dialog with the Save and run button highlighted.Screenshot che mostra la finestra di dialogo Salva ed esegui con il pulsante Salva ed esegui evidenziato.

  2. È possibile monitorare l'esecuzione e controllare i risultati nella scheda Output sotto l'area di disegno della pipeline. Selezionare il pulsante Dettagli esecuzione (icona "occhiali" visualizzata quando si passa il puntatore del mouse sull'esecuzione della pipeline) per visualizzare i dettagli dell'esecuzione.

    Screenshot showing the run details button in the pipeline Output tab.Screenshot che mostra il pulsante dettagli esecuzione nella scheda Output della pipeline.

  3. I dettagli dell'esecuzione mostrano 1.508.501 righe lette e scritte.

    Screenshot of the Copy data details for the pipeline run.Screenshot dei dettagli della copia dei dati per l'esecuzione della pipeline.

  4. Espandere la sezione Suddivisione durata per visualizzare la durata di ogni fase del attività Copy. Dopo aver esaminato i dettagli di copia, selezionare Chiudi.

    Screenshot showing the duration breakdown of the Copy activity run.Screenshot che mostra la suddivisione della durata dell'esecuzione attività Copy.

In questo primo modulo dell'esercitazione end-to-end per la prima integrazione dei dati con Data Factory in Microsoft Fabric si è appreso come:

  • Creazione di una pipeline di dati.
  • Aggiungere un'attività Copy alla pipeline.
  • Usare dati di esempio e creare un data Lakehouse per archiviare i dati in una nuova tabella.
  • Eseguire la pipeline e visualizzarne i dettagli e la suddivisione della durata.

Continuare con la sezione successiva per creare il flusso di dati.