Freigeben über


Kopieren von Daten aus einer SQL Server-Datenbank in Azure Blob Storage mithilfe des Tools zum Kopieren von Daten

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

In diesem Tutorial verwenden Sie das Azure-Portal, um eine Data Factory zu erstellen. Anschließend erstellen Sie mithilfe des Tools zum Kopieren von Daten eine Pipeline, die Daten aus einer SQL Server-Datenbank in Azure Blob Storage kopiert.

Hinweis

In diesem Tutorial führen Sie die folgenden Schritte aus:

  • Erstellen einer Data Factory.
  • Erstellen einer Pipeline mithilfe des Tools zum Kopieren von Daten
  • Überwachen der Pipeline- und Aktivitätsausführungen.

Voraussetzungen

Azure-Abonnement

Wenn Sie nicht bereits ein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.

Azure-Rollen

Damit Sie Data Factory-Instanzen erstellen können, muss dem Benutzerkonto, mit dem Sie sich bei Azure anmelden, die Rolle Mitwirkender oder Besitzer zugewiesen sein, oder es muss ein Administrator des Azure-Abonnements sein.

Die Berechtigungen, über die Sie im Abonnement verfügen, können Sie im Azure-Portal einsehen. Wählen Sie oben rechts Ihren Benutzernamen und dann Berechtigungen aus. Wenn Sie Zugriff auf mehrere Abonnements besitzen, wählen Sie das entsprechende Abonnement aus. Beispielanleitungen zum Hinzufügen eines Benutzers zu einer Rolle finden Sie im Artikel Hinzufügen von Azure-Rollenzuweisungen über das Azure-Portal.

SQL Server 2014, 2016 und 2017

In diesem Tutorial verwenden Sie eine SQL Server-Datenbank als Quelldatenspeicher. Die Pipeline in der in diesem Tutorial erstellten Data Factory kopiert Daten aus dieser SQL Server-Datenbank (Quelle) in Blob Storage (Senke). Anschließend erstellen Sie eine Tabelle mit dem Namen emp in Ihrer SQL Server-Datenbank und fügen einige Beispieleinträge in die Tabelle ein.

  1. Starten Sie SQL Server Management Studio. Falls die Suite auf Ihrem Computer noch nicht installiert wurde, rufen Sie Herunterladen von SQL Server Management Studio (SSMS) auf.

  2. Stellen Sie eine Verbindung mit Ihrer SQL Server-Instanz her, indem Sie Ihre Anmeldeinformationen verwenden.

  3. Erstellen Sie eine Beispieldatenbank. Klicken Sie in der Strukturansicht mit der rechten Maustaste auf Datenbanken, und wählen Sie anschließend Neue Datenbank.

  4. Geben Sie im Fenster Neue Datenbank einen Namen für die Datenbank ein, und wählen Sie dann OK.

  5. Führen Sie das folgende Abfrageskript für die Datenbank aus, um die Tabelle emp zu erstellen und einige Beispieldaten einzufügen. Klicken Sie in der Strukturansicht mit der rechten Maustaste auf die von Ihnen erstellte Datenbank, und wählen Sie anschließend Neue Abfrage.

    CREATE TABLE dbo.emp
    (
        ID int IDENTITY(1,1) NOT NULL,
        FirstName varchar(50),
        LastName varchar(50)
    )
    GO
    
    INSERT INTO emp (FirstName, LastName) VALUES ('John', 'Doe')
    INSERT INTO emp (FirstName, LastName) VALUES ('Jane', 'Doe')
    GO
    

Azure-Speicherkonto

Sie verwenden in diesem Tutorial ein Azure Storage-Allzweckkonto (Blob Storage) als Ziel-/Senkendatenspeicher. Falls Sie noch nicht über ein allgemeines Speicherkonto verfügen, erfahren Sie unter Erstellen Sie ein Speicherkonto., wie Sie eins erstellen. Die Pipeline in der Data Factory, die Sie in diesem Tutorial erstellen, kopiert Daten aus der SQL Server-Datenbank (Quelle) in diese Blob Storage-Instanz (Senke).

Abrufen des Speicherkontonamens und des Kontoschlüssels

In diesem Tutorial verwenden Sie Name und Schlüssel Ihres Speicherkontos. Den Namen und den Schlüssel Ihres Speicherkontos ermitteln Sie anhand der folgenden Schritte:

  1. Melden Sie sich mit Ihrem Azure-Benutzernamen und dem dazugehörigen Kennwort beim Azure-Portal an.

  2. Wählen Sie im linken Bereich Alle Dienste aus. Filtern Sie nach dem Schlüsselwort Speicher, und wählen Sie dann Speicherkonten aus.

    Speicherkontosuche

  3. Filtern Sie in der Liste mit den Speicherkonten ggf. nach Ihrem Speicherkonto. Wählen Sie dann Ihr Speicherkonto aus.

  4. Wählen Sie im Fenster Speicherkonto die Option Zugriffsschlüssel.

  5. Kopieren Sie in den Feldern Speicherkontoname und key1 die Werte, und fügen Sie sie zur späteren Verwendung im Tutorial in einen Editor ein.

Erstellen einer Data Factory

  1. Wählen Sie im Menü auf der linken Seite Ressource erstellen>Integration>Data Factory aus:

    Erstellen einer neuen Data Factory

  2. Geben Sie auf der Seite Neue Data Factory unter Name den Namen ADFTutorialDataFactory ein.

    Der Name der Data Factory muss global eindeutig sein. Sollte für das Feld „Name“ die folgende Fehlermeldung angezeigt werden, ändern Sie den Namen der Data Factory (beispielsweise in „ADFTutorialDataFactory“). Benennungsregeln für Data Factory-Artefakte finden Sie im Thema Azure Data Factory – Benennungsregeln.

    Fehlermeldung zu neuer Data Factory für doppelten Namen

  3. Wählen Sie das Azure-Abonnement aus, in dem die Data Factory erstellt werden soll.

  4. Führen Sie unter Ressourcengruppe einen der folgenden Schritte aus:

    • Wählen Sie die Option Use existing(Vorhandene verwenden) und dann in der Dropdownliste eine vorhandene Ressourcengruppe.

    • Wählen Sie Neu erstellen, und geben Sie den Namen einer Ressourcengruppe ein.

      Weitere Informationen zu Ressourcengruppen finden Sie unter Verwenden von Ressourcengruppen zum Verwalten von Azure-Ressourcen.

  5. Wählen Sie unter Version die Option V2.

  6. Wählen Sie unter Standort den Standort für die Data Factory aus. In der Dropdownliste werden nur unterstützte Standorte angezeigt. Die Datenspeicher (etwa Azure Storage und SQL-Datenbank) und Computeeinheiten (etwa Azure HDInsight), die von Data Factory genutzt werden, können sich an anderen Standorten und in anderen Regionen befinden.

  7. Klicken Sie auf Erstellen.

  8. Nach Abschluss der Erstellung wird die Seite Data Factory wie in der Abbildung angezeigt:

    Startseite für Azure Data Factory mit der Kachel „Open Azure Data Factory Studio“

  9. Wählen Sie auf der Kachel Open Azure Data Factory Studio die Option Öffnen um das Data Factory Benutzerinterface in einem separaten Tab zu starten.

Erstellen einer Pipeline mithilfe des Tools zum Kopieren von Daten

  1. Wählen Sie auf der Azure Data Factory Startseite die Option Erfassen um das Tool zum Kopieren der Daten zu starten.

    Screenshot der Azure Data Factory-Homepage

  2. Navigieren Sie zu der Seite Eigenschaften des Tools zum Kopieren von Daten und wählen Sie die Option Integrierte Kopieraufgabe unter dem Aufgabentyp aus. Wählen Sie nun unter Aufgabenintervall oder Aufgabenzeitplan die Option Jetzt einmal ausführen und dannWeiter aus.

  3. Navigieren Sie zu der Seite Quelldatenspeicher und wählen Sie + Neue Verbindung erstellen aus.

  4. Suchen Sie auf der SeiteNeue Verbindung die Option SQL Server und wählen Sie dann Weiter aus.

  5. Geben Sie im Dialogfeld Neue SQL Server Verbindung unter der Option Name die Zeichenfolge SqlServerLinkedService ein. Wählen Sie unter Connect via integration runtime (Verbindung per Integration Runtime herstellen) die Option +Neu. Sie müssen eine selbstgehostete Integration Runtime erstellen, auf Ihren Computer herunterladen und bei Data Factory registrieren. Die selbstgehostete Integration Runtime kopiert Daten zwischen Ihrer lokalen Umgebung und der Cloud.

  6. Wählen Sie im Dialogfeld Integration Runtime-Setup die Option Selbstgehostet aus. Klicken Sie anschließend auf Weiter.

    Erstellen von Integrationslaufzeit

  7. Geben Sie im Dialogfeld Integration Runtime-Setup unter der Option Name die Zeichenfolge TutorialIntegrationRuntime ein. Klicken Sie anschließend auf Erstellen.

  8. Wählen Sie im Dialogfeld Integration Runtime-Setup die Option Klicken Sie hier, um das Express-Setup für diesen Computer zu starten aus. Dadurch wird die Integration Runtime auf Ihrem Computer installiert und bei Data Factory registriert. Alternativ können Sie die Installationsdatei über die manuelle Setupoption herunterladen, die Datei ausführen und die Integration Runtime mithilfe des Schlüssels registrieren.

  9. Führen Sie die heruntergeladene Anwendung aus. Der Status des Express-Setups wird im Fenster angezeigt.

    Status des Express-Setups

  10. Stellen Sie im Dialogfeld Neuer mit dem SQL Server verknüpfter Dienst sicher, dass die Zeichenfolge TutorialIntegrationRuntime unter Verbindung per Integration Runtime herstellen ausgewählt ist. Führen Sie dann die folgenden Schritte aus:

    a. Geben Sie unter Name die Zeichenfolge SqlServerLinkedService ein.

    b. Geben Sie unter Servername den Namen Ihrer SQL Server-Instanz ein.

    c. Geben Sie unter Datenbankname den Namen Ihrer lokalen Datenbank ein.

    d. Wählen Sie unter Authentifizierungstyp eine geeignete Authentifizierung aus.

    e. Geben Sie unter Benutzername den Namen eines Benutzers mit Zugriff auf SQL Server ein.

    f. Geben Sie das Kennwort für den Benutzer ein.

    g. Testen Sie die Verbindung, und wählen Sie Erstellen aus.

    Integration Runtime ausgewählt

  11. Stellen Sie auf der Seite Quelldatenspeicher sicher, dass die neu erstellte SQL Server Verbindung in dem Verbindungsblock ausgewählt ist. Navigieren Sie dann im Abschnitt Quelltabellen zu der Option EXISTIERENDE TABELLEN und wählen Sie die Tabelle dbo.emp aus der Liste aus, und wählen Sie dann Weiter aus. Basierend auf Ihrer Datenbank können Sie eine beliebige andere Tabelle auswählen.

  12. Auf der Seite Filter anwenden können Sie eine Datenvorschau anzeigen und das Schema der Eingabedaten einsehen, indem Sie die Schaltfläche Datenvorschau auswählen. Wählen Sie Weiteraus.

  13. Wählen Sie auf der Seite Zieldatenspeicher die Option + Eine Neue Verbindung erstellen aus

  14. Navigieren Sie unter Neuer verknüpfter Dienst zu Azure Blob Storage und wählen Sie dann Weiter aus.

    Auswählen von Blob Storage

  15. Führen Sie im Dialogfenster Neuer mit Azure Blob Storage verknüpfter Dienst die folgenden Schritte aus:

    a. Geben Sie unter Name den Namen AzureStorageLinkedService ein.

    b. Navigieren Sie unter Verbinden über Integrationslaufzeit zu dem Eintrag TutorialIntegrationRuntime und wählen Sie unter Authentifizierungsmethode den Eintrag Kontoschlüssel aus.

    c. Navigieren Sie zu Azure-Abonnement und wählen Sie Ihr Azure-Abonnement aus der Dropdownliste aus.

    d. Wählen Sie in der Dropdownliste unter Speicherkontoname Ihr Speicherkonto aus.

    e. Testen Sie die Verbindung, und wählen Sie Erstellen aus.

  16. Stellen Sie im Dialogfeld Zieldatenspeicher sicher, dass die neu erstellte Azure Blob Storage-Verbindung im Block Verbindung ausgewählt ist. Geben Sie unter der OptionOrdnerpfad die Zeichenfolge adftutorial/fromonprem ein. Den Container adftutorial haben Sie im Rahmen der Vorbereitung erstellt. Ist der Ausgabeordner (in diesem Fall fromonprem) nicht vorhanden, wird er von Data Factory automatisch erstellt. Sie können auch auf die Schaltfläche Durchsuchen klicken und zum Blobspeicher und den dazugehörigen Containern/Ordnern navigieren. Wenn Sie unter Dateiname keinen Wert angeben, wird standardmäßig der Name aus der Quelle (in diesem Fall dbo.emp) verwendet.

    Screenshot: Konfiguration der Seite „Zieldatenspeicher“

  17. Klicken Sie im Dialogfenster Dateiformateinstellungen auf Weiter.

  18. Geben Sie im Dialogfeld Einstellungen unter der Option Aufgabenname die Zeichenfolge CopyFromOnPremSqlToAzureBlobPipeline ein und wählen Sie dann Weiter aus. Das Tool zum Kopieren von Daten erstellt eine Pipeline mit dem Namen, den Sie in diesem Feld angeben.

  19. Überprüfen Sie im Dialogfenster Zusammenfassung die Werte sämtlicher Einstellungen, und klicken Sie anschließend auf Weiter.

  20. Wählen Sie auf der Seite Bereitstellung die OptionÜberwachen aus, um die Pipeline (Aufgabe) zu überwachen.

  21. Nach Abschluss der Pipelineausführung können Sie den Status der erstellten Pipeline anzeigen.

  22. Wählen Sie auf der Seite „Pipeline-Ausführungen“ die Option Aktualisieren aus, um die Liste zu aktualisieren. Wählen Sie den Link unter PIPELINENAME aus, um Details zur Aktivitätsausführung anzuzeigen oder die Pipeline erneut auszuführen.

    Ein Screenshot, der die Seite Pipeline-Ausführungen zeigt.

  23. Wählen Sie auf der Seite „Aktivitätsausführungen“ unter der Spalte Aktivitätsname den Link Details (Brillensymbol) aus, um weitere Details zum Kopiervorgang anzuzeigen. Wählen Sie im Breadcrumb-Menü den Link Alle Pipeline-Ausführungen aus, um zur Seite „Pipeline-Ausführungen“ zurückzukehren. Klicken Sie zum Aktualisieren der Ansicht auf Aktualisieren.

    Ein Screenshot, der die Aktivitätsdetails zeigt.

  24. Vergewissern Sie sich, dass die Ausgabedatei im Ordner fromonprem des Containers adftutorial enthalten ist.

  25. Klicken Sie im linken Bereich auf die Registerkarte Autor, um in den Bearbeitungsmodus zu wechseln. Sie können die vom Tool erstellten verknüpften Dienste, Datasets und Pipelines mit dem Editor aktualisieren. Klicken Sie auf Code, um den JSON-Code für die im Editor geöffnete Entität anzuzeigen. Ausführliche Informationen zum Bearbeiten dieser Entitäten über die Data Factory-Benutzeroberfläche finden Sie in der Azure-Portal-Version dieses Tutorials.

    Ein Screenshot, der die Registerkarte „Autor“ zeigt.

Die Pipeline in diesem Beispiel kopiert Daten aus einer SQL Server-Datenbank in Blob Storage. Sie haben Folgendes gelernt:

  • Erstellen einer Data Factory.
  • Erstellen einer Pipeline mithilfe des Tools zum Kopieren von Daten
  • Überwachen der Pipeline- und Aktivitätsausführungen.

Eine Liste mit den von Data Factory unterstützten Datenspeichern finden Sie unter Unterstützte Datenspeicher und Formate.

Fahren Sie mit dem folgenden Tutorial fort, um mehr über das Kopieren von Daten per Massenvorgang aus einer Quelle in ein Ziel zu erfahren: