Laden von Daten in Azure SQL
Nachdem eine Datenbank oder Instanz bereitgestellt, überprüft und konfiguriert wurde, besteht der nächste logische Schritt darin, Daten in diese Datenbank bzw. Instanz zu importieren.
Optionen
Für das Laden von Daten in Azure SQL sind viele Optionen verfügbar. Einige überlappen sich mit dem, was lokal verfügbar ist. In dieser Lerneinheit werden einige erläutert.
Massenkopierprogramm
Das Massenkopierprogramm (Bulk Copy Program, BCP) ist ein gängiges Tool zum Herstellen einer Verbindung mit Azure SQL von einem lokalen Standort oder einer Azure-VM aus. Anschließend können Sie es zum Verschieben von Daten in Azure SQL verwenden.
Masseneinfügung
Masseneinfügungsvorgänge ähneln den verfügbaren Vorgängen im Zusammenhang mit lokalen SQL Server-Instanzen, mit dem Unterschied, dass Daten nicht aus einer oder mehreren Dateien auf Ihrem Computer, sondern aus Azure Blob Storage geladen werden. In der nächsten Übung sehen Sie ein Beispiel, wie das geht.
SSIS-Pakete
In Azure SQL können Sie über Pakete um eine lokale Verbindung mit SSIS (SQL Server Integration Services) herstellen. Sie können eine SSIS-Datenbank in Azure SQL-Datenbank oder Azure SQL Managed Instance hosten. Außerdem können Sie Azure-SSIS Integration Runtime für SSIS-Pakete mit Tools wie Azure Data Factory verwenden.
Weitere Optionen
Weitere interessante Optionen sind z. B. die Verwendung von Technologien wie Spark oder Azure Data Factory, um Daten in Azure SQL-Datenbank oder Azure SQL Managed Instance zu laden. Obwohl es nicht direkt mit dem Thema „Laden“ zusammenhängt, ist es möglich, eine Datenbank zu erstellen, indem Sie eine bestehende Datenbank als Kopie verwenden oder eine BACPAC-Datei importieren. In Azure SQL Managed Instance können Sie T-SQL-Befehle zum nativen Wiederherstellen einer Datenbank aus einer URL verwenden.
Überlegungen zum Laden von Daten
Der größte Unterschied zwischen dem lokalen Laden von Daten und dem Laden von Daten in Azure SQL besteht darin, dass die Daten, die Sie laden möchten, in Azure gehostet sein müssen. Die Daten können nicht lokal in Dateien gehostet werden. Alternativ können Sie die lokalen Dateien und Dateisysteme in Azure Blob Storage speichern. Diese Strategie erhöht auch Ihre Effizienz beim Laden Ihrer Dateien und beim Einrichten von ETL-Aufträgen.
Sie sollten auch bedenken, dass die minimale Protokollierung nicht unterstützt wird, sodass Sie immer den vollständigen Wiederherstellungsmodus verwenden. Aufgrund des vollständigen Wiederherstellungsmodus und der Grenzwerte für den Protokolldurchsatz kann sich die Protokollgovernance beim Laden von Daten auswirken. Techniken wie die Verwendung von Batches und deren angemessene Dimensionierung werden beim Massenladen wichtig. Weitere Tipps erhalten Sie in der nächsten Übung. Das Laden in einen geclusterten Columnstore-Index kann in Abhängigkeit vom Szenario dazu beitragen, Transaktionsprotokollbeschränkungen zu vermeiden.