Was ist der Kopierauftrag (Vorschau) in Data Factory für Microsoft Fabric
Data Factory in Fabric ermöglicht Benutzern die nahtlose Integration von Daten aus über 100 integrierten Connectors – sowohl Quellen als auch Ziele – über eine visuell intuitive Oberfläche. Die Kopieraktivität, die mit Datenpipelines arbeitet, erleichtert die Erfassung von Daten. In der Zwischenzeit unterstützt Dataflow Gen2 Datentransformationen, und Pipelines orchestrieren den Integrationsfluss.
Vorteile des Kopierauftrags
Während die Copy-Aktivität in Datenpipelines Datenaufnahme mit Massen-/Batchvorgängen verarbeitet, ist das Erstellen von Datenpipelines in Data Factory für viele Benutzende, die neu in dem Bereich sind, durch eine steilere Lernkurve weiterhin eine Herausforderung. Wir freuen uns also, den Kopierauftrag einzuführen und die Datenaufnahmeerfahrung von einer beliebigen Quelle auf ein beliebiges Ziel zu verbessern. Jetzt ist das Kopieren Ihrer Daten einfacher als je zuvor. Darüber hinaus unterstützt der Kopierauftrag verschiedene Datenübermittlungsstile, einschließlich Batchkopien und inkrementeller Kopien, was Flexibilität bietet, um Ihre spezifischen Anforderungen zu erfüllen.
Einige Vorteile des Kopierauftrags gegenüber anderen Datenverschiebungsmethoden sind:
- Intuitive Erfahrung: Erleben Sie nahtloses Kopieren von Daten ohne Kompromisse, wodurch es einfacher denn je ist.
- Effizienz: Ermöglichen Sie das inkrementelle Kopieren mühelos, wodurch manuelle Eingriffe reduziert werden. Diese Effizienz führt zu einer geringeren Ressourcenauslastung und schnelleren Kopierdauern.
- Flexibilität: Während Sie einerseits von der Einfachheit profitieren, haben Sie andererseits auch die Flexibilität, Ihre Datenverschiebung zu steuern. Wählen Sie aus, welche Tabellen und Spalten kopiert werden sollen, ordnen Sie die Daten zu, definieren Sie das Lese-/Schreibverhalten, und legen Sie Zeitpläne gemäß Ihren Anforderungen fest, unabhängig davon, ob es sich um einen einmaligen oder einen wiederkehrenden Vorgang handelt.
- Robuste Leistung: Eine serverlose Einrichtung, welche die Datenübertragung mit großer Parallelität ermöglicht und den Datenbewegungsdurchsatz für Ihr System maximiert.
Unterstützte Connectors
Derzeit können Sie den Kopierauftrag für die Clouddatenübertragung oder das Kopieren von Daten aus einem lokalen Datenspeicher über das Gateway verwenden. Der Kopierauftrag unterstützt die folgenden Datenspeicher sowohl als Quelle als auch als Ziel:
- Azure SQL-Datenbank
- Lokale SQL Server-Instanz
- Fabric Warehouse
- Fabric-Lakehouse
- Amazon S3
- Azure Data Lake Storage Gen2
- Azure Blob Storage
- Amazon RDS für SQL Server
Das Produktteam untersucht weitere Connectorunterstützung, also bleiben Sie dran für Neuigkeiten.
Kopierverhalten
Sie können aus den folgenden Datenübermittlungsformaten wählen.
- Vollkopiemodus: Jeder Kopierauftrag kopiert alle Daten aus der Quelle auf einmal an das Ziel.
- Inkrementeller Kopiermodus: Der erste Auftrag kopiert alle Daten und der nachfolgende Auftrag durchläuft nur die Änderungen seit der letzten Ausführung. Die geänderten Daten werden an Ihren Zielspeicher angefügt.
Sie können auch auswählen, wie Daten in Ihren Zielspeicher geschrieben werden.
Standardmäßig fügt ein Kopierauftrag Daten an Ihr Ziel an, sodass Sie keinen Änderungsverlauf verpassen. Sie können aber auch das Schreibverhalten auf Upsert oder Überschreiben einstellen.
- Beim Kopieren von Daten in den Speicher: Neue Zeilen aus den Tabellen oder Dateien werden in neue Dateien im Ziel kopiert. Wenn eine Datei mit demselben Namen bereits im Zielspeicher vorhanden ist, wird sie überschrieben.
- Beim Kopieren von Daten in die Datenbank: Neue Zeilen aus den Tabellen oder Dateien werden an Zieltabellen angefügt. Sie können das Schreibverhalten in Upsert ändern (in SQL DB oder SQL Server) oder überschreiben (in Fabric Lakehouse-Tabellen).
Inkrementelle Spalte
Im inkrementellen Kopiermodus müssen Sie eine inkrementelle Spalte für jede Tabelle auswählen, um Änderungen zu identifizieren. Der Kopierauftrag verwendet diese Spalte als Wasserzeichen, wobei der Wert mit demselben von der letzten Ausführung verglichen wird, um nur die neuen oder aktualisierten Daten zu kopieren. Die inkrementelle Spalte muss ein Zeitstempel oder eine zunehmende INT sein.
Regionale Verfügbarkeit
Der Kopierauftrag hat die gleiche regionale Verfügbarkeit wie die Pipeline.
Preise
Der Kopierauftrag verwendet denselben Abrechnungszähler: Datenverschiebung mit identischer Verbrauchsrate.