Git-Integration und Bereitstellung von Datenpipelines für die Umgebung
In diesem Artikel wird beschrieben, wie Sie die Git-Integration und Bereitstellungspipelines für Umgebungen in Microsoft Fabric verwenden.
Git-Integration für die Microsoft Fabric-Umgebung
Microsoft Fabric unterstützt die Git-Integration, sodass Entwickler Versionen sichern, steuern, rückgängig machen in früheren Phasen ausführen und mit Git-Branches an ihrer Arbeit zusammenarbeiten können.
Wichtig
Dieses Feature befindet sich in Vorschau.
Hinweis
- Derzeit unterstützt Git nur Bibliotheken und Spark-Compute, einschließlich Spark-Runtime.
- Die Git-Integration verwaltet den Stagingstatus der Umgebung. Damit Änderungen an der Umgebung in Git angewendet werden können, müssen sie veröffentlicht werden. Es wird empfohlen, nach dem Aktualisieren der Umgebung von Git zu veröffentlichen, um die Effektivität der Konfiguration sicherzustellen. Sie können mithilfe der Veröffentlichungs-API der Umgebung Änderungen über die REST-API veröffentlichen, wenn Sie die Code-First-Erfahrung bevorzugen.
- Der angefügte benutzerdefinierte Pool bleibt in einer Umgebung erhalten, wenn Sie die Synchronisierung vom Repository in einen Fabric-Arbeitsbereich durchführen. Die Pooldefinition befindet sich in der Arbeitsbereichseinstellung, und der arbeitsbereichübergreifende Verweis auf den Pool wird nicht unterstützt. Sie müssen die instance_pool_id auf einen vorhandenen benutzerdefinierten Pool im Zielarbeitsbereich manuell aktualisieren oder durch Entfernen dieser Eigenschaft eine Rücksetzung auf den Starterpool vornehmen. Die vollständige Liste der verfügbaren Pools im Zielarbeitsbereich nach REST-API finden Sie unter Benutzerdefinierte Pools – Liste der benutzerdefinierten Pools im Arbeitsbereich und Informationen zum Erstellen eines neuen benutzerdefinierten Pols unter Benutzerdefinierte Pools – Erstellen eines benutzerdefinierten Pools im Arbeitsbereich.
- Jeder Commit hat als Obergrenze von 150 MB. Benutzerdefinierte Bibliotheken, die größer als 150 MB sind, werden derzeit nicht über Git unterstützt.
Verbinden des Fabric-Arbeitsbereichs in ein Azure DevOps-Repository
Wenn Sie der Administrator eines Arbeitsbereichs sind, navigieren Sie zu den Arbeitsbereichseinstellungen, und richten Sie die Verbindung im Abschnitt Quellcodeverwaltung ein. Weitere Informationen dazu finden Sie unter Verwalten eines Arbeitsbereichs mit Git.
Nach dem Herstellen einer Verbindung finden Sie Elemente, einschließlich der Umgebungen, die mit dem Repository synchronisiert werden.
Lokale Darstellung einer Umgebung in Git
Im Stammordner des Elements werden Umgebungen mit einem Bibliotheksordner organisiert, der PublicLibraries- und CustomLibraries-Unterordner enthält, zusammen mit dem Einstellungsordner.
Libraries
Wenn Sie eine Umgebung auf Git übernehmen, wird der Abschnitt der öffentlichen Bibliothek in seine YAML-Darstellung umgewandelt. Darüber hinaus wird die benutzerdefinierte Bibliothek zusammen mit der Quelldatei zugesichert.
Sie können die öffentliche Bibliothek aktualisieren, indem Sie die YAML-Darstellung bearbeiten. Genau wie die Portaloberfläche können Sie eine Bibliothek aus PyPI und Conda angeben. Sie können die Bibliothek mit erwarteter Version, einem Versionsbereich oder ohne Version angeben. Das System kann Ihnen helfen, eine Version zu ermitteln, die mit anderen Abhängigkeiten in Ihrer Umgebung kompatibel ist. Löschen Sie die YAML-Datei, um alle vorhandenen öffentlichen Bibliotheken zu löschen.
Sie können die benutzerdefinierte Bibliothek aktualisieren, indem Sie neue Dateien hinzufügen oder vorhandene Dateien direkt löschen.
Hinweis
Sie können Ihre eigene YAML-Datei zum Verwalten der öffentlichen Bibliothek mitbringen. Der Dateiname muss environment.yml sein, damit er vom System richtig erkannt wird.
Spark-Compute
Der Spark-Computeabschnitt wird auch in die YAML-Darstellung transformiert. In dieser YAML-Datei können Sie den angefügten Pool wechseln, Computekonfigurationen optimieren, Spark-Eigenschaften verwalten und die gewünschte Spark-Laufzeit auswählen.
Bereitstellungspipeline für die Umgebung
Wichtig
Dieses Feature befindet sich in der Vorschauphase.
Die Bereitstellungspipelines von Fabric vereinfachen den Prozess der Bereitstellung von geänderten Inhalten in verschiedenen Phasen, z. B. das Verschieben von Entwicklung zu Test. Die automatische Pipeline kann die Umgebungselemente enthalten, um den Neuerstellungsprozess zu streamen.
Sie können eine Bereitstellungspipeline einrichten, indem Sie die Arbeitsbereiche mit verschiedenen Phasen zuweisen. Weitere Informationen finden Sie unter Erste Schritte mit Bereitstellungspipelines.
Sie finden den Bereitstellungsstatus nach der erfolgreichen Einrichtung der Pipeline. Nachdem Sie auf die Schaltfläche Bereitstellen mit ausgewählter Umgebung geklickt haben, werden alle Inhalte der Umgebung in den Zielarbeitsbereichen bereitgestellt. Der Status der ursprünglichen Umgebung wird in diesem Prozess beibehalten, d. h., die veröffentlichten Konfigurationen bleiben im Veröffentlichungszustand und erfordern keine zusätzliche Veröffentlichung.
Wichtig
- Der benutzerdefinierte Pool wird derzeit in der Bereitstellungspipeline nicht unterstützt. Wenn die Umgebung den benutzerdefinierten Pool auswählt, werden die Konfigurationen des Abschnitts Compute in der Zielumgebung mit Standardwerten festgelegt. In diesem Fall zeigen die Umgebungen weiterhin Differenzen in der Bereitstellungspipeline an, auch wenn die Bereitstellung erfolgreich durchgeführt wurde.
- Wenn Sie Bereitstellungsregeln verwenden, um einen anderen Pool in einem neuen Arbeitsbereich anzugeben, wird in der kommenden Version enthalten sein.