Freigeben über


Git-Integration und Bereitstellung von Datenpipelines für die Umgebung

In diesem Artikel wird beschrieben, wie Sie die Git-Integration und Bereitstellungspipelines für Umgebungen in Microsoft Fabric verwenden.

Git-Integration für die Microsoft Fabric-Umgebung

Microsoft Fabric unterstützt die Git-Integration, sodass Entwickler Versionen sichern, steuern, rückgängig machen in früheren Phasen ausführen und mit Git-Branches an ihrer Arbeit zusammenarbeiten können.

Wichtig

Dieses Feature befindet sich in Vorschau.

Hinweis

  • Derzeit unterstützt Git nur Bibliotheken und Spark-Compute, einschließlich Spark-Runtime.
  • Die Git-Integration verwaltet den Stagingstatus der Umgebung. Damit Änderungen an der Umgebung in Git angewendet werden können, müssen sie veröffentlicht werden. Es wird empfohlen, nach dem Aktualisieren der Umgebung von Git zu veröffentlichen, um die Effektivität der Konfiguration sicherzustellen. Sie können mithilfe der Veröffentlichungs-API der Umgebung Änderungen über die REST-API veröffentlichen, wenn Sie die Code-First-Erfahrung bevorzugen.
  • Der angefügte benutzerdefinierte Pool bleibt in einer Umgebung erhalten, wenn Sie die Synchronisierung vom Repository in einen Fabric-Arbeitsbereich durchführen. Die Pooldefinition befindet sich in der Arbeitsbereichseinstellung, und der arbeitsbereichübergreifende Verweis auf den Pool wird nicht unterstützt. Sie müssen die instance_pool_id auf einen vorhandenen benutzerdefinierten Pool im Zielarbeitsbereich manuell aktualisieren oder durch Entfernen dieser Eigenschaft eine Rücksetzung auf den Starterpool vornehmen. Die vollständige Liste der verfügbaren Pools im Zielarbeitsbereich nach REST-API finden Sie unter Benutzerdefinierte Pools – Liste der benutzerdefinierten Pools im Arbeitsbereich und Informationen zum Erstellen eines neuen benutzerdefinierten Pols unter Benutzerdefinierte Pools – Erstellen eines benutzerdefinierten Pools im Arbeitsbereich.
  • Jeder Commit hat als Obergrenze von 150 MB. Benutzerdefinierte Bibliotheken, die größer als 150 MB sind, werden derzeit nicht über Git unterstützt.

Verbinden des Fabric-Arbeitsbereichs in ein Azure DevOps-Repository

Wenn Sie der Administrator eines Arbeitsbereichs sind, navigieren Sie zu den Arbeitsbereichseinstellungen, und richten Sie die Verbindung im Abschnitt Quellcodeverwaltung ein. Weitere Informationen dazu finden Sie unter Verwalten eines Arbeitsbereichs mit Git.

Nach dem Herstellen einer Verbindung finden Sie Elemente, einschließlich der Umgebungen, die mit dem Repository synchronisiert werden.

Screenshot des erfolgreichen Verbindens des Arbeitsbereichs mit einem Azure DevOps-Repository.

Lokale Darstellung einer Umgebung in Git

Im Stammordner des Elements werden Umgebungen mit einem Bibliotheksordner organisiert, der PublicLibraries- und CustomLibraries-Unterordner enthält, zusammen mit dem Einstellungsordner.

Screenshot der lokalen Darstellung der Umgebung in Git.

Libraries

Wenn Sie eine Umgebung auf Git übernehmen, wird der Abschnitt der öffentlichen Bibliothek in seine YAML-Darstellung umgewandelt. Darüber hinaus wird die benutzerdefinierte Bibliothek zusammen mit der Quelldatei zugesichert.

Screenshot der lokalen Darstellung der Umgebung in der öffentlichen Bibliothek in Git.

Sie können die öffentliche Bibliothek aktualisieren, indem Sie die YAML-Darstellung bearbeiten. Genau wie die Portaloberfläche können Sie eine Bibliothek aus PyPI und Conda angeben. Sie können die Bibliothek mit erwarteter Version, einem Versionsbereich oder ohne Version angeben. Das System kann Ihnen helfen, eine Version zu ermitteln, die mit anderen Abhängigkeiten in Ihrer Umgebung kompatibel ist. Löschen Sie die YAML-Datei, um alle vorhandenen öffentlichen Bibliotheken zu löschen.

Sie können die benutzerdefinierte Bibliothek aktualisieren, indem Sie neue Dateien hinzufügen oder vorhandene Dateien direkt löschen.

Hinweis

Sie können Ihre eigene YAML-Datei zum Verwalten der öffentlichen Bibliothek mitbringen. Der Dateiname muss environment.yml sein, damit er vom System richtig erkannt wird.

Spark-Compute

Der Spark-Computeabschnitt wird auch in die YAML-Darstellung transformiert. In dieser YAML-Datei können Sie den angefügten Pool wechseln, Computekonfigurationen optimieren, Spark-Eigenschaften verwalten und die gewünschte Spark-Laufzeit auswählen.

Screenshot der lokalen Darstellung der Spark Computeumgebung in Git.

Bereitstellungspipeline für die Umgebung

Wichtig

Dieses Feature befindet sich in der Vorschauphase.

Die Bereitstellungspipelines von Fabric vereinfachen den Prozess der Bereitstellung von geänderten Inhalten in verschiedenen Phasen, z. B. das Verschieben von Entwicklung zu Test. Die automatische Pipeline kann die Umgebungselemente enthalten, um den Neuerstellungsprozess zu streamen.

Sie können eine Bereitstellungspipeline einrichten, indem Sie die Arbeitsbereiche mit verschiedenen Phasen zuweisen. Weitere Informationen finden Sie unter Erste Schritte mit Bereitstellungspipelines.

Screenshot der Bereitstellungsumgebung in der Bereitstellungspipeline.

Sie finden den Bereitstellungsstatus nach der erfolgreichen Einrichtung der Pipeline. Nachdem Sie auf die Schaltfläche Bereitstellen mit ausgewählter Umgebung geklickt haben, werden alle Inhalte der Umgebung in den Zielarbeitsbereichen bereitgestellt. Der Status der ursprünglichen Umgebung wird in diesem Prozess beibehalten, d. h., die veröffentlichten Konfigurationen bleiben im Veröffentlichungszustand und erfordern keine zusätzliche Veröffentlichung.

Wichtig

  • Der benutzerdefinierte Pool wird derzeit in der Bereitstellungspipeline nicht unterstützt. Wenn die Umgebung den benutzerdefinierten Pool auswählt, werden die Konfigurationen des Abschnitts Compute in der Zielumgebung mit Standardwerten festgelegt. In diesem Fall zeigen die Umgebungen weiterhin Differenzen in der Bereitstellungspipeline an, auch wenn die Bereitstellung erfolgreich durchgeführt wurde.
  • Wenn Sie Bereitstellungsregeln verwenden, um einen anderen Pool in einem neuen Arbeitsbereich anzugeben, wird in der kommenden Version enthalten sein.