Kontroll och distribution av notebook-källa
Den här artikeln förklarar hur Git-integrerings- och distributionspipelines fungerar för notebook-filer i Microsoft Fabric. Lär dig hur du konfigurerar en anslutning till lagringsplatsen, hanterar dina notebook-filer och distribuerar dem i olika miljöer.
Git-integrering för notebook-fil
Fabric Notebooks erbjuder Git-integrering för källkontroll med Azure DevOps. Med Git-integrering kan du säkerhetskopiera och versionshantera din notebook-fil, återgå till tidigare steg efter behov, samarbeta eller arbeta ensam med Git-grenar och hantera livscykeln för notebook-innehåll helt i Fabric.
Kommentar
Från och med oktober 2024 stöder Git-integrering för notebook-filer att bevara mappningsrelationen för den anslutna miljön vid synkronisering till ny arbetsyta, vilket innebär att när du checkar in notebook-filen och den anslutna miljön tillsammans till git-lagringsplatsen och synkroniserar den till en annan arbetsyta, kommer den nyligen genererade notebook-filen och miljön att bindas samman. Den här uppgraderingen påverkar befintliga notebook-filer och beroende miljöer som är versionerade i git. Det fysiska ID:t för den anslutna miljön i metadatainnehållet för notebook-filer ersätts med ett logiskt ID. Ändringen återspeglas i diff-vyn.
Konfigurera en anslutning
Från inställningarna för arbetsytan kan du enkelt konfigurera en anslutning till lagringsplatsen för att checka in och synkronisera ändringar. Information om hur du konfigurerar anslutningen finns i Kom igång med Git-integrering. När du är ansluten visas dina objekt, inklusive notebook-filer, på kontrollpanelen Källa.
När du har checkat in notebook-instanserna till Git-lagringsplatsen visas anteckningsbokens mappstruktur på lagringsplatsen.
Du kan nu köra framtida åtgärder, till exempel Skapa pull-begäran.
Notebook-representation i Git
Följande bild är ett exempel på filstrukturen för varje notebook-objekt på lagringsplatsen:
När du checkar in notebook-objektet på Git-lagringsplatsen konverteras notebook-koden till ett källkodsformat i stället för en standard .ipynb-fil. Till exempel konverteras en PySpark-notebook-fil till en notebook-content.py fil. Den här metoden möjliggör enklare kodgranskningar med hjälp av inbyggda diff-funktioner.
I objektets innehållskällfil bevaras och särskiljs metadata (inklusive standard lakehouse och bifogad miljö), markdown-celler och kodceller. Den här metoden stöder en exakt återställning när du synkroniserar tillbaka till en Infrastruktur-arbetsyta.
Notebook-cellutdata ingår inte vid synkronisering till Git.
Kommentar
- För närvarande checkas inte filer i Notebook-resurser in på lagringsplatsen. Incheckning av dessa filer stöds i en kommande version.
- Vi rekommenderar att du hanterar notebook-filer och deras beroende miljö på samma arbetsyta och använder git för att versionskontrollera både notebook- och miljöobjekt . Fabric Git-systemet hanterar mappningsrelationen när notebook-filen och den anslutna miljön synkroniseras till nya arbetsytor.
- Standard-Lakehouse-ID:t finns kvar i notebook-filen när du synkroniserar från lagringsplatsen till en Infrastruktur-arbetsyta. Om du checkar in en notebook-fil med standard lakehouse måste du referera till ett nyligen skapat lakehouse-objekt manuellt. Mer information finns i Lakehouse Git-integrering.
Notebook-fil i distributionspipelines
Du kan också använda distributionspipelinen för att distribuera din notebook-kod i olika miljöer, till exempel utveckling, test och produktion. Med den här funktionen kan du effektivisera utvecklingsprocessen, säkerställa kvalitet och konsekvens och minska manuella fel med enkla lågkodsåtgärder. Du kan också använda distributionsregler för att anpassa beteendet för dina notebook-filer när de distribueras, till exempel ändra standard lakehouse för en notebook-fil.
Kommentar
- Du använder den nya designen av distributionspipelinen nu. Det gamla användargränssnittet kan nås genom att stänga av "Ny distributionspipeline".
- Från och med oktober har Fabric Notebook stöd för automatisk bindningsfunktion som binder standardsjöhuset och den anslutna miljön på samma arbetsyta när du distribuerar till nästa steg. Ändringen påverkar befintliga notebook-filer i distributionspipelinen.
- Standardmiljön lakehouse och den anslutna miljön (när alla beroende objekt finns på samma arbetsyta) ersätts av nyligen genererade objekt i målarbetsytan. Ändringen av metadata för notebook-filer markeras i diff-vyn i nästa distributionsrunda.
- Du kan ange distributionsregler för standard lakehouse för att åsidosätta det automatiskt bundna sjöhuset.
- Känt problem: Status för låsta celler i notebook-filen går förlorad under distributionen. Vi arbetar för närvarande med relaterade uppgifter.
Följ stegen nedan för att slutföra distributionen av notebook-filen med hjälp av distributionspipelinen.
Skapa en ny distributionspipeline eller öppna en befintlig distributionspipeline. (Mer information finns i Kom igång med distributionspipelines.)
Tilldela arbetsytor till olika faser enligt dina distributionsmål.
Välj, visa och jämför objekt inklusive notebook-filer mellan olika faser, som du ser i följande exempel. Det markerade märket som anger ändrat antal objekt mellan föregående fas och aktuell fas.
Välj Distribuera för att distribuera dina notebook-filer i utvecklings-, test- och produktionsfaserna.
(Valfritt.) Du kan välja Distributionsregler för att skapa distributionsregler för en distributionsprocess. Posten Distributionsregler är på målsteget för en distributionsprocess.
Fabric stöder parameterisering av standard lakehouse för varje notebook-instans när du distribuerar med distributionsregler. Det finns tre alternativ för att ange standard lakehouse för mål: Samma med källsjöhus, N/A (inget standard lakehouse) och annat sjöhus.
Du kan uppnå säker dataisolering genom att konfigurera den här regeln. Notebook-filens standard lakehouse ersätts av den som du angav som mål under distributionen.
Kommentar
När du anger standard lakehouse i distributionsregler måste Lakehouse-ID:t ha. Du kan hämta lakehouse-ID:t från objektets URL-länk. Distributionsreglerna har högre prioritet än automatisk bindning. Det automatiskt bindda lakehouse skrivs över när distributionsregeln har konfigurerats.
Övervaka distributionsstatusen från distributionshistoriken.