Skapa rena rum
Viktigt!
Den här funktionen finns som allmänt tillgänglig förhandsversion.
Den här artikeln beskriver hur du skapar ett rent rum, en säker och sekretessskyddande miljö where flera parter kan arbeta tillsammans med känsliga företagsdata utan direkt åtkomst till varandras data.
Innan du börjar
Vilka privilegier som krävs för att använda rena rum varierar beroende på uppgiften:
Om du vill skapa ett rent rum måste du ha
CREATE CLEAN ROOM
behörighet eller vara metaarkivadministratör. Skaparen tilldelas automatiskt som ägare till det rena rummet i sitt Unity-Catalog metaarkiv.Om du vill initiera deltagande i ett rent rum som delas med dig måste du vara metaarkivadministratör.
När ett rent rum delas tilldelas samarbetspartnerorganisationens metaarkivadministratör automatiskt ägarskapet för det rena rummet. Metaarkivadministratören kan tilldela om ägarskapet till en administratör som inte är metaarkivadministratör. Som bästa praxis för datastyrning rekommenderar Databricks att ägarskapet tilldelas till en grupp.
Om din arbetsyta inte har tilldelats någon administratör för metaarkivet måste du tilldela rollen. Se Tilldela en metaarkivadministratör och Hantera Unity Catalog objektägarskap.
Om du vill lägga till remove datatillgångar och anteckningsböcker i en ren miljö måste du vara ägare till den rena miljön eller ha
MODIFY CLEAN ROOM
behörighet på den. Dessutom måste du och ägaren av det rena rummet (om inte du är ägaren) haSELECT
på tables och views som du lägger till, samt haREAD VOLUME
på volumes som du lägger till.
Mer information om behörighetskrav för uppdatering av rena rum och aktiviteter som körs (notebook-filer) i rena rum finns i Hantera rena rum och Kör notebook-filer i rena rum.
Du kan skapa upp till fem rena rum per metaarkiv.
Steg 1. Begär att medarbetaren delar identifier
Innan du kan skapa en renrumsmiljö måste du ha Clean Room-sharing identifier från den organisation som du ska samarbeta med. Delningssträngen identifier är en sträng som består av organisationens globala metaarkiv-ID, arbetsyte-ID och kontaktens användarnamn (e-postadress). Medarbetaren kan finnas i alla moln eller regioner.
Kontakta medarbetaren för att begära att de delar identifier.
Medarbetaren kan get delningen identifier genom anvisningarna i Hitta din delning identifier.
Steg 2. Skapa ett rent rum
Om du vill skapa ett rent rum måste du använda Catalog Explorer.
På din Azure Databricks-arbetsyta klickar du på ikonen Catalog.
På sidan Snabbåtkomst klickar du på knappen Rensa rum > .
Du kan också klicka på kugghjulsikonen överst i rutan Catalog och selectRena rum.
Klicka på Skapa rent rum.
På sidan Skapa rent rum anger du ett användarvänligt namn för det rena rummet.
Namnet kan inte använda blanksteg, punkter eller snedstreck (/).
Du kan inte ändra namnet på det rena rummet när det har sparats. Använd ett namn som medarbetaren kommer att finna användbar och beskrivande.
Select molnleverantören och regionen where det centrala renrummet skapas.
Molnleverantören måste vara samma som din aktuella arbetsyta, men det gör inte regionen. Överväg organisationens datahemvist eller andra principer när du gör ditt val.
(Valfritt) Lägg till en kommentar.
Ange medarbetarens Clean Room-delning identifier.
Se steg 1. Begär att medarbetaren delar identifier.
Du kan testa ditt rena rum innan fullständig driftsättning genom att använda antingen ditt delnings-ID identifier eller en annan användares identifier i ditt aktuella metaarkiv. På så sätt skapas två rena rum i ditt aktuella metaarkiv. Om du till exempel skapar ett rent rum med titeln
test_clean_room
visas även ett andra rent rum med namnettest_clean_room_collaborator
. Att köra notebooks med en kollega i samma metadatalager fungerar på samma sätt som med en extern kollega. Se till att exekvera anteckningsböcker i rena rum.Anteckna de catalog namn som tilldelats dig (skaparen) och medarbetaren.
Alla datatillgångar som läggs till i clean room visas under catalog i det centrala clean room och kan refereras med catalog i Unity Catalog-namnutrymme på tre nivåer (
<catalog>.<schema>.<table-etc>
).Select principtypen för nätverksåtkomst. Detta kan inte ändras när det rena rummet har skapats.
- fullständig åtkomst: Obegränsad utgående internetåtkomst.
- Begränsad åtkomst: Detta begränsar utgående åtkomst till internetmål som du anger. Se Översikt över nätverksprinciper och Hantera nätverksprinciper för serverlös utgående kontroll.
Kommentar
Begränsad åtkomst kan fördröja tillgångens tillgänglighet i upp till tio minuter och stöder inte Google Cloud-medarbetare.
När du har skapat det rena rummet kan du visa principen för nätverksåtkomst på fliken Säkerhet.
Klicka på Skapa rent rum.
Steg 3. Lägga till datatillgångar och anteckningsböcker i det rena rummet
Vilken som helst av parterna i det rena rummet (skaparen och medarbetaren) kan lägga till tables, volumes, viewsoch anteckningsböcker i det rena rummet.
Behörigheter som krävs:
Du måste vara ägare eller ha
MODIFY CLEAN ROOM
privilegiet i det rena rummet.Du och ägaren av det rena rummet (om du inte är ägare) måste ha
SELECT
på alla table eller vyer ochREAD VOLUME
på alla volymer som du lägger till, tillsammans medUSE CATALOG
ochUSE SCHEMA
på den överordnade catalog och schema.Den rena rum ägare måste hålla dessa privilegier under hela livet av det rena rummet.
Kommentar
Följande instruktioner förutsätter att du återgår till ett redan skapat rent rum för att lägga till tillgångar. Om du just har skapat ett rent rum för första gången vägleder en guide dig genom att lägga till datatillgångar och anteckningsböcker. Det faktiska användargränssnittet för att lägga till dessa tillgångar är detsamma, oavsett om du vägleds av guiden eller inte.
Så här lägger du till tillgångar:
På din Azure Databricks-arbetsyta klickar du på ikonen Catalog.
På sidan Snabbåtkomst klickar du på knappen Rensa rum > .
Du kan också klicka på kugghjulsikonen överst i fönstret Catalog och selectRena rum.
Hitta och klicka på namnet på det rena rum som du vill update.
Klicka på + Lägg till dataresurser för att lägga till tables, volumeseller views.
Select de datatillgångar du vill dela och klicka på Lägg till datatillgångar.
När du delar en table, volym eller vy kan du lägga till ett alias. Aliasnamnet är det enda namn som visas i det rena rummet.
När du delar ett tablekan du välja att lägga till partition-satser som gör att du bara kan dela en del av table. Mer information om hur du använder partitioner för att limit det du delar finns i Ange table partitioner som ska dela.
Om du vill lägga till notebook-filer klickar du på knappen + Lägg till anteckningsböcker och bläddrar efter den notebook-fil som du vill lägga till.
Du kan också ge notebook-filen ett alternativt notebook-namn.
Notebook-filer som du delar i rena rum söker data och kör dataanalysuppgifter på tables, viewsoch volumes som du och den andra medarbetaren har lagt till i det rena rummet.
Notebook-filer fungerar enligt principen om implicit godkännande: du kan inte köra notebook-filer som du skapar. Du skapar de anteckningsböcker som din medarbetare använder, och din medarbetare skapar de anteckningsböcker som du använder.
Om du delar en notebook-fil som innehåller resultat delas dessa resultat med din medarbetare.
Du kan använda en notebook för att skapa utdata som tables, som tillfälligt delas med din medarbetares metaarkiv när de kör notebooken. Se Skapa och arbeta med resultat tables i Databricks Clean Rooms.
Om du vill använda en testdatauppsättning laddar du ned vår exempelanteckningsbok.
Viktigt!
Alla notebookreferenser till tables, viewseller volumes som lades till i renrummet måste använda det catalog-namn som tilldelades när renrummet skapades ("skapare" för datatillgångar som lagts till av renrummets skapare och "medarbetare" för datatillgångar som lagts till av den inbjudna medarbetaren). Till exempel kan en table som lagts till av skaparen namnges
creator.sales.california
.På samma sätt kontrollerar du att notebook-filen använder de alias som tilldelats och som var datatillgångar i renrummet.