Lamna Healthcare-scenario för analys i molnskala i Azure
Den här referensarkitekturen är skriven för kunder som vill använda analys i molnskala, inte bara för skalbarhet utan för att skydda sina data. Den visar hur åtkomst till känsliga data kan kontrolleras och hur korrekt desensitiserade data kan delas med analytiker.
Kundprofil
Lamna Healthcare (Lamna) erbjuder patienthanteringstjänster till vårdgivare. De hanterar mycket känsliga patientdata under hela verksamheten. Åtkomsten till detaljerade data måste begränsas noggrant. Lamna vill dock också använda någon version av dessa data på ett säkert sätt för att informera om sin affärspraxis. De behöver en mekanism för att dela data med analytiker som inte bryter mot patientförtroende eller dataskyddslagar.
Aktuell situation
Idag lagrar Lamna alla sina data lokalt. Patientdata lagras i ett traditionellt databassystem. I takt med att verksamheten har ökat och mängden data har ökat måste företaget dock migrera sina patientprogram till molnet. Som en del av den här övergången vill de kopiera data från programmet till en molnbaserad analysplattform som gör att deras analytiker kan använda data bättre utan att lägga extra belastning på programdatabasen.
Ett kritiskt problem för Lamna är säkerheten för patientdata. Som hälsovårdsföretag omfattas de av flera olika dataskyddslagar.
Arkitekturlösning
Lamna implementerar analys i molnskala som sin lösning för en molnbaserad analysplattform. De förlitar sig på flera landningszoner både för ökad skalbarhet och för tydlig separation av känsliga dataprodukter.
Landningszon för datahantering
Ett kritiskt begrepp för varje implementering av analys i molnskala är att ha en landningszon för datahantering. Den här prenumerationen innehåller resurser som delas mellan alla landningszoner. Detta omfattar delade nätverkskomponenter, till exempel en brandvägg och privata DNS-zoner. Den innehåller även resurser för data- och molnstyrning. Microsoft Purview och Databricks Unity Catalog har distribuerats som tjänster på klientorganisationsnivå.
Landningszon för patientdata
I Lamnas organisationsschema ingår patienthanteringsgruppen i driftgruppen. Med tanke på den extrema känsligheten hos de data de använder har de dock en egen datalandningszon i analysarkitektur i molnskala.
Den här landningszonen är värd för en kopia av detaljerade patientdata och hälsojournaler från företagets patienthanteringsprogram och relaterade dataprodukter. Dessa dataprodukter läses in i landningszonen av dataprogram som regelbundet matar in data i molnet och landar dem i Azure Data Lake Storage.
Landningszon för driftdata
Verksamhetsgruppen på Lamna ansvarar för företagets kärnverksamhet, nämligen att tillhandahålla konsulttjänster till vårdgivare. I sin verksamhetsdatalandningszon lagrar de data relaterade till dessa vårdgivare och de tjänster som de engagerar sig i.
Liksom alla affärsdata finns det ett element av känslighet för dessa dataprodukter, och Lamna av vill skydda sin lista över klienter. Men eftersom dessa data inte innehåller hälsoinformation om individer omfattas de inte av de strängaste dataskyddslagarna.
Dataapplikationer
Operativa landningszonen har ett dataprogram som läser in vårdgivarens data från Lamnas lokala driftsystem. Precis som alla dataprogram landar detta data i molnet as-is och tillämpar inte transformeringar på dataprodukterna.
Dataprodukter
Analytiker i hela Lamna behöver åtkomst till data för att skapa rapporter för verksamheten. En stor del av data är dock alldeles för känsliga för en bred målgrupp. För att på ett säkert sätt ge åtkomst till mycket känsliga patientdata skapade driftteamet en tokeniserad patientdatauppsättning produkt i landningszonen. Med Hjälp av Azure Data Factory kopierar de patientdata från patienternas landningszon. Teamet var dock noga med att ta bort eller tokenisera alla kolumner som innehåller personliga data. Det här steget gör det möjligt för analytiker att använda data i affärssyfte utan att exponera några personuppgifter om patienterna.
Landningszon för marknadsföringsdata
Marknadsföringsgruppen fokuserar på att skaffa nya kunder och hantera Lamnas position på marknadsplatsen. Deras marknadsföringslandningszon används främst för att lagra och analysera externa dataprodukter om de marknader de betjänar och sjukvårdsindustrin.
Men för att stödja en ny marknadsförings push vill gruppen genomföra en studie av hälsoresultat för de patienter som betjänas av Lamnas kunder. De hoppas kunna ta fram en faktabaserad rapport som stöds av starka statistiska bevis som visar att deras inställning till hälso- och sjukvård leder till bättre resultat.
För att stödja denna nya insats måste forskare i marknadsföringsgruppen få åtkomst till mycket känsliga patientdata på ett säkert och kompatibelt sätt samtidigt som de kan få den information som de behöver.
För att uppfylla detta behov skapar marknadsföringsteamet aggregerade dataprodukter från den tokeniserade patientdatauppsättningen som skapats av driftteamet. Dessa dataprodukter innehåller inte enskilda hälsojournaler. Istället grupperar de data över olika axlar. Detta hjälper forskare att genomföra studier av populationen som helhet utan att riskera tillgång till någon individs hälsoinformation.
Bild 1: Diagram över Lamna-arkitektur. Alla Azure-tjänster visas inte i diagrammet. Det är förenklat att lyfta fram huvudbegreppen för hur resurser organiseras i arkitekturen.
Motivering
Ska alla känsliga data alltid ges en egen datalandningszon?
Nej. Endast de mest begränsade data som kräver specifika skydd, till exempel just-in-time-åtkomst eller kundhanterade nycklar, kräver en egen landningszon. I andra scenarier ger andra dataskyddsfunktioner i Azure en mycket säker miljö för dina data. Detta omfattar säkerhet på radnivå, säkerhet på kolumnnivå och krypterade kolumner.
Nästa steg
- Fortsätt till Implementeringsmallar för analys i molnskala.
- Läs mer i Förstå datasekretess för analys i molnskala i Azure.