Azure의 클라우드 규모 분석을 위한 Lamna Healthcare 시나리오
이 참조 아키텍처는 확장성뿐만 아니라 데이터를 보호하기 위해 클라우드 규모 분석을 사용하려는 고객을 위해 작성되었습니다. 중요한 데이터에 대한 액세스를 제어하는 방법과 분석자와 적절하게 둔감한 데이터를 공유할 수 있는 방법을 보여 줍니다.
고객 프로필
Lamna Healthcare(Lamna)는 의료 제공자에게 환자 관리 서비스를 제공합니다. 비즈니스 과정에서 매우 중요한 환자 데이터를 처리합니다. 자세한 데이터에 대한 액세스는 신중하게 제한해야 합니다. 그러나 Lamna는 이 데이터의 일부 버전을 안전하게 사용하여 비즈니스 사례를 알리고자 합니다. 환자 신뢰 또는 데이터 보호법을 위반하지 않는 분석가와 데이터를 공유하는 메커니즘이 필요합니다.
현재 상황
현재 Lamna는 모든 데이터를 온-프레미스에 저장합니다. 환자 데이터는 기존 데이터베이스 시스템에 저장됩니다. 그러나 비즈니스가 성장하고 데이터 양이 증가함에 따라 회사는 환자 애플리케이션을 클라우드로 마이그레이션해야 합니다. 이러한 전환의 일환으로 애플리케이션의 데이터를 클라우드 기반 분석 플랫폼으로 복사하여 분석가가 애플리케이션 데이터베이스에 추가 부하를 주지 않고 데이터를 더 잘 사용할 수 있도록 합니다.
Lamna의 중요한 관심사는 환자 데이터의 보안입니다. 의료 회사로서, 그들은 여러 가지 다른 데이터 보호 법의 적용을 받습니다.
아키텍처 솔루션
Lamna는 클라우드 기반 분석 플랫폼을 위한 솔루션으로 클라우드 규모 분석을 구현합니다. 확장성을 높이고 중요한 데이터 제품을 명확하게 분리하기 위해 여러 랜딩 존을 사용합니다.
데이터 관리 랜딩 존
모든 클라우드 규모 분석 구현에 대한 중요한 개념은 하나의 데이터 관리 랜딩 존을 갖는 것입니다. 이 구독에는 모든 랜딩 존에서 공유될 리소스가 포함됩니다. 여기에는 방화벽 및 프라이빗 DNS 영역과 같은 공유 네트워킹 구성 요소가 포함됩니다. 데이터 및 클라우드 거버넌스에 대한 리소스도 포함됩니다. Microsoft Purview 및 Databricks Unity 카탈로그는 테넌트 수준에서 서비스로 배포되었습니다.
환자 데이터 랜딩 존
Lamna의 조직도에서 환자 관리 그룹은 운영 그룹의 일부입니다. 그러나 사용하는 데이터의 극도의 민감성을 감안할 때, 클라우드 규모 분석 아키텍처에 자체 데이터 착륙 구역이 있습니다.
이 랜딩 존은 회사의 환자 관리 애플리케이션 및 관련 데이터 제품의 자세한 환자 데이터 및 건강 기록의 복사본을 호스팅합니다. 이러한 데이터 제품은 정기적으로 클라우드로 데이터를 수집하고 Azure Data Lake Storage에 저장하는 데이터 애플리케이션에 의해 랜딩 존에 로드됩니다.
작업 데이터 랜딩 존
Lamna의 운영 그룹은 회사의 핵심 사업 라인을 담당하며, 즉 의료 제공자에게 컨설팅 서비스를 제공합니다. 운영 데이터 랜딩 존에서 이러한 의료 제공자 및 해당 공급자가 참여하는 서비스와 관련된 데이터를 저장합니다.
모든 비즈니스 데이터와 마찬가지로 이러한 데이터 제품에 대한 민감도 요소가 있으며 Lamna는 클라이언트 목록을 보호하려고 합니다. 그러나 이 데이터에는 개인에 대한 건강 정보가 포함되지 않으므로 가장 엄격한 데이터 보호법이 적용되지 않습니다.
데이터 애플리케이션
운영 랜딩 존에는 Lamna의 온-프레미스 운영 시스템에서 의료 공급자 데이터를 로드하는 데이터 애플리케이션 이 포함되어 있습니다. 이와 같이 모든 데이터 애플리케이션은 데이터를 클라우드 as-is에 저장하고 데이터 산출물에 변환을 적용하지 않습니다.
데이터 제품
Lamna 전체의 분석가는 비즈니스에 대한 보고서를 작성하기 위해 데이터에 액세스해야 합니다. 그러나 대부분의 데이터는 광범위한 대상 그룹에게 너무 민감합니다. 매우 중요한 환자 데이터에 안전하게 액세스할 수 있도록 운영 팀은 토큰화된 환자 데이터 세트 제품을 랜딩 존에 만들었습니다. Azure Data Factory를 사용하여 환자 방문 영역에서 환자 데이터를 복사합니다. 그러나 팀은 개인 데이터가 포함된 열을 제거하거나 토큰화하도록 주의했습니다. 이 단계를 통해 분석가는 환자의 개인 정보를 노출하지 않고 비즈니스 목적으로 데이터를 사용할 수 있습니다.
마케팅 데이터 랜딩 존
마케팅 그룹은 새로운 고객을 확보하고 마켓플레이스 내에서 Lamna의 위치를 관리하는 데 초점을 맞추고 있습니다. 그들의 마케팅 랜딩 존은 주로 그들이 봉사하는 시장과 의료 산업에 대한 외부 데이터 제품을 저장하고 분석하는 데 사용됩니다.
그러나 새로운 마케팅 추진을 지원하기 위해, 그룹은 Lamna의 고객들이 돌보는 환자들의 건강 결과에 대한 연구를 수행하고 싶어 합니다. 그(것)들은 헬스케어에 그들의 접근이 더 나은 결과로 이끌어 내는 것을 보여주는 강한 통계적인 증거에 의해 지원되는 사실 기지를 둔 보고서를 생성하기 위하여 희망합니다.
이러한 새로운 노력을 지원하기 위해 마케팅 그룹의 연구원들은 매우 민감한 환자 데이터에 안전하고 규정을 준수하는 방식으로 액세스하는 동시에 필요한 정보를 얻을 수 있어야 합니다.
이러한 요구를 충족하기 위해 마케팅 팀은 운영 팀에서 만든 토큰화된 환자 데이터 세트에서 집계된 데이터 제품을 만듭니다. 이러한 데이터 제품에는 개별 상태 레코드가 포함되지 않습니다. 대신 여러 축에서 레코드를 그룹화합니다. 이것은 연구원이 어떤 개별의 건강 정보에 접근을 위험하지 않고 전체적으로 인구의 연구 결과를 수행하는 것을 돕습니다.
그림 1: Lamna 아키텍처 다이어그램 모든 Azure 서비스가 다이어그램에 표시되는 것은 아닙니다. 아키텍처 내에서 리소스를 구성하는 방법에 대한 핵심 개념을 강조하기 위해 간소화되었습니다.
근거
모든 중요한 데이터에는 항상 고유한 데이터 랜딩 존이 제공되어야 하나요?
아니요. 즉시 접근 또는 고객이 관리하는 키와 같은 특정 보호가 필요한 가장 제한된 데이터만 자체 수신 영역을 필요로 합니다. 다른 시나리오의 경우 Azure의 다른 데이터 보호 기능은 데이터에 매우 안전한 환경을 제공합니다. 여기에는 행 수준 보안, 열 수준 보안 및 암호화된 열이 포함됩니다.
다음 단계
- 다음 단계로 클라우드 규모 분석배포 템플릿으로 이동하십시오.
- Azure에서 클라우드 규모 분석을 위한 데이터 개인정보를 이해하기 섹션에서 더 알아보세요.