Visão geral de Transformação de dados DICOM nas soluções de dados de serviços de saúde
O recurso Transformação de dados DICOM nas soluções de dados de serviços de saúde permite que você traga seus dados DICOM (Digital Imaging and Communications in Medicine) para o Fabric OneLake. Você pode ingerir, armazenar e analisar metadados de imagem de várias modalidades, como raios-X, tomografias computadorizadas (TC) e exames de ressonância magnética (RM). O recurso permite a colaboração, a pesquisa e desenvolvimento (P&D) e a inovação em IA para diversos casos de uso de saúde e ciências biológicas. A integração entre dados de imagem e dados clínicos armazenados no formato FHIR (Fast Health Interoperability Resources) capacita médicos e pesquisadores a interpretar achados de imagem dentro do contexto clínico correto. Essa interpretação leva a maior precisão diagnóstica, decisões clínicas informativas e melhores resultados para os pacientes.
Os pipelines de soluções de dados de serviços de saúde permitem a transformação perfeita de dados DICOM (imagem) em formatos tabulares que podem persistir no lake nos formatos FHIR (prata) e OMOP (Observational Medical Outcomes Partnership) (ouro). Eles facilitam a realização de análises exploratórias e a execução de análises de imagem e radiômica em larga escala. O processo de transformação de dados por meio do pipeline de ingestão de imagens consiste nos estágios a seguir:
- O pipeline ingere e persiste os arquivos brutos de imagens DICOM, presentes no formato nativo DCM, no lakehouse bronze.
- Em seguida, ele extrai os metadados DICOM (marcas) dos arquivos de imagem e os insere no metastore DICOM do lakehouse bronze para consulta simples.
- Os dados no metastore DICOM são convertidos em arquivos FHIR NDJSON na tabela delta ImagingStudy, armazenados no OneLake e transformados no formato FHIR relacional (lakehouse prata).
- Por fim, os dados são transformados para a tabela delta Image_Occurrence no formato OMOP (lakehouse ouro).
Essa transformação facilita cenários como:
- Compartilhamento de conjuntos de dados de pesquisa com controle de acesso baseado em função.
- Desidentificação de dados de texto e imagem para pesquisa e colaboração.
- Uso de dados DICOM para treinar e validar modelos de machine learning.
- Uso de dados DICOM para a realização de estudos clínicos, análises epidemiológicas e atividades educativas.
A Transformação de dados DICOM é um recurso opcional nas soluções de dados de serviços de saúde no Microsoft Fabric. Você tem a flexibilidade de decidir se deseja usá-lo ou não, dependendo de suas necessidades ou cenários específicos.
Para explorar esse recurso e saber mais sobre a implantação, configuração e uso, consulte:
- Transformação de metadados DICOM mapeamento
- Implantar e configurar a Transformação de dados DICOM
- Usar a transformação de dados DICOM
- Considerações de uso para a transformação de dados DICOM
Arquitetura conceitual
Conforme explicado em Arquitetura de dados e gerenciamento nas soluções de dados de serviços de saúde, a base do recurso está no design inovador do lakehouse medallion. Veja como essa estrutura organiza e processa dados DICOM nas três camadas do lakehouse:
Bronze: essa primeira camada armazena os dados de imagem de origem em seu formato DICOM original (arquivos DCM) e um metastore que contém o conjunto completo de metadados (marcas DICOM) extraídos dos arquivos DCM.
Prata: a camada prata (com base na especificação FHIR) armazena os metadados de imagem provenientes do lakehouse bronze. Ela também armazena links de arquivos referenciais para os locais de arquivos DCM na camada bronze. Os metadados de imagem e as referências de arquivo são armazenados na tabela delta ImagingStudy, cujo esquema é baseado em um formato nivelado do recurso FHIR R4.3 de ImagingStudy.
Ouro: O ouro camada (com base na OMOP especificação) armazena e transforma dados de imagem originados da tabela delta prata lakehouse ImagingStudy . Os metadados de imagem e as referências de arquivo são armazenados na tabela delta Image_Occurrence ouro, cujo esquema é baseado no mais recente desenvolvimento de padronização de dados para pesquisa observacional baseada em imagem. Para obter mais informações sobre essa padronização, consulte OMOP Extensão do Modelo de Dados Comum para dados de imagens médicas.
Para entender como os metadados DICOM são transformados em diferentes lakehouses e revisar a transformação mapeamento, consulte Transformação de metadados DICOM mapeamento em soluções de dados de saúde.