Partager via


Vue d’ensemble de l’ingestion des données DICOM dans les solutions de données de santé (version préliminaire)

[Cet article fait partie de la documentation en version préliminaire et peut faire l’objet de modifications.]

La fonctionnalité d’ingestion des données DICOM dans les solutions de données de santé (version préliminaire) vous permet d’importer vos données DICOM (Digital Imaging and Communications in Medicine) dans Fabric OneLake. Vous pouvez ingérer, stocker et analyser des métadonnées d’imagerie de diverses modalités, telles que les rayons X, les analyses de tomodensitométrie (CT) et les analyses d’imagerie par résonance magnétique (IRM). Cette fonctionnalité permet la collaboration, la recherche et le développement (R&D) et l’innovation en matière d’IA pour divers cas d’utilisation dans le domaine des soins de santé et des sciences de la vie. Cette intégration entre les données d’imagerie et les données cliniques stockées au format FHIR (Fast Health Interoperability Resources) permet aux cliniciens et aux chercheurs d’interpréter les résultats de l’imagerie dans le contexte clinique correct. Cette interprétation conduit à une plus grande précision diagnostique, à des décisions cliniques informatives et à de meilleurs résultats pour les patients.

Les pipelines et les notebooks des solutions de données de santé (version préliminaire) permettent une transformation transparente des données DICOM (imagerie) en formats tabulaires qui peuvent persister dans le lac aux formats FHIR (argent) et OMOP (Observational Medical Outcomes Partnership) (or). Ils facilitent la réalisation d’une analyse exploratoire et l’exécution d’une analyse d’imagerie et de la radiomique à grande échelle. Le processus de transformation des données via le pipeline d’ingestion d’imagerie comprend les phases suivantes :

  1. Le pipeline ingère et conserve les fichiers d’imagerie DICOM bruts, présents au format DCM natif, dans la lakehouse bronze.
  2. Ensuite, il extrait les métadonnées DICOM (balises) des fichiers d’imagerie et les insère dans le metastore DICOM de la lakehouse bronze pour une recherche simple.
  3. Les données du metastore DICOM sont converties en fichiers NDJSON dans la table delta FHIR ImagingStudy, stockés dans OneLake et transformés au format FHIR relationnel (lakehouse argent).
  4. Enfin, les données sont transformées dans la table delta Image_Occurrence au format OMOP (lakehouse or).

Cette transformation facilite les scénarios tels que :

  • Partage d’ensembles de données de recherche avec un contrôle d’accès en fonction du rôle.
  • Désidentification des données textuelles et d’imagerie pour la recherche et la collaboration.
  • Utilisation des données DICOM pour entraîner et valider les modèles Machine Learning.
  • Utilisation des données DICOM pour réaliser des études cliniques, des analyses épidémiologiques et des activités éducatives.

L’ingestion des données DICOM est une fonctionnalité facultative dans les solutions de données de santé dans Microsoft Fabric (version préliminaire). Vous avez la possibilité de décider de l’utiliser ou non, en fonction de vos besoins ou scénarios spécifiques.

Pour savoir comment déployer, configurer et utiliser la fonctionnalité d’ingestion des données DICOM, consultez :

Architecture conceptuelle

Comme expliqué dans Présentation de l’architecture des solutions de données de santé (version préliminaire), la base de la fonctionnalité réside dans l’architecture de la lakehouse en médaillon. Voici comment ce framework organise et traite les données DICOM dans les trois couches de la lakehouse :

  • Bronze : cette première couche stocke les données d’imagerie sources dans leur format DICOM d’origine (fichiers DCM) et un metastore contenant l’ensemble complet des métadonnées (balises DICOM) extraites des fichiers DCM.

  • Argent : la couche argent (basée sur la spécification FHIR) stocke les métadonnées d’imagerie provenant de la lakehouse bronze. Elle stocke également les liens de fichiers référentiels vers les emplacements de fichiers DCM dans la couche bronze. Les métadonnées d’imagerie et les références de fichiers sont stockées dans la table delta ImagingStudy, dont le schéma est basé sur un format aplati de la Ressource FHIR ImagingStudy (R4.3).

  • Or : la couche or (basée sur la spécification OMOP) stocke et transforme les données d’imagerie provenant de la table delta ImagingStudy de la lakehouse argent. Les métadonnées d’imagerie et les références de fichiers sont stockées dans la table delta Image_Occurrence de la lakehouse or, dont le schéma est basé sur le développement le plus récent de la standardisation des données pour la recherche observationnelle basée sur l’imagerie. Pour plus d’informations sur cette standardisation, consultez Extension OMOP Common Data Model pour les données d’imagerie médicale.

Pour comprendre comment les métadonnées DICOM se transforment dans les différentes lakehouses et pour examiner le mappage de transformation, consultez Transformation des métadonnées DICOM dans les solutions de données de santé (version préliminaire).