医療データ ソリューションの DICOM データ変換を使用する
医療データ ソリューションの DICOM データ変換機能を使用すると、医療におけるデジタル画像と通信 (DICOM) データをさまざまなソースからにインジェストして、保存、分析することができます。 この機能の詳細と、その展開と構成の方法については、以下を参照してください:
DICOM データ変換は、Microsoft Fabric の医療データ ソリューションで使用するオプション機能です。
前提条件
DICOM データ変換パイプラインを実行する前に、DICOM データ変換の展開と構成で説明されている前提条件、展開プロセス、および構成手順を完了していることを確認してください。
データ インジェスト オプション
この記事では、DICOMデータ変換機能を使用してDICOMイメージング データセット を取り込み、変換し、統合する方法について、手順を追って説明します。 この機能では、次の2つの取り込みオプションがサポートされています。
オプション 1: DICOM ファイルのエンドツーエンドのインジェスト。 ネイティブ形式 (DCM) または圧縮形式 (ZIP) の DICOM ファイルがレイクハウスにインジェストされます。 このオプションはインジェスト オプションと呼ばれます。
オプション2: DICOMサービスとの統合。 インジェストは、Azure Health Data Services の DICOM サービスとのネイティブ統合によって促進されます。 このオプションでは、DCM ファイルは最初に Azure Health Data Services DICOM サービスから Data Lake Storage Gen2 に転送されます。 パイプラインは、 Bring Your Own Storage (BYOS) 取り込みパターンに従います。 このオプションは、Azure Health Data Services (AHDS) オプションと呼ばれます。
変換 マッピング の詳細を理解するには、 ヘルスケア データ ソリューションにおけるDICOMメタデータ変換 マッピング を参照してください。
オプション 1: DICOM ファイルのエンドツーエンドのインジェスト
このオプションでは、事前に構築されたデータ パイプラインを使用して、DICOMファイルからのイメージング データを取り込み、ヘルスケア データ ソリューション レイクハウスに変換します。 エンドツーエンドの変換は、次の連続したステップで構成されます。
- DICOM ファイルを OneLake にインジェストする
- OneLake で DICOM ファイルを整理する
- DICOM メタデータをブロンズ レイクハウスに抽出する
- DICOM メタデータを FHIR (高速ヘルスケア相互運用性リソース) 形式に変換する
- ブロンズ レイクハウスで ImagingStudy デルタ テーブルにデータをインジェストする
- シルバー レイクハウスで ImagingStudy デルタ テーブルにデータをフラット化および変換する
- データを変換してゴールド レイクハウス Image_Occurrence テーブルにインジェストする (オプション)
チップ
この取り込みオプションでは、圧縮されたZIPファイルを含む 340ImagingStudies サンプル データセット を使用します。 あるいは、DICOMファイルを Ingest フォルダーに配置することで、ネイティブのDCM形式で直接取り込むこともできます。 ZIPファイル内では、DCMファイルは複数のネストされたサブフォルダーに構造化される場合があります。 DCMファイルの数、または取り込まれたZIPファイル内のサブフォルダーの数、深さ、ネストには制限はありません。 ファイル サイズの制限については、「 取り込みファイルのサイズ」を参照してください。
手順1: DICOMファイルをOneLakeに取り込む
ブロンズ レイクハウスの Ingest フォルダーは、ドロップ (キュー) フォルダーを表します。 このフォルダー内に DICOM ファイルをドロップできます。 その後、ファイルはブロンズ レイクハウス内の整理されたフォルダー構造に移動します。
ブロンズ レイクハウス の
Ingest\Imaging\DICOM\DICOM-HDS
フォルダーに移動します。選択 ... (省略記号) >アップロード>アップロードフォルダ。
選択 を作成し、 SampleData フォルダから 340ImagingStudies イメージング データセット をアップロードします。
SampleData\Imaging\DICOM\DICOM-HDS
あるいは、 OneLakeファイル エクスプローラー または Azureストレージ エクスプローラー を使用してサンプル データセット をアップロードすることもできます。
手順2: 画像データパイプラインを実行する
DCM/ZIPファイルをブロンズ レイクハウス の Ingest フォルダーに移動したら、イメージング データ パイプラインを実行してデータを整理し、シルバー レイクハウス に処理できるようになります。
ヘルスケア データ ソリューション 環境 で、 healthcare#_msft_imaging_with_clinical_foundation_ingestion データ パイプラインを開きます。
選択 は 実行 ボタンを押して、ブロンズからシルバーまでの画像データの処理を開始します レイクハウス。
このデータ パイプラインは、5つのノートブックを順番に実行します。3つはヘルスケア データ基盤機能の一部として展開され、2つはDICOMデータ変換機能から展開されます。 これらのノートブックの詳細については、「 DICOMデータ変換: アーティファクト」を参照してください。
手順3: シルバーからゴールドへの変換ノートを実行する
ヒント
この変換 手順 はオプションです。 DICOMデータをObservational Medical Outcomes Partnership (OMOP) 共通データ モデル (CDM) 形式にさらに変換する必要がある場合にのみ使用してください。 それ以外の場合は、この手順に進みます。
この変換を実行する前に、ヘルスケア データ ソリューションで OMOP 変換機能 を展開して構成します。
イメージング パイプラインを実行すると、イメージング データはシルバーの レイクハウス に変換されます。 銀色の レイクハウス は、さまざまなモダリティからのデータが構造化された方法で収束し始める最初の ポイントする として機能します。 データを OMOP 研究標準にさらに変換して、 コホートの検出と構築 (プレビュー) 機能で使用するには、シルバーからゴールドへの変換ノートブックを実行します。
ヘルスケア データ ソリューション 環境 で、 healthcare#_msft_omop_silver_gold_transformation ノートブックを開きます。
このノートブックは、ヘルスケア データ ソリューションAPIを使用して、シルバー レイクハウス のリソースをゴールド レイクハウス のCDMデルタ テーブルに変換します。 OMOP OMOP 既定では、ノートブックの構成を変更する必要はありません。
すべてを実行を選択して、ノートブックを実行します。
ノートブックは、シルバーの レイクハウス の OMOP ImagingStudy デルタ テーブル内の新規または更新されたレコードを追跡および処理するための 追跡アプローチ を実装します。 シルバー レイクハウス のFHIRデルタ テーブル ( ImagingStudy テーブルを含む) のデータを、ゴールド レイクハウス の対応する OMOP デルタ テーブルに変換します。( Image_Occurrence テーブルを含む)。 この変換の詳細については、 銀から金へのデルタ表の変換 マッピング を参照してください。
詳細な OMOP マッピング 情報については、 FHIR to OMOP マッピング を参照してください。
手順4: データを検証する
実際のシナリオでは、データの取り込みにはさまざまな品質レベルのソースが関係します。 データ検証で詳しく説明されている検証エンジンは、提供されたイメージング サンプル データの一部に対して意図的に検証をトリガーします。 DICOM標準に準拠していないファイルは、 Failed フォルダーに移動され、処理されません。 しかし、イメージングサンプルデータで示されているように、1つのファイルのエラーによってパイプライン全体が中断されることはありません。 パイプラインと関連するノートブックは正常に実行されますが、 Failed フォルダー Imaging\DICOM\DICOM-HDS\YYYY\MM\DD
には準拠していないファイルが含まれています。 その他の有効なファイルはすべて正常に処理され、パイプライン全体のステータスは成功となります。 この無効なファイルをイメージング サンプル データに意図的に含めるのは、イメージング パイプラインが無効なファイルを処理する方法を示し、データセット の問題を特定できるようにするためです。
パイプラインが生のDICOMファイルからすべてのメタデータを正常に抽出したことを確認するには、ブロンズの レイクハウス を開き、 SQL分析 エンドポイント と 選択 New SQLクエリ に切り替えます。
パイプラインが正しく実行された場合、 ImagingDicom テーブルに7739個の正常に処理されたDICOMインスタンスが表示されます。 確認するには、次のSQLクエリを実行します。 処理が成功すると、[結果] ペインに 7739 が表示されます。 この数値は、コンピュータ断層撮影 (CT) や磁気共鳴画像 (MRI) スキャンなどのさまざまなモダリティからのデータで構成されるサンプル データ内のDICOMインスタンスの合計数を表します。
select count(*) from ImagingDicom
パイプラインがレイクハウスに正常に水和したことを確認するには、シルバーの レイクハウス を開き、 SQL分析 エンドポイント に切り替えて、選択 New SQLクエリ を実行します。 パイプラインを正しく実行するには、339個の正常に処理された ImagingStudy リソースを確認する必要があります。 確認するには、次のSQLクエリを実行します。 最初は340個の ImagingStudy リソースから開始しますが、処理中にエラーが発生します。
select count(*) from ImagingStudy
オプション2: DICOMサービスとの統合
重要
この変換オプションは、Azure Health Data Services DICOMサービスを使用しており、DICOM APIをデプロイしている場合にのみ使用してください。
この変換アプローチは、Azure Health Data Services DICOMサービスを使用して、 Bring Your Own Storage (BYOS) パターン を拡張します。 DICOMサービスは、DICOMオブジェクトの保存、確認、検索、削除を可能にする DICOMweb API のサブセットです。 これは、FabricワークスペースにリンクされたGen2アカウントと統合されるため、変換パイプラインはDICOMデータに直接アクセスできます。 Azure Data Lake Storage
あるいは、Azure DICOM APIの使用をスキップし、Data Lake Storage Gen2アカウントに保存されているDICOMファイルを取り込むこともできます (この場合は、手順5から開始します)。
「Azure Health Data ServicesにDICOM APIをデプロイする」で構成を確認して完了します。
Azure DICOMサービスを展開した後、 Store (STOW-RS) APIを使用してDCMファイルを取り込みます。 OneLakeファイル エクスプローラー または Azureストレージ エクスプローラーを使用して、イメージング サンプル データからDCMファイルをダウンロードしてテストします。
希望する言語に応じて、次のいずれかのオプションを使用してDCMファイルをサーバーにアップロードします。
ファイルのアップロードが成功したかどうかを確認します。
- Azureポータルで、DICOMサービスにリンクされたストレージ アカウントを 選択 します。
- コンテナー に移動し、パスを 追従する
[ContainerName]/AHDS/[AzureHealthDataServicesWorkspaceName]/dicom/[DICOMServiceName]
します。 - ここでアップロードされたDCMファイルが表示されるかどうかを確認します。
ヒント
- サーバーにアップロードするとファイル名が変更される可能性があります。 ただし、ファイルの内容は変更されません。
- ファイル サイズの制限については、「 取り込みファイルのサイズ」を参照してください。
Data Lake Storage Gen2の場所に保存されているDICOMファイルのショートカットをブロンズ レイクハウス に作成します。 追従する の「 Gen2ショートカットを作成する Azure Data Lake Storage 」の手順を実行します。
- Azure DICOMサービスの場合は、サービスで作成されたData Lake Storage Gen2アカウントを使用するようにしてください。
- Azure DICOMサービスを使用していない場合は、新しいData Lake Storage Gen2アカウントを作成するか、既存のアカウントを使用することができます。 詳細については、「 使用するストレージ アカウントを作成する」を参照してください Azure Data Lake Storage。
一貫性を保つために、ショートカットを作成するには次のフォルダー構造を使用します
Files\External\Imaging\DICOM\[Namespace]\[BYOSShortcutName]
。Namespace
値により、異なるソース システムからのショートカットが論理的に分離されます。 たとえば、Namespace
値にData Lake Storage Gen2名を使用できます。ヒント
OneLakeショートカットは、Data Lake Storage Gen2以外の複数のストレージ システムもサポートします。 サポートされているストレージ タイプの完全なリストについては、 OneLakeショートカット を参照してください。
BYOSを有効にするには、 adminレイクハウス を構成します。
healthcare#_msft_admin レイクハウス に移動し、 deploymentParametersConfiguration.json ファイル
Files\system-configurations
を開きます。この構成ファイルでBYOS設定を有効にします。 OneLakeファイル エクスプローラーを使用して、次のフォルダー パスから deploymentParametersConfiguration.json ファイルを開きます:
OneLake - Microsoft\[WorkspaceName]\healthcare#_msft_admin.Lakehouse\Files\system-configurations
。 任意のJSONまたはテキスト エディター (Windowsメモ帳など) を使用してファイルを開き、byos_enabled
パラメーターを検索して、 true に設定します。
DICOMデータ変換機能は、フォルダー階層/構造に関係なく、ソースのData Lake Storage Gen2の場所にあるすべてのDICOMファイルにアクセスできるようになりました。 取り込み オプションで、DICOMファイルを 完了 として手動で取り込む必要はありません。 前のセクションの 手順2: イメージング データ パイプラインを実行する から実行を開始し、イメージング パイプラインを使用してDICOMデータを変換します。
ヒント
Azure Health Data Services DICOMサービスとの統合の制限事項を理解するには、「 DICOMサービスとの統合」を参照してください。