次の方法で共有


EDM SIT サンプル ファイルを作成する (新しいエクスペリエンス)

正確なデータ一致 (EDM) ベースの機密情報の種類 (SIT) を作成して使用できるようにするのは、複数フェーズのプロセスです。 これらは、Microsoft Purview データ損失防止ポリシー、電子情報開示、および特定のコンテンツ ガバナンス タスクで使用できます。

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview 試用版ハブから開始します。 サインアップと試用期間の詳細については、こちらをご覧ください。

適用対象

  • 新しいエクスペリエンス

クラシック エクスペリエンスを使用して EDM SIT を作成する場合は、「 EDM SIT クラシック エクスペリエンスを作成する」を参照してください。

開始する前に

サンプル ファイルの書式設定

システムは、スキーマを作成するためにサンプル ファイルから列名を抽出し、サンプル フィールド データをマップするための基本 SID を推奨します。 ソース機密情報テーブル ファイルと同じ形式にする必要があり、実際のデータを表す合成値を含める必要があります。 ファイルは 、.csv (コンマ区切り値)、 .tsv (タブ区切り値)、またはパイプ区切り (|) 形式で保存できますが、実際のソース機密情報テーブル ファイルと同じである必要があります。 .tsv 形式は、データ値に番地などのコンマが含まれている場合に推奨されます。

  • 約 10 から 20 行のデータを使用して、システムで使用できる十分なサンプルがあることを確認します。
  • コンマを含むフィールド値は、引用符で囲む必要があります "
  • 最初の行はヘッダー行で、列名を含む必要があります。
  • ファイルには、少なくとも 1 行のデータが含まれている必要があります。
  • データの各行には、ヘッダーに対応する正しい数のフィールドが含まれている必要があります。
  • サンプル ファイルには、最大 32 個の列を含めることができます。
  • サンプル ファイルのサイズは 2.5 MB を超えることはできません。
  • 列 (フィールド) 名は、文字で始まり、3 文字以上で構成され、英数字 (A- Z、a-z、0- 9) のみで構成され、スペース、アンダースコア、またはその他の特殊文字を含めることはできません。

たとえば、実際のデータでタブ区切り (.tsv) 形式が使用されていて、次のようになります。

4 つの列と 3 行の人工的な実データのデータを含むタブ区切りテーブルを示す画像

その後、サンプル ファイルには同じ列ヘッダーが必要ですが、次のように行に合成値を使用します

FirstName LastName PatientNumber CreditCardNumber
エリック ソロモン 987-65-4321 9000000000000000
リサ テイラー 123-45-6789 500000000000000
アンドレ ローソン 234-56-7890 200000000000000

サンプル ファイル テンプレートの使用方法

米国医療、米国金融サービス、または米国保険業界の業種の場合は、次のサンプル ファイル テンプレートから開始して、サンプル ファイルの作成プロセスを高速化できます。 これらのファイルには、各業界で最も一般的に使用される列ヘッダーと、フィールド内の合成値が含まれています。

これらのテンプレートを使用するには:

  1. 業界のサンプル ファイル テンプレートをダウンロードします。
  2. テンプレート内の列ヘッダーを実際のソース データと比較し、カスタマイズしたサンプル ファイルのプライマリ フィールドとして使用する列ヘッダーを選択します。
  3. 実際のソース データの書式設定と合成値の書式設定を比較します。 ソース データ値の書式設定に合わせて合成値の書式設定を変更します。
  4. EDM SIT スキーマとルール パッケージを作成するときに使用するカスタマイズしたサンプル ファイルを保存します。

ヒント

新しいエクスペリエンスで作業する場合は、サンプル ファイルをアップロードするか、サンプル ファイルの値を手動で入力するオプションがあります。 サンプル ファイルを作成することをお勧めします。

次の手順