建立 EDM SIT 範例檔案 (新體驗)
建立和提供資料完全相符 (EDM) 型敏感性資訊類型 (SIT) 是一個多階段過程。 它們可用於Microsoft Purview 數據外泄防護原則、電子檔探索和特定內容控管工作。
提示
如果您不是 E5 客戶,請使用 90 天Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據。
適用於
- 新體驗
如果您想要使用傳統體驗建立EDM SIT,請參閱 建立EDM SIT傳統體驗。
開始之前
- 請確定您已完成匯出源數據中的步驟, 以取得以精確數據比對為基礎的敏感性信息類型。
格式化範例檔案
系統會從範例檔案擷取數據行名稱來建立架構,並建議基底 SIT 將範例字段數據對應至其中。 其格式必須與您的來源敏感性資訊數據表檔案相同,而且應該包含代表實際數據的綜合值。 檔案可以 儲存 .csv(逗號分隔值) 、 .tsv (tab 分隔值) ,或管線分隔 () | 格式,但應該與實際的來源敏感性資訊數據表檔案相同。 如果您的數據值包含逗號,例如街地道址,建議使用 .tsv 格式。
- 使用大約 10-20 個數據列的數據,以確保系統有足夠的範例可供使用。
- 包含逗號的域值必須以引號括住。
- 第一個數據列必須是標頭數據列,且包含數據行名稱。
- 檔案必須包含至少一個數據列。
- 每個數據列都必須包含與標頭對應的正確欄位數目。
- 範例檔案最多可以包含 32 個數據行。
- 範例檔案的大小不能超過 2.5 MB。
- 欄位 (字段) 名稱必須以字母開頭、長度至少為三個字元,且只包含 (A-Z、a-z、0-9) 的英數位元,且不能包含空格、底線或其他特殊字元。
例如,如果您的實際數據使用索引標籤分隔 (.tsv) 格式,如下所示:
然後,您的範例檔案必須具有相同的數據行標頭,但針對數據列使用綜合值,如下所示
FirstName | LastName | PatientNumber | CreditCardNumber |
---|---|---|---|
埃裡克 | 所羅 門 | 987-65-4321 | 9000000000000000 |
麗莎 | 泰勒 | 123-45-6789 | 500000000000000 |
安德列 | 勞森 | 234-56-7890 | 200000000000000 |
如何使用範例檔案範本
如果您位於美國醫療保健、美國金融服務或美國保險業垂直,您可以從下列範例檔案範本開始,以加速檔案建立程式範例。 這些檔案包含各產業中最常用的數據行標頭,以及欄位中的綜合值。
若要使用這些範本:
- 下載您產業的範例檔案範本。
- 比較範本中的數據行標頭與實際的源數據,並挑選您想要在自定義範例檔案中作為主要字段的數據。
- 比較實際源數據的格式與綜合值的格式設定。 變更綜合值的格式設定,以符合源數據值的格式設定。
- 儲存自定義的範例檔案,以在 建立EDM SIT架構和規則套件時使用。
提示
在新的體驗中工作時,您可以選擇上傳範例檔案,或手動輸入範例檔案值。 建議您建立範例檔案。
下一步
- 如需新體驗: 建立EDM SIT架構和規則套件