建立 EDM SIT 架構和規則套件 (新體驗)
您可以使用 (Microsoft Purview 合規性入口網站中的單一工作流程,在新的體驗中建立完全符合 EDM) 架構和 EDM 敏感性資訊類型的數據 (SIT) 。
提示
如果您不是 E5 客戶,請使用 90 天Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據。
適用於
- 新體驗
如果您想要使用傳統體驗建立EDM SIT,請參閱建立 EDM SIT (傳統體驗) 。 如果您需要決定要使用哪種體驗的協助,請參閱 為您選擇正確的EDM SIT 建立體驗。
開始之前
開始本文所述的程式之前,請務必先完成下列文章中的步驟。
如果您不熟悉EDM型 SIT 或其實作,請務 必 熟悉下列文章中的概念:
權限
您必須具有 全域管理員 或 合規性系統管理員 許可權,才能透過合規性入口網站建立、測試及部署自定義敏感性信息類型。 如需角色和許可權的詳細資訊,請參閱關於 Office 365 中的系統管理員角色。
重要考量
以下是建立EDM架構和 EDM 型SIT時應考慮的幾個重要考慮。
選取主要元素之前, 請先檢閱 內建的 SIT ,以瞭解哪些專案最符合您的需求。
針對每個 EDM SIT,您必須至少選取一個主要元素 ,而且不超過 10 個主要元素。 如果您有多重令牌的相互關聯資料欄位,請選擇下列其中一個選項:
- 選 取 [多重令牌比對]。
- 將多標記欄位中的元素對應至可偵測該內容的 SIT。 (您對應的唯一值字段越多,EDM SIT 的精確度就越高。對應多個字段也有助於改善效能、減少處理負載,以及避免系統逾時。)
選取 SIT 的主要元素時, 請選取可確保資料表中每個數據列都是唯一的欄位。 例如,請勿使用 或 之類的
FirstName
DateOfBirth
欄位。 為什麼? 因為名字和出生日期可能會在整個敏感數據表中重複。 請改用具有唯一值的欄位,例如SocialSecurityNumber
或BankAccountNumber
。建議:從範例數據檔建置EDM架構。 在遵循此建議時,請確定您的範例數據檔符合下列需求:
- 數據必須組織為具有數據行和數據列的數據表。 針對數據行標頭使用您的功能變數名稱。 (數據表中的數據列會對應到您的個別數據項。)
- 功能變數名稱只能包含英數位元。
- 功能變數名稱必須以字母開頭,且必須包含至少三個英數位元。
- 如果不符合這些命名需求,上傳範例數據檔時可能會發生錯誤。
如果您使用敏感性資訊的範例檔案來設定EDM SIT,系統會針對每個最能偵測上傳數據的欄位建議現有的 SIT,如果這類 SIT 可用的話。 Microsoft Purview 預設為用於偵測敏感性內容的單一令牌比對。 因此,如果沒有現有的 SIT 能夠偵測 EDM 架構中欄位的數據,則會套用單一令牌比對模式。 請務必 確定針對每個元素建議的 SIT 會偵測您想要監視的確切字串:
- 請確定建議的 SIT 不包含任何與您想要偵測的內容不同的周圍字元。
- 請確定建議的 SIT 不會排除字串中儲存在敏感性資訊數據表中的任何有效部分。
- 請確定您使用的 SIT 與您想要偵測的數據格式非常相符。 例如,尋找類似
Nine digits with optional hyphens or spaces
的內容,而不只是digits
,或檢查A combination of 32 characters consisting of letters and digits
,而不只是text strings
。
使用與您嘗試偵測的數據格式非常相符的 SIT,是改善結果精確度並縮短比對完成所需時間的另一種方式。
注意事項
當您向前流覽 ([下一步 ]) 時,會儲存所有資料 (在進行選取時透過工具 ) 上一 步。 回溯流覽僅支援從最上層頁面移至最上層頁面,以及從子頁面移至子頁面。 您無法從最上層頁面往後流覽至上一個子頁面,或從子頁面往後巡覽至前一個最上層頁面。
建立EDM架構和SIT
下列程式提供使用新體驗建立EDM架構和SIT的逐步指引。 如需整個程式的概念性概觀和圖表,請參閱 EDM工作流程概觀 (新體驗) 。
指示
在租使用者的合規性入口網站中,移至 數據分類>EDM分類器。
請確定 [新增 EDM 體驗 ] 切換已設定為 [ 開啟]。
選擇 [+ 建立 EDM 分類器]。
將 SIT 命名為 ,並新增描述。 系統會針對它所產生的相關聯架構,使用這個名稱加上字組架 構。
選擇 [下一步]。
選取您想要用於架構的方法: 上傳包含範例數據的檔案,或 手動定義您的數據結構。 (最佳做法是上傳範例數據檔。此程序的其餘部分會假設此選項。)
不論是哪一種情況, 您都需要建立 EDM SIT 範例檔案中 所討論的資訊 (範例檔案的新體驗) 。選擇 [下一步]。
選取您的範例檔案,然後選取 [上傳檔案]。 選擇 [下一步]。
(如果在上傳期間顯示錯誤,請加以解決,然後再試一次。)在 [ 選取主要元素] 頁面上:
- 在 [ 主要元素] 資料行中,選取您的主要元素。 每個主要元素都必須對應至 SIT。 最佳做法是選取 [比對驗證] 數據行底下顯示 [完全相符 ] 的字 段。
- 在每個欄位的 [ 比對模式 ] 資料行中,指定要套用下列哪一個比對選項:
- 選項 1: 不執行任何動作來接受系統建議的 SIT。
- 選項 2: 展開下拉功能表。 在 [敏感性資訊] 底下,輸入 (SIT) ,選擇鉛筆 (編輯) 圖示,然後選取另一個現有的 SIT。
- 選項 3: 在 [ 比對模式] 下 ,選取 [單一令牌]。
- 選項 4: 在 [ 比對模式] 下,選取 [多重令牌]。
選擇 [下一步]。
設定所選取資料行中資料的設定。
- [ 對所有數據行使用相同的設定 ] 切換預設會設定為 [ 開啟 ]。 如果您想要針對每個數據欄位使用個別的設定,請將切換設定為 [關閉]。
- 預設會選取 [資料行中的數據不區分大小寫 ] 選項。 若要強制執行 區分大小寫的 偵測,請取消核取此方塊。
- 如有需要,請選取 [ 忽略所有數據行中數據的分隔符和標點符號 ] 選項。您可以從清單中選取要忽略的分隔符和標點符號,或輸入要忽略的自定義分隔符和標點符號。
重要事項
如果您為架構中的主要元素數據行選取 [ 忽略分隔符 ] 選項,請確定您對應到的 SIT 是設計來比對具有和不使用所選分隔符的數據。
- Choose Submit.
完成之後,EDM 會自動為您識別的每個主要元素產生一個偵測規則。 它也會建立 高信賴 度規則和 中信賴 度規則。 高信賴度規則比中度信賴規則具有更多比對需求,而中度信賴規則的需求會比低信賴度規則更多。 (必須手動建立低信賴度規則。) 您可以在 [設定 主要元素的偵測規則 ] 頁面上檢閱和編輯這些規則。
提示
未選取為主要專案的專案仍可作為支援) 辨識項的 (。 找到的支援元素越多,在主要元素的定義鄰近性中,相符專案的信賴度就越高。
建議
在建立或編輯架構之後至少等候一小時,再下載並使用它進行EDM數據上傳。 這有助於確保架構已與系統同步。 如果下載架構太快,則嘗試透過命令行下載架構時,可能會顯示錯誤訊息。
請勿使用EDM上傳代理程式來下載、手動編輯,然後重新上傳架構。 這樣做會導致錯誤,因為使用EDM上傳代理程式下載架構會將標記新增至未通過架構建立檢查的架構。
若要協助確保偵測到所有確認辨識項,請採取下列其中一個動作:- 將多令牌相互關聯辨識項字段修剪為多重令牌功能所支援的令牌數目上限, (目前五個令牌) 。
- 將多標記欄位對應至可完全偵測多標記數據的 SIT。 - 建立或編輯 EDM SIT 之後,請使用下列 PowerShell Cmdlet 進行測試,然後等候 24 小時,然後在數據外洩防護 (DLP) 原則解決方案中測試它。
Test-DataClassification -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]”