共用方式為


控管數據的需求

雲端規模分析建議您考慮下列管理數據的需求:

  • 數據實體定義,以在商務詞彙中建立一般商務詞彙。 此內容中的數據實體表示客戶、供應商、材料、員工和其他概念。
  • 數據實體識別和探索。
  • 用來控管數據存取安全性、數據隱私權和數據保留的數據分類。
  • 人員,例如具有控管責任的數據擁有者,以及負責數據保護和質量的數據管理人。
  • 數據控管程式。
  • 數據生命週期管理,以控管應該保留數據的時間長度。
  • 定義特定數據在其生命週期中應如何控管的原則和規則。
  • 在分散式數據環境中跨數據存放區強制執行原則。
  • 主要數據管理,讓數據在客戶、產品和供應商等操作和分析系統中保持一致。
  • 元數據譜系,以了解數據實體的轉換和關聯性。
  • 技術可讓您控管結構化、多結構化和非結構化數據。 治理可能會跨越數據中心、多個雲端和邊緣。

其中一項挑戰是,數據會收集並儲存在企業中的多個位置。 數據可能包括收集並儲存在不同的地理位置和不同法律司法管轄區的數據。 因此,不同的立法可能會適用於管理不同司法管轄區的相同數據。 探索分散在多個雲端和地理位置的數據,以:

  • 了解分散式數據環境中存在哪些數據屬性、數據實體和數據關聯性。
  • 將數據分類,以瞭解如何控管數據。
  • 定義原則,以指定應該如何針對每種類型的數據分類和生命週期管理控管數據。
  • 在分散式數據環境中強制執行數據品質、數據存取安全性、數據隱私權和生命週期管理原則。

資料分類

數據分類是將數據資產分類的一種方式,方法是將唯一的邏輯標記或類別指派給數據資產。 分類是以資料的商務內容為基礎。

需要有一種方法來分類數據,以瞭解其機密程度,以及保留多久時間。 分類需要:

  • 數據機密性分類方案。
  • 數據保留分類方案。

數據機密性分類配置

分類 描述
公開 任何人都可以存取數據,也可以傳送給任何人。 例如,開啟政府數據。
僅供內部使用。 只有員工可以存取數據,且無法在公司外部傳送。
機密 只有在特定工作需要數據時,才能共享數據。 若沒有保密協議,數據就無法在公司外部傳送。
敏感性 (個人資料) 數據包含私用資訊,此資訊必須遮罩並共用,只有需要知道的時間有限。 數據無法傳送給未經授權的人員或公司外部。
受限制 數據只能與負責保護的具名個人共用。 例如,法律檔或商業秘密。

數據生命週期保留分類配置

保留 描述
None 您可以隨時刪除資料。
暫存 將數據保留一段短時間內。 例如,將 Twitter 數據保留一周。
固定期間 將數據保留一組年份,之後即可刪除。 例如,將稅務記錄保留七年,以符合政府法律。
持續性 永遠不要刪除數據。 例如,法律信件。

使用每個配置中定義的類別,將數據機密性和數據生命週期保留分類程序自動化,以一致地在分散式數據環境中標記數據。 自動化可讓它保持一致且正確控管。 然後,定義分類配置中每個類別的規則和原則,以指定如何根據分類控管數據。

數據控管角色和責任

另一個需求是需要問責。 否則,混淆會揮之不去誰負責控管數據。 如果沒有責任,如何回答下列問題?

  • 誰會設定成功計量並監視數據控管計劃的運作方式?
  • 誰是數據擁有者?
  • 誰定義和維護商務詞彙?
  • 誰會建立和維護存取安全性的原則?
  • 誰保護個人資料隱私權以符合規範?
  • 誰正在尋找所有宣傳冊和合作夥伴網站的產品品質?
  • 誰能確保客戶數據在所有系統中保持一致?
  • 誰在監管外部訂用帳戶數據使用量與授權?
  • 誰在監管特殊許可權使用者,例如資料庫管理員和數據科學家?
  • 是 C 級主管嗎? 是部門負責人嗎?
  • 是否為治理、風險和合規性主管?
  • 法律部門呢?
  • IT 是否為責任?

需要角色和責任,以避免混淆,並設定數據文化特性可具體化的基礎。

資料治理流程

需要流程,配合角色和責任,以便:

  • 控管常見商務詞彙的定義和維護。
  • 探索並識別您擁有的數據、其意義,以及其儲存位置。
  • 將數據分類,以瞭解如何控管數據。
  • 控管數據存取安全策略的定義和維護。
  • 控管數據隱私策略的定義和維護。
  • 偵測數據質量問題並加以補救。
  • 施行政策以確保採取合規行動。
  • 控管主要數據的維護。

數據控管原則和規則

定義要控管的原則和規則:

  • 數據完整性規則
  • 數據擷取原則和規則
  • 數據存取安全策略和規則
  • 數據隱私策略和規則
  • 數據質量原則和規則
  • 數據維護原則和規則
  • 數據保留原則和規則

將這些原則和規則與數據控管分類配置中的每個類別產生關聯。

主要資料管理

控管數據的另一個需求是主要數據管理。 主要數據是任何組織中最廣泛的共享數據,且包含核心數據實體。 核心數據實體包括客戶、供應商、材料、員工和資產。 它也包含在不同財務應用程式中找到的帳戶數據財務圖表。 因為主要數據非常廣泛地共用,所以與應用程式無關。 作業事務處理應用程式和分析系統都需要它。 讓此資料保持同步,可以解決許多數據錯誤並處理錯誤。 因此,透過統一流程來集中管理,並同步所有需要的系統,是最理想的情況。 此外,需要治理哪些人才能維護它,以及該維護需要發生的位置。

這同樣適用於參考數據,例如程式代碼集和金融市場數據。 在此情況下,程式代碼集的標準化和同步處理稱為參考數據管理,這也是需求。

元數據譜系

最後,需要元數據譜系。 您可以使用稽核追蹤來了解資料的來源,以及其在傳送至報表或資料存放區時如何轉換。 您可以使用元數據來追蹤維護數據的人員或內容,包括何時和何處發生數據。

端對端數據控管所需的摘要

您需要端對端解決方案,其可在邊緣、多個雲端和數據中心的數據存放區中,在整個生命週期中控管數據。

數據控管架構的圖表。

您的資料控制管解決方案應該有數個元件:

  • 數據控管願景和策略
  • 數據本身,例如客戶數據、供應商數據、訂單數據和其他數據
  • 數據生命週期,從建立到銷毀,數據需要在此過程中進行控管。
  • 資料控管角色和責任(人員)
  • 數據控管流程和活動,以及它們如何套用至數據生命週期
  • 管理生命週期中不同點之數據的原則和規則
  • 協助實現數據治理的技術

下一步