Microsoft Purview Information Protection のデータ分類機能について説明する
組織は、データを把握して、資産全体の重要な情報を明らかにし、コンプライアンス要件に合わせてデータが処理されるようにする必要があります。 管理者は、Microsoft Purview ポータルで利用できるデータ分類およびエクスプローラーの機能を使用して組織がデータを認識できるようにすることができます。
機密性の高い情報の種類
機密情報の種類 (SIT) は、パターンベースの分類器です。 これらには、それらを識別するために使用できる一定のパターンがあります。 たとえば、地域や国の ID 番号には、次のような特定のパターンが使用される場合があります。
123-456-789-ABC
Microsoft Purview には、正規表現 (regex) または関数によって定義されたパターンに基づく多くの機密情報の種類が組み込まれています。
たとえば、次のようになります。
- クレジット カード番号
- パスポート番号または識別番号
- 銀行口座番号
- 医療サービス番号
使用できる組み込みの機密情報の種類の一覧については、「機密情報の種類のエンティティ定義」を参照してください。
Microsoft Purview のデータ分類では、組織固有の要件に対応するため、カスタムの機密情報の種類を作成する機能もサポートされています。 たとえば、従業員 ID やプロジェクト番号を表すため、組織で機密情報の種類を作成することが必要になる場合があります。
完全データ一致 (EDM) 分類器もサポートされています。 EDM ベースの分類を使用すると、機密情報のデータベース内の正確な値を参照する、カスタムの機密情報の種類を作成できます。 Microsoft Purview ポータルでは、機密情報の種類は EDM 分類子と呼ばれます。
機密情報の種類は、機密度ラベル、保持ラベル、多くの Microsoft Purview および Microsoft Priva ソリューションで使用できます。
トレーニング可能な分類器
トレーニング可能な分類器では、人工知能と機械学習を使用して、データがインテリジェントに分類されます。 特定の種類の契約、請求書、顧客レコードなど、組織に固有のデータを分類する場合に最も役立ちます。 この分類方法は、項目が何かということに基づいて項目を識別するように分類器をトレーニングするものであり、項目に含まれる要素 (パターン マッチング) によるものではありません。 2 種類の分類器を利用できます。
事前トレーニング済み分類器 - Microsoft によって多くの分類器が作成され、事前にトレーニングされており、トレーニングしないで使い始めることができます。 これらの分類子は、使用準備完了の状態で表示されます。 Microsoft Purview には、再開、ソース コード、ハラスメント、不適切な表現、脅威 (暴力や身体的危害を加えることに関係する) などを検出し分類する 5 つの事前トレーニング済み分類器が付属しています。
カスタム トレーニング可能分類器 - カスタム分類器を作成してトレーニングする機能がサポートされています。 特定の種類の契約、請求書、顧客レコードなど、組織に固有のデータを分類する場合に最も役立ちます。
カスタム トレーニング可能分類器を使用して、ある項目を特定のカテゴリのコンテンツとして正確に識別するには、最初に、そのカテゴリに属するコンテンツの種類の多くのサンプルを提示する必要があります。 この陽性サンプルのフィードはシード処理と呼ばれ、分類器の予測モデルを作成するために使用されます。
モデルがテストされ、分類器によってカテゴリと一致する項目と一致しない項目を正しく区別できるかどうかが判定されます。 各予測の結果は手動で検証され、予測モデルの精度を高めるための入力として提供されます。
モデルの精度スコアが安定したら、分類器を公開できます。 トレーニング可能な分類器により、SharePoint Online、Exchange、OneDrive などの場所で項目を並べ替えて、コンテンツを分類できます。
注意
現時点では、分類器は暗号化されていない項目でのみ機能します。
データを理解して調べる
データの分類には、大量のドキュメントやメールが含まれる場合があります。 管理者が分析情報を得て理解を深められるように、Microsoft Purview ポータルの [情報保護] の下にある [エクスプローラー] ノードには、アクティビティ エクスプローラーやコンテンツ エクスプローラーなどのツールが用意されており、次のような詳細を一目で確認できます。
- 機密情報として分類された項目の数とその分類。
- 秘密度に基づくデータの場所の詳細。
- 組織全体の機密コンテンツに対してユーザーが行っている操作の概要。
管理者は、これらのツールから得られた情報を使用してアクションを導くこともできます。
"コンテンツ エクスプローラー": コンテンツ エクスプローラーには、秘密度ラベルまたは保持ラベルがある項目、または機密情報の種類として分類されている項目の現在のスナップショットが表示されます。 これにより、適切なロールのアクセス許可を持つ管理者は、Exchange、SharePoint、OneDrive などのさまざまな場所に保存されているスキャン済みソース コンテンツにアクセスして確認できるようになり、項目をさらにドリルダウンできます。
スキャンされたファイルの内容を読み取ることができるため、コンテンツ エクスプローラーへのアクセスは厳しく制限されています。 コンテンツ エクスプローラーにアクセスする必要があるユーザーは、コンテンツ エクスプローラーの 1 つ以上のロール グループにアカウントを持っている必要があります。
アクティビティ エクスプローラー: アクティビティ エクスプローラーを使用すると、検出されてラベル付けされたコンテンツ、およびコンテンツの場所を確認できます。 これにより、組織全体でラベル付けされたコンテンツで何が行われているかを監視できるようになります。 管理者は、ラベルの変更やダウングレード (たとえば、ラベルが機密から公開用に変更された場合など)、またはファイルがリムーバブル メディアやネットワーク共有にコピーされた場合など、ドキュメント レベルのアクティビティを把握できます。
管理者は、フィルターを使用して、ファイルの種類、ユーザー、アクティビティなど、特定のラベルの詳細をすべて表示できます。 アクティビティ エクスプローラーを使用すると、ラベル付きコンテンツで何が行われているかを、時間を追って把握できます。 管理者は、アクティビティ エクスプローラーを使用して、既に実施されている制御が有効かどうかを評価します。