Freigeben über


Erstellen eines EDM SIT-Schemas und -Regelpakets (neue Benutzeroberfläche)

Sie können sowohl das EDM-Schema (Exact Data Match) als auch den EDM-Vertraulichen Informationstyp (EDM) in der neuen Benutzeroberfläche erstellen, indem Sie einen einzelnen Workflow im Microsoft Purview Compliance Portal verwenden.

Tipp

Wenn Sie kein E5-Kunde sind, verwenden Sie die 90-tägige Testversion von Microsoft Purview-Lösungen, um zu erfahren, wie zusätzliche Purview-Funktionen Ihre Organisation bei der Verwaltung von Datensicherheits- und Complianceanforderungen unterstützen können. Beginnen Sie jetzt im Microsoft Purview-Testversionshub. Erfahren Sie mehr über Anmelde- und Testbedingungen.

Gilt für

  • Neue Benutzeroberfläche

Wenn Sie eine EDM SIT mithilfe der klassischen Benutzeroberfläche erstellen möchten, lesen Sie Erstellen einer EDM SIT (klassische Benutzeroberfläche). Wenn Sie Hilfe bei der Entscheidung benötigen, welche Benutzeroberfläche Sie verwenden möchten, lesen Sie Auswählen der richtigen EDM SIT-Erstellungsumgebung für Sie.

Bevor Sie beginnen

Führen Sie unbedingt die Schritte in den folgenden Artikeln aus, bevor Sie mit den in diesem Artikel beschriebenen Verfahren beginnen.

  1. Exportieren von Quelldaten für genaue Daten, die auf vertraulichen Informationstypen basieren
  2. Erstellen der EDM SIT-Beispieldatei (neue Benutzeroberfläche)

Wenn Sie nicht mit EDM-basierten SITs oder deren Implementierung vertraut sind, ist es wichtig , sich mit den Konzepten in den folgenden Artikeln vertraut zu machen:

Berechtigungen

Sie müssen über globale Administrator - oder Complianceadministratorberechtigungen verfügen, um einen benutzerdefinierten vertraulichen Informationstyp über das Complianceportal erstellen, testen und bereitstellen zu können. Weitere Informationen zu Rollen und Berechtigungen finden Sie unter Informationen zu Administratorrollen in Office 365.

Wichtige Überlegungen

Im Folgenden finden Sie einige wichtige Überlegungen, die Sie beim Erstellen Ihres EDM-Schemas und EDM-basierten SITs berücksichtigen sollten.

  • Bevor Sie Ihre primären Elemente auswählen, überprüfen Sie die integrierten SITs , um eine Vorstellung davon zu erhalten, welche Ihre Anforderungen am besten erfüllen.

  • Für jede EDM SIT müssen Sie mindestens ein primäres Element und nicht mehr als 10 primäre Elemente auswählen. Wenn Sie über ein bestätigendes Datenfeld mit mehreren Token verfügen, wählen Sie eine der folgenden Optionen aus:

    1. Wählen Sie Abgleich mit mehreren Token aus.
    2. Ordnen Sie die Elemente in Ihren Feldern mit mehreren Token einem SIT zu, der diesen Inhalt erkennen kann. (Je mehr Felder mit eindeutigen Werten Sie zuordnen, desto genauer ist Ihr EDM SIT. Das Zuordnen mehrerer Felder trägt auch dazu bei, die Leistung zu verbessern, die Verarbeitungslast zu reduzieren und Systemtimeouts zu vermeiden.)
  • Wenn Sie die primären Elemente für Ihre SIT auswählen, wählen Sie Felder aus, die sicherstellen, dass jede Zeile in Ihrer Datentabelle eindeutig ist. Verwenden Sie beispielsweise keine Felder wie FirstName oder DateOfBirth. Warum? Da Vornamen und Geburtsdatum wahrscheinlich in Ihrer Tabelle mit vertraulichen Daten dupliziert werden. Verwenden Sie stattdessen Felder mit eindeutigen Werten, z SocialSecurityNumber . B. oder BankAccountNumber.

  • Empfehlung: Erstellen Sie Ihr EDM-Schema aus einer Beispieldatendatei. Stellen Sie bei der Einhaltung dieser Empfehlung sicher, dass Ihre Beispieldatendatei den folgenden Anforderungen entspricht:

    • Daten müssen als Tabelle mit Spalten und Zeilen organisiert werden. Verwenden Sie Ihre Feldnamen für die Spaltenüberschriften. (Die Zeilen in der Tabelle entsprechen Ihren einzelnen Datenelementen.)
    • Feldnamen dürfen nur alphanumerische Zeichen enthalten.
    • Feldnamen müssen mit einem Buchstaben beginnen und aus mindestens drei alphanumerischen Zeichen bestehen.
    • Wenn diese Benennungsanforderungen nicht erfüllt sind, können beim Hochladen der Beispieldatendatei Fehler auftreten.
  • Wenn Sie eine Beispieldatei mit vertraulichen Informationen verwenden, um Ihre EDM SIT zu konfigurieren, schlägt das System die vorhandene SIT für jedes Feld vor, das die hochgeladenen Daten am besten erkennt, sofern ein solches SIT verfügbar ist. Microsoft Purview verwendet standardmäßig einen Einzeltokenabgleich zum Erkennen vertraulicher Inhalte. Wenn also keine vorhandenen SITs die Daten für ein Feld in Ihrem EDM-Schema erkennen können, wird der Abgleichsmodus mit nur einem Token angewendet. Es ist wichtig , dass Sie sicherstellen, dass die für jedes Element vorgeschlagene SIT genau die Zeichenfolge erkennt, die Sie überwachen möchten:

    1. Stellen Sie sicher, dass die vorgeschlagene SIT keine umgebenden Zeichen enthält, die sich von dem Inhalt unterscheiden, den Sie erkennen möchten.
    2. Stellen Sie sicher, dass die vorgeschlagene SIT keinen gültigen Teil der Zeichenfolge ausschließt, der in Ihrer Tabelle mit vertraulichen Informationen gespeichert ist.
    3. Stellen Sie sicher, dass die verwendete SIT genau mit dem Format der Daten übereinstimmt, die Sie erkennen möchten. Suchen Sie z. B. nach etwas wie Nine digits with optional hyphens or spaces und nicht einfach digits, oder suchen Sie A combination of 32 characters consisting of letters and digits nach statt einfach text stringsnach .

      Die Verwendung von SITs, die eng mit dem Format der Daten übereinstimmen, die Sie erkennen möchten, ist eine weitere Möglichkeit, die Genauigkeit Ihrer Ergebnisse zu verbessern und die Zeit zu verkürzen, die bis zum Abschluss des Abgleichs benötigt wird.

Hinweis

Alle Ihre Daten werden gespeichert, während Sie vorwärts (Weiter) und rückwärts (Zurück) durch das Tool navigieren, während Sie Ihre Auswahl treffen. Die Rückwärtsnavigation unterstützt nur das Wechseln von der Seite der obersten Ebene zur Seite der obersten Ebene und von einer Unterseite zu einer Unterseite. Sie können nicht rückwärts von einer Seite der obersten Ebene zur vorherigen Unterseite oder von einer Unterseite zu einer vorherigen Seite der obersten Ebene navigieren.

Erstellen Ihres EDM-Schemas und sit

Das folgende Verfahren enthält schrittweise Anleitungen zum Erstellen Ihres EDM-Schemas und ihrer SITs mithilfe der neuen Benutzeroberfläche. Eine konzeptionelle Übersicht und ein Diagramm des gesamten Prozesses finden Sie unter Übersicht über den EDM-Workflow (Neue Benutzeroberfläche).

Anweisungen

  1. Navigieren Sie im Complianceportal für Ihren Mandanten zuDatenklassifizierungs-EDM-Klassifizierer>.

  2. Stellen Sie sicher, dass die Umschaltfläche Neue EDM-Erfahrung auf Ein festgelegt ist.

  3. Wählen Sie + EDM-Klassifizierer erstellen aus.

  4. Geben Sie dem SIT einen Namen, und fügen Sie eine Beschreibung hinzu. Das System verwendet diesen Namen, angefügt an das Wort Schema, für das zugeordnete Schema, das es generiert.

  5. Wählen Sie Weiter aus.

  6. Wählen Sie die Methode aus, die Sie für Ihr Schema verwenden möchten: Hochladen einer Datei mit Beispieldaten oder Manuelles Definieren der Datenstruktur. (Bewährte Methode ist das Hochladen einer Beispieldatendatei. Der Rest dieses Verfahrens setzt diese Option voraus.)

    In beiden Fällen benötigen Sie die Informationen, die unter Erstellen einer EDM SIT-Beispieldatei (Neue Benutzeroberfläche) für Ihre Beispieldatei erläutert werden.

  7. Wählen Sie Weiter aus.

  8. Wählen Sie Ihre Beispieldatei und dann Datei hochladen aus. Wählen Sie Weiter aus.
    (Wenn während des Uploads Fehler angezeigt werden, beheben Sie diese, und versuchen Sie es dann erneut.)

  9. Gehen Sie auf der Seite Primäre Elemente auswählen wie

    1. Wählen Sie in der Spalte Primäres Element Ihr primäres Element aus. Jedes primäre Element muss einem SIT zugeordnet werden. Die bewährte Methode besteht darin, Felder auszuwählen, die vollständige Übereinstimmung unter der Spalte Übereinstimmungsvalidierung anzeigen.
    2. Legen Sie in der Spalte Übereinstimmungsmodus für jedes Feld fest, welche der folgenden Abgleichsoptionen angewendet werden soll:
      • Option 1: Machen Sie nichts, um die vom System vorgeschlagene SIT zu akzeptieren.
      • Option 2: Erweitern Sie das Dropdownmenü. Wählen Sie unter Typ vertraulicher Informationen (SIT) das Stiftsymbol (Bearbeiten) und dann eine andere vorhandene SIT aus.
      • Option 3: Wählen Sie unter Übereinstimmungsmodusdie Option Einzelnes Token aus.
      • Option 4: Wählen Sie unter Übereinstimmungsmodusdie Option Multitoken aus.
  10. Wählen Sie Weiter aus.

  11. Konfigurieren Sie Einstellungen für Daten in ausgewählten Spalten.

    • Die Umschaltfläche Dieselben Einstellungen für alle Spalten verwenden ist standardmäßig auf Ein festgelegt. Wenn Sie separate Einstellungen für jedes Datenfeld verwenden möchten, legen Sie die Umschaltfläche auf Aus fest.
    • Die Option Daten in Spalten ohne Berücksichtigung der Groß-/Kleinschreibung ist standardmäßig aktiviert. Deaktivieren Sie dieses Kontrollkästchen, um die Erkennung zwischen Groß- und Kleinschreibung zu erzwingen.
    • Wählen Sie bei Bedarf die Option Trennzeichen und Interpunktionszeichen für Daten in allen Spalten ignorieren Aus einer Liste können Sie entweder die zu ignorierenden Trennzeichen und Satzzeichen auswählen oder benutzerdefinierte Trennzeichen und Satzzeichen eingeben, die ignoriert werden sollen.

Wichtig

Wenn Sie die Option Trennzeichen ignorieren für die primäre Elementspalte in Ihrem Schema auswählen, stellen Sie sicher, dass der SIT-Wert, dem Sie sie zuordnen, so konzipiert ist, dass Daten sowohl mit als auch ohne die ausgewählten Trennzeichen übereinstimmen.

  1. Wählen Sie Übermitteln aus.



Sobald Sie fertig sind, generiert EDM automatisch eine Erkennungsregel für jedes der primären Elemente, die Sie identifiziert haben. Außerdem werden eine Regel mit hoher Zuverlässigkeit und eine Regel mit mittlerer Konfidenz erstellt. Regeln mit hoher Zuverlässigkeit haben mehr Übereinstimmungsanforderungen als Regeln mit mittlerer Konfidenz, die wiederum mehr Anforderungen als Regeln mit niedriger Konfidenz aufweisen. (Regeln mit niedriger Zuverlässigkeit müssen manuell erstellt werden.) Sie können diese Regeln auf der Seite Erkennungsregeln für primäre Elemente konfigurieren überprüfen und bearbeiten.

Tipp

Die Elemente, die nicht als primär ausgewählt sind, können weiterhin als bestätigende (unterstützende) Beweise verwendet werden. Je mehr unterstützende Elemente gefunden werden, die sich in einer definierten Nähe zu primären Elementen befinden, desto höher ist die Zuverlässigkeit, dass die Übereinstimmung ein wahr positives ist.

Empfehlungen

  • Warten Sie mindestens eine Stunde nach dem Erstellen oder Bearbeiten eines Schemas, bevor Sie es herunterladen und für den EDM-Datenupload verwenden. Dadurch wird sichergestellt, dass das Schema mit dem System synchronisiert wurde. Wenn ein Schema zu früh heruntergeladen wird, wird möglicherweise eine Fehlermeldung angezeigt, wenn versucht wird, das Schema über die Befehlszeile herunterzuladen.

  • Verwenden Sie den EDM-Upload-Agent nicht zum Herunterladen, manuellen Bearbeiten und erneuten Hochladen eines Schemas. Dies führt zu einem Fehler, da die Verwendung des EDM-Upload-Agents zum Herunterladen eines Schemas Tags zum Schema hinzufügt, die keine Überprüfungen bei der Schemaerstellung bestehen.

  • Um sicherzustellen, dass alle bestätigenden Beweise erkannt werden, führen Sie eine der folgenden Aktionen aus: – Kürzen Sie bestätigende Beweisfelder mit mehreren Token auf die maximale Anzahl von Token, die vom Feature mit mehreren Token unterstützt werden (derzeit fünf Token).
    – Ordnen Sie das Feld mit mehreren Token einem SIT zu, der die Daten mit mehreren Token vollständig erkennen kann. – Nachdem Sie Ihre EDM SIT erstellt oder bearbeitet haben, testen Sie sie mit dem folgenden PowerShell-Cmdlet, und warten Sie dann 24 Stunden, bevor Sie es in einer Richtlinienlösung zur Verhinderung von Datenverlust (DLP) testen.

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Nächster Schritt