Erstellen einer EDM-SIT-Beispieldatei (neue Oberfläche)
Das Erstellen und Bereitstellen eines EDM-basierten vertraulichen Informationstyps (Sensitive Information Type, EDM) ist ein mehrstufiger Prozess. Sie können in Microsoft Purview-Richtlinien zur Verhinderung von Datenverlust, eDiscovery und bestimmten Content Governance-Aufgaben verwendet werden.
Tipp
Wenn Sie kein E5-Kunde sind, verwenden Sie die 90-tägige Testversion von Microsoft Purview-Lösungen, um zu erfahren, wie zusätzliche Purview-Funktionen Ihre Organisation bei der Verwaltung von Datensicherheits- und Complianceanforderungen unterstützen können. Beginnen Sie jetzt im Microsoft Purview-Testversionshub. Erfahren Sie mehr über Anmelde- und Testbedingungen.
Gilt für
- Neue Benutzeroberfläche
Informationen zum Erstellen einer EDM SIT mithilfe der klassischen Benutzeroberfläche finden Sie unter Erstellen einer klassischen EDM SIT-Erfahrung.
Bevor Sie beginnen
- Stellen Sie sicher, dass Sie die Schritte unter Export source data for exact data match based sensitive information type ausgeführt haben.
Formatieren der Beispieldatei
Das System extrahiert die Spaltennamen aus der Beispieldatei, um das Schema zu erstellen, und empfiehlt Basis-SITs zum Zuordnen der Beispielfelddaten. Sie muss identisch mit der Tabellendatei für vertrauliche Quellinformationen formatiert sein und sollte synthetische Werte enthalten, die für Ihre tatsächlichen Daten repräsentativ sind. Die Datei kann im Format.csv (durch Trennzeichen getrennte Werte), TSV (durch Tabstopps getrennte Werte) oder pipetrennte (|) formatieren, sollte aber mit der eigentlichen Quelltabellendatei vertraulicher Informationen identisch sein. Das TSV-Format wird in Fällen empfohlen, in denen Ihre Datenwerte Kommas enthalten, z. B. Straßenadressen.
- Verwenden Sie etwa 10 bis 20 Datenzeilen, um sicherzustellen, dass das System über genügend Beispiele für die Arbeit verfügt.
- Feldwerte, die Kommas enthalten, müssen in Anführungszeichen eingeschlossen werden.
- Die erste Zeile muss die Kopfzeile sein und Spaltennamen enthalten.
- Die Datei muss mindestens eine Datenzeile enthalten.
- Jede Datenzeile muss die richtige Anzahl von Feldern enthalten, die den Headern entspricht.
- Die Beispieldatei kann bis zu 32 Spalten enthalten.
- Die Beispieldatei darf eine Größe von 2,5 MB nicht überschreiten.
- Spaltennamen (Feldnamen) müssen mit einem Buchstaben beginnen, mindestens drei Zeichen lang sein und dürfen nur aus alphanumerischen Zeichen (A-Z, a-z, 0-9) bestehen und dürfen keine Leerzeichen, Unterstriche oder andere Sonderzeichen enthalten.
Wenn Ihre tatsächlichen Daten z. B. tabstopptrenntes Format (.tsv) verwenden und wie folgt aussehen:
Dann muss Ihre Beispieldatei die gleichen Spaltenüberschriften aufweisen, aber wie hier gezeigt synthetische Werte für die Zeilen verwenden.
FirstName | LastName | PatientNumber | CreditCardNumber |
---|---|---|---|
ERIC | Salomo | 987-65-4321 | 9000000000000000 |
Lisa | Taylor | 123-45-6789 | 500000000000000 |
Andre | Lawson | 234-56-7890 | 200000000000000 |
Verwenden der Beispieldateivorlagen
Wenn Sie sich in den Branchen US Healthcare, U.S. Financial Services oder U.S. Insurance befinden, können Sie mit den folgenden Beispieldateivorlagen beginnen, um die Erstellung von Beispieldateien zu beschleunigen. Diese Dateien enthalten die am häufigsten verwendeten Spaltenüberschriften in den jeweiligen Branchen sowie synthetische Werte in den Feldern.
So verwenden Sie diese Vorlagen:
- Laden Sie die Beispieldateivorlage für Ihre Branche herunter.
- Vergleichen Sie die Spaltenüberschriften in der Vorlage mit Ihren tatsächlichen Quelldaten, und wählen Sie die Spaltenüberschriften aus, die Sie als primäre Felder in Ihrer benutzerdefinierten Beispieldatei verwenden möchten.
- Vergleichen Sie die Formatierung Ihrer tatsächlichen Quelldaten mit der Formatierung der synthetischen Werte. Ändern Sie die Formatierung der synthetischen Werte so, dass sie der Formatierung Ihrer Quelldatenwerte entspricht.
- Speichern Sie Ihre angepasste Beispieldatei, um sie beim Erstellen eines EDM SIT-Schemas und -Regelpakets zu verwenden.
Tipp
Wenn Sie in der neuen Benutzeroberfläche arbeiten, haben Sie die Möglichkeit, eine Beispieldatei hochzuladen oder die Werte der Beispieldatei manuell einzugeben. Es wird empfohlen, die Beispieldatei zu erstellen.
Nächster Schritt
- Für eine neue Benutzeroberfläche: Erstellen eines EDM SIT-Schemas und eines Regelpakets