Freigeben über


Datenqualität für Microsoft Fabric-Verknüpfungsdatenbanken

Verknüpfungen sind Objekte in OneLake, die auf andere Speicherorte verweisen. Der Speicherort kann intern oder extern für OneLake sein. Die Position, auf die eine Verknüpfung zeigt, wird als Zielpfad der Verknüpfung bezeichnet. Die Position, an der die Verknüpfung angezeigt wird, wird als Verknüpfungspfad bezeichnet. Verknüpfungen werden als Ordner in OneLake angezeigt, und alle Workloads oder Dienste, die Zugriff auf OneLake haben, können sie verwenden.

Mit Tastenkombinationen in Microsoft OneLake können Sie Ihre Daten domänen-, cloud- und kontoübergreifend vereinheitlichen, indem Sie einen einzelnen virtuellen Data Lake für Ihr gesamtes Unternehmen erstellen. Alle Microsoft Fabric-Umgebungen und Analyse-Engines können über einen einheitlichen Namespace eine direkte Verbindung mit Ihren vorhandenen Datenquellen wie Azure, Amazon Web Services (AWS) und OneLake herstellen. OneLake verwaltet alle Berechtigungen und Anmeldeinformationen, sodass Sie nicht jede Fabric-Workload separat konfigurieren müssen, um eine Verbindung mit jeder Datenquelle herzustellen.

Weitere Informationen zu Microsoft Fabric-Verknüpfungen finden Sie in der Fabric-Dokumentation.

Konfigurieren der Datenqualität für Fabric-Verknüpfungsdatenbanken

Melden Sie sich bei Ihrem Microsoft Fabric-Arbeitsbereich an. Wählen Sie unter Tabellen die Schaltfläche mit den Auslassungspunkten und dann Neue Verknüpfung aus. Hier können Sie Folgendes erstellen:

Screenshot des Fabric-Arbeitsbereichs mit hervorgehobener Schaltfläche

Azure Data Lake Gen2-Verknüpfung

  1. Wählen Sie die Verknüpfung Azure Data Lake Storage Gen2 auf der Verknüpfungsseite Des Fabric-Arbeitsbereichs neu aus.

    Screenshot der Neuen Fabric-Verknüpfungsseite mit hervorgehobener Option

  2. Wählen Sie ADLS Gen2 SAS-Authentifizierung aus.

    Screenshot des neuen Verknüpfungsfensters mit ausgewählter SAS-Tokenauthentifizierung.

  3. Generieren Sie eine SAS und Verbindungszeichenfolge für Ihre ADLS Gen2-Ressource im Azure-Portal.

  4. Kopieren Sie den Endpunkt des Data Lake.

    Screenshot: Kopieren des Data Lake-Endpunkts im Azure-Portal

  5. Fügen Sie Speicherdetails für den Verknüpfungsspeicher hinzu.

    Screenshot: Hinzufügen von Speicherdetails zur Fabric-Verknüpfung im neuen Verknüpfungsfenster

  6. Navigieren Sie zu , und wählen Sie den richtigen Deltaordner aus.

    Screenshot: Auswählen des richtigen Delta-Ordners im neuen Verknüpfungsfenster

  7. Zeigen Sie eine Vorschau der Delta-Verknüpfungstabelle in Ihrem Fabric-Arbeitsbereich an.

    Screenshot: Vorschau der OneLake-Deltatabelle

  8. Starten Sie eine Überprüfung Ihrer Azure Data Lake Gen2-Ressource im Microsoft Purview Data Map mithilfe der Dienstprinzipalauthentifizierung.

    Screenshot der Data Map-Überprüfung für ADLS Gen2.

  9. Sobald die Überprüfung abgeschlossen ist, sollte Ihre Datenressource in Unified Catalog als Lakehouse-Tabelle angezeigt werden.

  10. Ordnen Sie die Ressource einem Datenprodukt für die Zusammenstellung und Datenqualitätsbewertung zu.

    Screenshot: Verknüpfungsdatenasset im Katalog.

  11. Öffnen Sie die Microsoft Purview Data Quality Lösung, und führen Sie wie gewohnt einen Datenqualitätsscan oder ein Profil für Ihre Daten aus.

Amazon S3-Verknüpfung

  1. Wählen Sie im Microsoft Fabric-Arbeitsbereich die Option Neue Verknüpfung aus.

  2. Wählen Sie AWS S3 aus, und fügen Sie die URL, die Zugriffstasten-ID und die Zugriffstastenverknüpfung hinzu.

    Screenshot der neuen Amazon S3-Verknüpfungsseite mit hinzugefügten Details.

  3. Fügen Sie die Verbindungs-URL und die Speicherdetails hinzu.

    Screenshot der neuen Amazon S3-Verknüpfungsseite mit hinzugefügter Verbindungs-URL und Speicherdetails.

  4. Zeigen Sie eine Vorschau der Verknüpfung in Ihrem Fabric-Arbeitsbereich an.

  5. Starten Sie eine Überprüfung Ihrer Amazon S3-Ressource im Microsoft Purview Data Map mithilfe der Dienstprinzipalauthentifizierung.

  6. Sobald die Überprüfung abgeschlossen ist, sollte Ihre Datenressource in Unified Catalog angezeigt werden.

  7. Ordnen Sie die Ressource einem Datenprodukt für die Zusammenstellung und Datenqualitätsbewertung zu.

  8. Öffnen Sie die Microsoft Purview Data Quality Lösung, und führen Sie wie gewohnt einen Datenqualitätsscan oder ein Profil für Ihre Daten aus.

Verknüpfung mit Google Cloud Storage (GCS)

  1. Wählen Sie im Microsoft Fabric-Arbeitsbereich die Option Neue Verknüpfung aus.

  2. Wählen Sie Google Cloud Storage aus, und fügen Sie die URL, die Zugriffstasten-ID und die Zugriffstastenverknüpfung hinzu.

    Screenshot der HMAC-Tastenkombination

  3. Fügen Sie die Verbindungs-URL und die Speicherdetails hinzu.

    Screenshot der GCS-Verbindungs-URL.

  4. Zeigen Sie eine Vorschau der Verknüpfung in Ihrem Fabric-Arbeitsbereich an.

  5. Starten Sie eine Überprüfung Ihrer Amazon S3-Ressource im Microsoft Purview Data Map mithilfe der Dienstprinzipalauthentifizierung.

  6. Sobald die Überprüfung abgeschlossen ist, sollte Ihre Datenressource in Unified Catalog angezeigt werden.

  7. Ordnen Sie die Ressource einem Datenprodukt für die Zusammenstellung und Datenqualitätsbewertung zu.

  8. Öffnen Sie die Microsoft Purview Data Quality Lösung, und führen Sie wie gewohnt einen Datenqualitätsscan oder ein Profil für Ihre Daten aus.

Wichtig

  • Verwenden Sie einen Dienstprinzipal für Datenzuordnungsscans und eine verwaltete Identität für Überprüfungen der Datenqualität.
  • Alle Daten, die über eine Verknüpfung stammen, werden in derselben Region verarbeitet.
  • Es gibt eine Abhängigkeit vom Fabric-Team, um Verknüpfungselemente von nativen Elementen in den Unterartikeln des OneLake SDK für Lakehouse zu unterscheiden. Vorerst werden alle Verknüpfungselemente (Tabellen und Dateien) beim Scannen als native Elemente betrachtet.