Freigeben über


Daten entdecken

Azure Databricks bietet eine Reihe von Tools und Produkten, die die Ermittlung von Datenressourcen vereinfachen, die über Databricks Data Intelligence Platform zugänglich sind. Dieser Artikel bietet eine fundierte Übersicht darüber, wie Sie Daten ermitteln und in der Vorschau anzeigen können, die bereits für den Zugriff in Ihrem Arbeitsbereich konfiguriert wurden.

Die Themen in diesem Abschnitt konzentrieren sich auf das Untersuchen von Datenobjekten und Datendateien. Wenn Sie Informationen zum Arbeiten mit Ressourcen wie Notebooks, SQL-Abfragen, Bibliotheken und Modellen wünschen, lesen Sie Navigieren im Arbeitsbereich.

Wenn Sie Anleitungen zum Generieren von Zusammenfassungsstatistiken für Datasets oder andere Aufgaben im Zusammenhang mit explorativer Datenanalyse (EDA) suchen, lesen Sie Explorative Datenanalyse in Azure Databricks: Tools und Techniken.

Wie können Sie Datenressourcen ermitteln?

Die Datenermittlungstools in Azure Databricks sind in die folgenden allgemeinen Kategorien unterteilt:

  • KI-gestützte Erkenntnisse, Zusammenfassung und Suche
  • Schlüsselwortsuche
  • Katalogerkundung mithilfe der Benutzeroberfläche
  • Programmgesteuerte Auflistung und Metadatenerkundung

Datenermittlungstools sind für Daten optimiert, die durch Unity Catalog gesteuert werden. Datenressourcen, die nicht als Unity Catalog-Objekte registriert wurden, können mit einigen dieser Ansätze möglicherweise nicht gefunden werden.

Suchen von Daten mithilfe der Benutzeroberfläche

Der Katalog-Explorer bietet Tools zum Untersuchen und Verwalten von Datenressourcen. Sie greifen mithilfe von Katalogsymbol Katalog auf der Seitenleiste des Arbeitsbereichs auf den Katalog-Explorer zu. Weitere Informationen finden Sie unter Was ist der Katalog-Explorer?.

Notebooks und der SQL-Abfrage-Editor bieten ebenfalls einen Katalognavigator zum Untersuchen von Datenbankobjekten. Klicken Sie auf das Symbol Katalog in diesen Schnittstellen, um den Katalognavigator zu erweitern oder zu reduzieren, ohne den Code-Editor verlassen zu müssen.

Wenn Sie ein interessantes Dataset entdeckt haben, können Sie die Registerkarte Erkenntnisse verwenden, um zu erfahren, wie die Daten in Ihrem Arbeitsbereich verwendet werden. Siehe Anzeigen häufiger Abfragen und Benutzer einer Tabelle.

Programmgesteuertes Untersuchen von Daten

Sie können den Befehl SHOW für alle Datenbankobjekte verwenden, um Ressourcen zu ermitteln, die in Unity Catalog registriert sind. Verwenden Sie den Befehl LIST, den Magic-Befehl %fs oder Databricks-Hilfsprogramme, um Dateien aufzulisten.

Weitere Informationen finden Sie unter Speicher durchsuchen und Datendateien finden und Untersuchen von Datenbankobjekten.

Überprüfen von Datenkommentaren

Sie können Kommentare überprüfen, um mehr über die Inhalte von Datasets zu erfahren, die in Ihrem Lakehouse verfügbar sind. Kommentare können für Datenobjekte festgelegt werden, einschließlich Katalogen, Schemas, Tabellen und Spalten. Sie können Kommentare im Katalog-Explorer anzeigen oder den Befehl DESCRIBE für ein Objekt verwenden.

Der Katalog-Explorer kann KI-generierte Kommentare für Tabellen bereitstellen. So können Besitzer*innen von Datenressourcen eine umfassende Übersicht über Datasets bereitstellen. Siehe Hinzufügen von KI-generierten Kommentaren zu Unity Catalog-Objekten.

Benutzer*innen können optional auch Kommentare zu Tabellen und anderen Datenbankobjekten mithilfe von Markdown bereitstellen. Dies wird dann im Katalog-Explorer gerendert. Weitere Informationen finden Sie unter Hinzufügen von Kommentaren zu Daten und KI-Ressourcen.

Suchen nach Tabellen in Ihrem Lakehouse

Sie können die Suchleiste in Azure Databricks verwenden, um in Unity Catalog registrierte Tabellen zu finden. Sie können entweder eine Schlüsselwortsuche ausführen oder die semantische Suche verwenden, um Datasets oder Spalten im Zusammenhang mit Ihrer Suchabfrage zu finden. Die Suche gibt nur Ergebnisse für Tabellen zurück, zu deren Anzeige Sie berechtigt sind. Bei der Suche werden Tabellennamen, Spaltennamen, Tabellenkommentare und Spaltenkommentare überprüft. Weitere Informationen finden Sie unter Suchen nach Arbeitsbereichsobjekten.