Eine Verbindung mit externen Systemen herstellen
Azure Databricks bietet integrierte Integrationen in viele cloudnative Datensysteme sowie erweiterbare JDBC-Unterstützung zur Verbindungsherstellung mit anderen Datensystemen.
Die in diesem Abschnitt dokumentierten Connectors konzentrieren sich hauptsächlich auf die Konfiguration einer Verbindung mit einer einzelnen Tabelle im externen Datensystem. Sie können einige dieser Treiber verwenden, um Daten auch in externe Systeme zurückzuschreiben.
Für schreibgeschützte Datenverbindungen empfiehlt Databricks die Verwendung von Lakehouse Federation. Dadurch wird die Synchronisierung ganzer Datenbanken mit Azure Databricks von externen Systemen ermöglicht, und die Steuerung erfolgt über Unity Catalog. Weitere Informationen finden Sie unter Was ist Lakehouse Federation?.
Partner Connect bietet außerdem Integrationen in viele beliebte Unternehmensdatensysteme. Viele Partner Connect-Lösungen stellen nicht nur eine Verbindung mit Datenquellen her, sondern erleichtern auch eine einfache ETL-Vorgänge, um Daten in Ihrem Lakehouse auf dem neuesten Stand zu halten. Siehe Was ist Databricks Partner Connect?.
Welche Datenquellen stellen mit JDBC eine Verbindung zu Azure Databricks her?
Mithilfe von JDBC können Sie eine Verbindung zu vielen Datenquellen herstellen. Databricks Runtime enthält Treiber für eine Reihe von JDBC-Datenbanken, aber möglicherweise müssen Sie einen Treiber oder eine andere Treiberversion installieren, um eine Verbindung zu Ihrer bevorzugten Datenbank herzustellen. Die unterstützten Datenbanken beinhalten Folgendes:
- Abfragen von PostgreSQL mit Azure Databricks
- Abfragen von MySQL mit Azure Databricks
- Abfragen von MariaDB mit Azure Databricks
- Abfragen von SQL Server mit Azure Databricks
- Verwenden des Databricks-Connectors zum Herstellen einer Verbindung mit einem anderen Databricks-Arbeitsbereich
In welche Datendienste wird Azure Databricks integriert?
Die folgenden Datendienste erfordern, dass Sie Verbindungseinstellungen, Sicherheitsanmeldeinformationen und Netzwerkeinstellungen konfigurieren. Möglicherweise benötigen Sie Administrator- oder Poweruser-Berechtigungen in Ihrem Azure-Konto oder Azure Databricks-Arbeitsbereich. Für einige muss außerdem eine Azure Databricks-Bibliothek erstellt und in einem Cluster installiert werden: