Installieren von Databricks Connect für Scala
Hinweis
Dieser Artikel behandelt Databricks Connect für Databricks Runtime Version 13.3 LTS und höher.
In diesem Artikel wird beschrieben, wie Sie Databricks Connect für Scala installieren. Weitere Informationen finden Sie unter Was ist Databricks Connect?. Die Python-Version dieses Artikels finden Sie unter Installieren von Databricks Connect für Python.
Anforderungen
- Ihr Ziel-Azure Databricks-Arbeitsbereich und -Cluster müssen die Anforderungen für die Computekonfiguration für Databricks Connect erfüllen.
- Das Java Development Kit (JDK) ist auf Ihrem Entwicklungscomputer installiert. Databricks empfiehlt, dass die Version Ihrer JDK-Installation, die Sie verwenden, mit der JDK-Version auf Ihrem Azure Databricks-Cluster übereinstimmt. Informationen zur JDK-Version auf Ihrem Cluster finden Sie im Abschnitt „Systemumgebung“, der Versionshinweise zu Databricks Runtime für Ihr Cluster enthält.
Zulu 8.70.0.23-CA-linux64
entspricht beispielsweise JDK 8. Weitere Informationen finden Sie unter Versionshinweise, Versionen und Kompatibilität von Databricks Runtime. - Scala ist auf Ihrem Entwicklungscomputer installiert. Databricks empfiehlt, dass die Version Ihrer Scala-Installation mit der Scala-Version auf Ihrem Azure Databricks-Cluster übereinstimmt. Informationen zur Scala-Version auf Ihrem Cluster finden Sie im Abschnitt „Systemumgebung“ der Versionshinweise zu Databricks Runtime für Ihr Cluster. Weitere Informationen finden Sie unter Versionshinweise, Versionen und Kompatibilität von Databricks Runtime.
- Es gibt ein Scala-Buildtool auf Ihrem Entwicklungscomputer, z. B.
sbt
.
Hinzufügen eines Verweises auf den Databricks Connect-Client
Um den Databricks Connect-Client einzurichten, fügen Sie zuerst einen Verweis auf den Client hinzu. Fügen Sie in der Builddatei Ihres Scala-Projekts wie build.sbt
z. B. für sbt
Maven pom.xml
oder build.gradle
für Gradle den folgenden Verweis auf den Databricks Connect-Client hinzu. Ersetzen Sie 14.0.0
durch die Version der Databricks Connect-Bibliothek, die der Databricks-Runtime-Version auf Ihrem Cluster entspricht. Die Versionsnummern der Databricks Connect-Bibliothek finden Sie im zentralen Maven-Repository.
Sbt
libraryDependencies += "com.databricks" % "databricks-connect" % "14.0.0"
Maven
<dependency>
<groupId>com.databricks</groupId>
<artifactId>databricks-connect</artifactId>
<version>14.0.0</version>
</dependency>
Gradle
implementation 'com.databricks.databricks-connect:14.0.0'
Verbindungseigenschaften konfigurieren
Konfigurieren Sie als Nächstes Eigenschaften, um eine Verbindung zwischen Databricks Connect und Ihrem Azure Databricks-Remotecluster herzustellen. Diese Eigenschaften umfassen Einstellungen zum Authentifizieren von Databricks Connect bei Ihrem Cluster. Siehe Computekonfiguration für Databricks Connect.
Für Databricks Connect für Databricks Runtime 13.3 LTS und höher umfasst Databricks Connect das Databricks SDK für Java für Scala. Dieses SDK implementiert den Standard für die einheitliche Databricks-Clientauthentifizierung, einen konsolidierten und konsistenten architektonischen und programmgesteuerten Ansatz für die Authentifizierung. Dieser Ansatz gestaltet die Einrichtung und Automatisierung der Authentifizierung mit Azure Databricks zentralisierter und vorhersagbarer. Er ermöglicht Ihnen, die Azure Databricks-Authentifizierung einmal zu konfigurieren und diese Konfiguration dann für mehrere Azure Databricks-Tools und -SDKs ohne weitere Änderungen an der Authentifizierungskonfiguration zu verwenden.
Hinweis
Die OAuth-User-to-Machine-Authentifizierung (U2M) wird unter Databricks SDK für Java 0.18.0 und höher unterstützt. Möglicherweise müssen Sie die installierte Version ihres Codeprojekts des Databricks SDK für Java auf 0.18.0 oder höher aktualisieren, um die OAuth U2M-Authentifizierung zu verwenden. Weitere Informationen unter Erste Schritte mit dem Databricks SDK für Java.
Für die OAuth U2M-Authentifizierung müssen Sie die Databricks CLI verwenden, um sich zu authentifizieren, bevor Sie Ihren Scala-Code ausführen. Weitere Informationen finden Sie im Tutorial.
OAuth Machine-to-Machine-Authentifizierung (M2M) wird unter Databricks SDK für Java 0.17.0 und höher unterstützt. Möglicherweise müssen Sie die installierte Version des Databricks SDK für Java auf 0.17.0 oder höher aktualisieren, um die OAuth U2M-Authentifizierung zu verwenden. Weitere Informationen unter Erste Schritte mit dem Databricks SDK für Java.
Das Databricks SDK für Java hat noch keine Authentifizierung mit von Azure verwalteten Identitäten implementiert.