September 2019
Diese Features und Azure Databricks-Plattformverbesserungen wurden im September 2019 veröffentlicht.
Hinweis
Releases werden gestaffelt. Ihr Azure Databricks-Konto wird möglicherweise erst eine Woche nach dem Datum der ersten Veröffentlichung aktualisiert.
Der Support für Databricks Runtime 5.2 läuft aus.
30. September 2019
Die Unterstützung für Databricks Runtime 5.2 wurde am 30. September beendet. Weitere Informationen finden Sie unter Databricks-Supportlebenszyklus.
Einführung poolgestützter automatisierter Cluster, die Databricks Light (Public Preview) verwenden
26. September – 1. Oktober 2019: Version 3.3
Als wir im Juli die Poolkonfigurationsreferenz eingeführt haben, konnten Sie bei der Konfiguration eines Pool-gestützten Clusters für einen automatisierten Auftrag nicht Databricks Light als Laufzeitversion auswählen. Jetzt können Sie sowohl schnelle Clusterstartzeiten als auch kostengünstige Cluster haben!
Die IP-Adressen des Microsoft Azure SQL Database-Gateways ändern sich zum 14. Oktober 2019.
Am 14. Oktober migriert Microsoft Datenverkehr zu neuen Gateways in diesen Regionen. Wenn sich Ihr Arbeitsbereich in einer dieser Regionen befindet und Sie benutzerdefinierte Routen (UDR) für den konsolidierten Metastore von Ihrem eigenen virtuellen Azure Databricks-Netzwerk aus konfiguriert haben (unter Verwendung von „VNet-Einschleusung“), müssen Sie möglicherweise die IP-Adresse für den Metastore aktualisieren, wenn sich diese IP-Adressen ändern. Die aktuelle Liste der IP-Adressen für Ihre Region finden Sie in der Tabelle IP-Adressen vom Gateway von Azure SQL-Datenbank.
Der Passthrough für Azure Data Lake Storage-Anmeldeinformationen wird jetzt in Standardclustern und in Scala (Public Preview) unterstützt.
12. bis 17. September 2019: Version 3.2
Passthrough für Anmeldeinformationen kann jetzt mit Python, SQL und Scala auf Standardclustern mit Databricks Runtime 5.5 und höher sowie mit SparkR in Databricks Runtime 6.0 Beta verwendet werden. Bisher erforderte der Passthrough für Anmeldeinformationen Cluster mit hoher Parallelität, die Scala nicht unterstützen.
Wenn ein Cluster für das Passthrough für Anmeldeinformationen in Azure Data Lake Storage aktiviert ist, können in diesem Cluster ausgeführte Befehle Daten in Azure Data Lake Storage lesen und schreiben, ohne dass Benutzer Dienstprinzipal-Anmeldeinformationen für den Zugriff auf den Speicher konfigurieren müssen. Die Anmeldeinformationen werden automatisch vom Benutzer festgelegt, der die Aktion initiiert.
Aus Sicherheitsgründen kann nur ein Benutzer Befehle in einem Standardcluster ausführen, für den Passthrough für Anmeldeinformationen aktiviert ist. Der einzelne Benutzer wird zur Erstellungszeit festgelegt und kann von jedem Benutzer mit Verwaltungsberechtigungen für den Cluster bearbeitet werden. Administratoren müssen sicherstellen, dass der einzelne Benutzer mindestens über die Berechtigung zum Anfügen für den Cluster verfügt.
pandas DataFrames werden jetzt ohne Skalierung in Notebooks gerendert.
12. bis 17. September 2019: Version 3.2
In Azure Databricks-Notebooks hat displayHTML
einige umrandete HTML-Inhalte so skaliert, dass sie der verfügbaren Breite des gerenderten Notebooks entsprechen. Obwohl dieses Verhalten für Bilder durchaus erwünscht ist, wurden breite Pandas-DataFrames dadurch unzureichend gerendert. Aber das ist jetzt vorbei!
Die Auswahl der Python-Version wird jetzt dynamisch angezeigt.
12. bis 17. September 2019: Version 3.2
Wenn Sie eine Databricks-Runtime auswählen, die Python 2 nicht unterstützt (z. B. Databricks 6.0), blendet die Seite für die Clustererstellung die Python-Versionsauswahl aus.
Databricks Runtime 6.0 Beta
12. September 2019
Databricks Runtime 6.0 Beta bietet viele Bibliotheksupgrades und neue Features, einschließlich:
- Neue Scala- und Java-APIs für Delta Lake DML-Befehle sowie die Hilfsprogrammbefehle „vacuum“ und „history“.
- Erweiterter DBFS FUSE v2-Client für schnellere und zuverlässigere Lese- und Schreibvorgänge während des Modelltrainings.
- Unterstützung für mehrere matplotlib-Plots pro Notebookzelle.
- Update auf Python 3.7, sowie Updates für numpy, pandas, matplotlib und andere Bibliotheken.
- Ende des Python 2-Supports.
Weitere Informationen finden Sie in den vollständigen Versionshinweisen zu Databricks Runtime 6.0 (EoS).