August 2020
Diese Features und Azure Databricks-Plattformverbesserungen wurden im August 2020 veröffentlicht.
Hinweis
Releases werden gestaffelt. Ihr Azure Databricks-Konto wird möglicherweise erst eine Woche nach dem Datum der ersten Veröffentlichung aktualisiert.
Wichtig
Version 3.26 wurde nur für Kunden in den Regionen „Kanada, Mitte“ und „Indien, Mitte“ veröffentlicht. Alle anderen Regionen erhalten die Features von Version 3.26, wenn Version 3.27 veröffentlicht wird.
Die Tokenverwaltungs-API ist allgemein verfügbar, und Administratoren können über die Administratorkonsole Benutzerzugriff auf Token gewähren und widerrufen.
26. August bis 1. September 2020: Version 3.27
Die Tokenverwaltung ist jetzt allgemein verfügbar. Azure Databricks-Administrator*innen können die Tokenverwaltungs-API und die Verwaltungskonsole verwenden, um die persönlichen Azure Databricks-Zugriffstoken der Benutzer*innen zu verwalten. Ihre Möglichkeiten als Administrator*in:
- Überwachen und Widerrufen der persönlichen Zugriffstoken von Benutzer*innen
- Steuern der Lebensdauer zukünftiger Token in Ihrem Arbeitsbereich
- Steuern, welche Benutzer*innen Token über die Berechtigungs-API oder die Verwaltungskonsole erstellen und verwenden können
Beim Übergang von der Public Preview zur allgemein verfügbaren Version wurde der Parameter created_by
der Tokenverwaltungs-API in created_by_id
geändert, und der neue Parameter created_by_username
wurde hinzugefügt.
Weitere Informationen finden Sie unter Überwachen und Widerrufen von persönlichen Zugriffstoken.
Grenzwerte für die Nachrichtengröße für Shiny-Apps erhöht
26. August bis 1. September 2020: Version 3.27
Die maximale Größe für Shiny-Apps wurde von 10 MB auf 20 MB erhöht. Wenn die Gesamtgröße Ihrer Anwendung diesen Grenzwert überschreitet, lesen Sie die Empfehlungen in den Shiny-FAQ.
Verbesserte Anweisungen zum Einrichten eines Clusters im lokalen Modus
26. August bis 1. September 2020: Version 3.27
Auf der Clusterbenutzeroberfläche:
- Wenn Sie einen Cluster ohne Worker erstellen, wird eine QuickInfo angezeigt, in der die zugeordnete Konfigurationseinstellung (
spark.master local[*]
) angezeigt und empfohlen wird, den lokalen Modus zu verwenden. - Sie können
spark.master local[*]
nur noch für Cluster festlegen, die keine Worker besitzen.
Anzeigen der Version eines Notebook, das einer Ausführung zugeordnet ist
26. August bis 1. September 2020: Version 3.27
Auf der Randleiste „Experimente“ können Sie jetzt die Version eines Notebooks einblenden, das einer Ausführung zugeordnet ist. Weitere Informationen finden Sie unter Anzeigen von Notebookexperimenten.
Allgemeine Verfügbarkeit von Databricks Runtime 7.2
20. August 2020
In Databricks Runtime 7.2 gibt es viele Features und Verbesserungen gegenüber Databricks Runtime 7.1, zum Beispiel:
- Auto Loader ist allgemein verfügbar: Auto Loader ist eine effiziente Methode, eine große Anzahl an Dateien inkrementell in Delta Lake zu erfassen. Sie ist jetzt allgemein verfügbar und enthält die folgenden zusätzlichen Features:
- Neuer Modus für Verzeichnisauflistung: Auto Loader fügt dem vorhandenen Dateibenachrichtigungsmodus einen neuen Verzeichnisauflistungsmodus hinzu, um zu bestimmen, ob neue Dateien vorhanden sind.
- API für die Cloudressourcenverwaltung: Sie können jetzt unsere Scala-API verwenden, um von Auto Loader erstellte cloudbasierte Ressourcen zu verwalten. Mit dieser API können Sie Benachrichtigungsdienste auflisten und bestimmte Benachrichtigungsdienste entfernen.
- Ratenbegrenzungsoption: Sie können jetzt die
cloudFiles.maxBytesPerTrigger
-Option verwenden, um die Menge der in jedem Microbatch verarbeiteten Daten einzuschränken. - Optionsvalidierung: Auto Loader überprüft jetzt die von Ihnen bereit gestellten Optionen.
validation
erzeugt einen Fehler. Um die Optionsvalidierung zu überspringen, legen SiecloudFiles.validateOptions
auffalse
fest.
- Weitere Informationen finden Sie unter Klonen einer Delta-Tabelle.
- Verbesserungen:
- Der Snowflake-Connector wurde auf Version 2.8.1 aktualisiert, die Spark 3.0-Unterstützung umfasst.
- Verbesserungen am Passthrough für Anmeldeinformationen
- TensorBoard-Verbesserungen
- Aktualisierte Python- und R-Bibliotheken
Einzelheiten finden Sie in den vollständigen Versionshinweisen zu Databricks Runtime 7.2 (EoS).
Allgemeine Verfügbarkeit von Databricks Runtime 7.2 ML
20. August 2020
Databricks Runtime 7.2 für Machine Learning basiert auf Databricks Runtime 7.2 und bietet neue und verbesserte Python-Bibliotheken und Systembibliotheken. Einzelheiten finden Sie in den vollständigen Versionshinweisen zu Databricks Runtime 7.2 (EoS).
Allgemeine Verfügbarkeit von Databricks Runtime 7.2 Genomics
20. August 2020
Databricks Runtime 7.2 für Genomics basiert auf Databricks Runtime 7.2 und beschleunigt die Konvertierung literaler eindimensionaler NumPy-Arrays und zweidimensionaler Arrays mit float-Typ in Java-Arrays. Die Verwendung wird in der Dokumentation zur genomweiten Assoziationsstudie von Glow erläutert.
Berechtigungs-API (Public Preview)
18. August 2020
Die Public Preview der Berechtigungs-API für Databricks wurde angekündigt, mit der die Berechtigungen für die folgenden Komponenten verwaltet werden können:
- Token
- Cluster
- Pools
- Aufträge
- Notebooks
- Ordner (Verzeichnisse)
- Registrierte MLflow-Modelle
Weitere Informationen finden Sie unter Berechtigungs-API 2.0.
Databricks Connect 7.1 (GA)
12. August 2020
Databricks Connect unterstützt jetzt Databricks Runtime 7.1.
In Databricks Runtime 7.1 wird von Databricks empfohlen, stets die neueste Version von Databricks Connect zu verwenden.
Wiederholbare Installationsreihenfolge für Clusterbibliotheken
12. bis 25. August 2020: Version 3.26
In einem Cluster, in dem Databricks Runtime 7.2 oder höher ausgeführt wird, verarbeitet Azure Databricks jetzt alle Clusterbibliotheken in der Reihenfolge, in der sie installiert wurden.
Erstellen eines Modells über die Seite mit registrierten MLflow-Modellen (Public Preview)
12. bis 25. August 2020: Version 3.26
Sie können jetzt ein neues Modell über die Seite „Registrierte MLflow-Modelle“ erstellen. Weitere Informationen finden Sie unter Erstellen eines neuen registrierten Modells und Zuweisen eines protokollierten Modells.
Unterstützung von GPU-Images durch Databricks-Containerdienste
12. bis 25. August 2020: Version 3.26
Sie können Databricks Container Services jetzt in Clustern mit GPUs verwenden, um portierbare Deep-Learning-Umgebungen mit angepassten Bibliotheken zu erstellen.
Weitere Informationen finden Sie unter Databricks Container Services in GPU-Rechnern.