August 2020

Artikel
10/10/2024

Diese Features und Azure Databricks-Plattformverbesserungen wurden im August 2020 veröffentlicht.

Hinweis

Releases werden gestaffelt. Ihr Azure Databricks-Konto wird möglicherweise erst eine Woche nach dem Datum der ersten Veröffentlichung aktualisiert.

Wichtig

Version 3.26 wurde nur für Kunden in den Regionen „Kanada, Mitte“ und „Indien, Mitte“ veröffentlicht. Alle anderen Regionen erhalten die Features von Version 3.26, wenn Version 3.27 veröffentlicht wird.

Die Tokenverwaltungs-API ist allgemein verfügbar, und Administratoren können über die Administratorkonsole Benutzerzugriff auf Token gewähren und widerrufen.

26. August bis 1. September 2020: Version 3.27

Die Tokenverwaltung ist jetzt allgemein verfügbar. Azure Databricks-Administrator*innen können die Tokenverwaltungs-API und die Verwaltungskonsole verwenden, um die persönlichen Azure Databricks-Zugriffstoken der Benutzer*innen zu verwalten. Ihre Möglichkeiten als Administrator*in:

Überwachen und Widerrufen der persönlichen Zugriffstoken von Benutzer*innen
Steuern der Lebensdauer zukünftiger Token in Ihrem Arbeitsbereich
Steuern, welche Benutzer*innen Token über die Berechtigungs-API oder die Verwaltungskonsole erstellen und verwenden können

Beim Übergang von der Public Preview zur allgemein verfügbaren Version wurde der Parameter created_by der Tokenverwaltungs-API in created_by_id geändert, und der neue Parameter created_by_username wurde hinzugefügt.

Weitere Informationen finden Sie unter Überwachen und Widerrufen von persönlichen Zugriffstoken.

Grenzwerte für die Nachrichtengröße für Shiny-Apps erhöht

26. August bis 1. September 2020: Version 3.27

Die maximale Größe für Shiny-Apps wurde von 10 MB auf 20 MB erhöht. Wenn die Gesamtgröße Ihrer Anwendung diesen Grenzwert überschreitet, lesen Sie die Empfehlungen in den Shiny-FAQ.

Verbesserte Anweisungen zum Einrichten eines Clusters im lokalen Modus

26. August bis 1. September 2020: Version 3.27

Auf der Clusterbenutzeroberfläche:

Wenn Sie einen Cluster ohne Worker erstellen, wird eine QuickInfo angezeigt, in der die zugeordnete Konfigurationseinstellung (spark.master local[*]) angezeigt und empfohlen wird, den lokalen Modus zu verwenden.
Sie können spark.master local[*] nur noch für Cluster festlegen, die keine Worker besitzen.

Anzeigen der Version eines Notebook, das einer Ausführung zugeordnet ist

26. August bis 1. September 2020: Version 3.27

Auf der Randleiste „Experimente“ können Sie jetzt die Version eines Notebooks einblenden, das einer Ausführung zugeordnet ist. Weitere Informationen finden Sie unter Anzeigen von Notebookexperimenten.

Allgemeine Verfügbarkeit von Databricks Runtime 7.2

20. August 2020

In Databricks Runtime 7.2 gibt es viele Features und Verbesserungen gegenüber Databricks Runtime 7.1, zum Beispiel:

Auto Loader ist allgemein verfügbar: Auto Loader ist eine effiziente Methode, eine große Anzahl an Dateien inkrementell in Delta Lake zu erfassen. Sie ist jetzt allgemein verfügbar und enthält die folgenden zusätzlichen Features:
- Neuer Modus für Verzeichnisauflistung: Auto Loader fügt dem vorhandenen Dateibenachrichtigungsmodus einen neuen Verzeichnisauflistungsmodus hinzu, um zu bestimmen, ob neue Dateien vorhanden sind.
- API für die Cloudressourcenverwaltung: Sie können jetzt unsere Scala-API verwenden, um von Auto Loader erstellte cloudbasierte Ressourcen zu verwalten. Mit dieser API können Sie Benachrichtigungsdienste auflisten und bestimmte Benachrichtigungsdienste entfernen.
- Ratenbegrenzungsoption: Sie können jetzt die cloudFiles.maxBytesPerTrigger-Option verwenden, um die Menge der in jedem Microbatch verarbeiteten Daten einzuschränken.
- Optionsvalidierung: Auto Loader überprüft jetzt die von Ihnen bereit gestellten Optionen.validation erzeugt einen Fehler. Um die Optionsvalidierung zu überspringen, legen Sie cloudFiles.validateOptions auf false fest.
Weitere Informationen finden Sie unter Klonen einer Delta-Tabelle.
Verbesserungen:
- Der Snowflake-Connector wurde auf Version 2.8.1 aktualisiert, die Spark 3.0-Unterstützung umfasst.
- Verbesserungen am Passthrough für Anmeldeinformationen
- TensorBoard-Verbesserungen
- Aktualisierte Python- und R-Bibliotheken

Einzelheiten finden Sie in den vollständigen Versionshinweisen zu Databricks Runtime 7.2 (EoS).

Allgemeine Verfügbarkeit von Databricks Runtime 7.2 ML

20. August 2020

Databricks Runtime 7.2 für Machine Learning basiert auf Databricks Runtime 7.2 und bietet neue und verbesserte Python-Bibliotheken und Systembibliotheken. Einzelheiten finden Sie in den vollständigen Versionshinweisen zu Databricks Runtime 7.2 (EoS).

Allgemeine Verfügbarkeit von Databricks Runtime 7.2 Genomics

20. August 2020

Databricks Runtime 7.2 für Genomics basiert auf Databricks Runtime 7.2 und beschleunigt die Konvertierung literaler eindimensionaler NumPy-Arrays und zweidimensionaler Arrays mit float-Typ in Java-Arrays. Die Verwendung wird in der Dokumentation zur genomweiten Assoziationsstudie von Glow erläutert.

Berechtigungs-API (Public Preview)

18. August 2020

Die Public Preview der Berechtigungs-API für Databricks wurde angekündigt, mit der die Berechtigungen für die folgenden Komponenten verwaltet werden können:

Token
Cluster
Pools
Aufträge
Notebooks
Ordner (Verzeichnisse)
Registrierte MLflow-Modelle

Weitere Informationen finden Sie unter Berechtigungs-API 2.0.

Databricks Connect 7.1 (GA)

12. August 2020

Databricks Connect unterstützt jetzt Databricks Runtime 7.1.

In Databricks Runtime 7.1 wird von Databricks empfohlen, stets die neueste Version von Databricks Connect zu verwenden.

Wiederholbare Installationsreihenfolge für Clusterbibliotheken

12. bis 25. August 2020: Version 3.26

In einem Cluster, in dem Databricks Runtime 7.2 oder höher ausgeführt wird, verarbeitet Azure Databricks jetzt alle Clusterbibliotheken in der Reihenfolge, in der sie installiert wurden.

Erstellen eines Modells über die Seite mit registrierten MLflow-Modellen (Public Preview)

12. bis 25. August 2020: Version 3.26

Sie können jetzt ein neues Modell über die Seite „Registrierte MLflow-Modelle“ erstellen. Weitere Informationen finden Sie unter Erstellen eines neuen registrierten Modells und Zuweisen eines protokollierten Modells.

Unterstützung von GPU-Images durch Databricks-Containerdienste

12. bis 25. August 2020: Version 3.26

Sie können Databricks Container Services jetzt in Clustern mit GPUs verwenden, um portierbare Deep-Learning-Umgebungen mit angepassten Bibliotheken zu erstellen.

Weitere Informationen finden Sie unter Databricks Container Services in GPU-Rechnern.

Freigeben über

August 2020

Die Tokenverwaltungs-API ist allgemein verfügbar, und Administratoren können über die Administratorkonsole Benutzerzugriff auf Token gewähren und widerrufen.

Grenzwerte für die Nachrichtengröße für Shiny-Apps erhöht

Verbesserte Anweisungen zum Einrichten eines Clusters im lokalen Modus

Anzeigen der Version eines Notebook, das einer Ausführung zugeordnet ist

Allgemeine Verfügbarkeit von Databricks Runtime 7.2

Allgemeine Verfügbarkeit von Databricks Runtime 7.2 ML

Allgemeine Verfügbarkeit von Databricks Runtime 7.2 Genomics

Berechtigungs-API (Public Preview)

Databricks Connect 7.1 (GA)

Wiederholbare Installationsreihenfolge für Clusterbibliotheken

Erstellen eines Modells über die Seite mit registrierten MLflow-Modellen (Public Preview)

Unterstützung von GPU-Images durch Databricks-Containerdienste

Feedback

Zusätzliche Ressourcen