Mai 2021
Diese Features und Azure Databricks-Plattformverbesserungen wurden im Mai 2021 veröffentlicht.
Hinweis
Releases werden gestaffelt. Ihr Azure Databricks-Konto wird möglicherweise erst eine Woche nach dem Datum der ersten Veröffentlichung oder später aktualisiert.
Databricks Mosaic KI: eine datenbasierte und gemeinschaftliche Lösung für den gesamten ML-Lebenszyklus
27. Mai 2021
Die neue Persona für maschinelles Lernen, die Sie in der Seitenleiste der Azure Databricks-Benutzeroberfläche auswählen können, bietet Ihnen einfachen Zugriff auf eine neue, speziell für ML erstellte Umgebung, einschließlich der Modellregistrierung und vier neuer Features in der Public Preview:
- Eine neue Dashboardseite mit praktischen Ressourcen, Hinweisen und Links zu den ersten Schritten.
- Eine neue Experimente-Seite, die die Ermittlung und Verwaltung von Experimenten zentralisiert.
- AutoML, eine Möglichkeit, ML-Modelle automatisch aus Daten zu generieren und den Weg zur Produktion zu beschleunigen.
- Featurespeicher, eine Möglichkeit, ML-Features zu katalogisieren und sie für das Training und die Bereitstellung verfügbar zu machen, um die Wiederverwendbarkeit zu verbessern. Mit einer Featuresuche, die auf der Datenherkunft basiert und bei der automatisch protokollierte Datenquellen genutzt werden, können Sie Features für das Training und die Bereitstellung über eine vereinfachte Modellimplementierung verfügbar machen. Hierbei müssen keine Änderungen an der Clientanwendung vorgenommen werden.
Details finden Sie unter KI und Machine Learning in Databricks.
SQL-Analytics wurde in Databricks SQL umbenannt
27. Mai 2021
SQL Analytics wurde in Databricks SQL umbenannt. Weitere Informationen finden Sie im Versionshinweis zu Databricks SQL.
Erstellen und Verwalten von ETL-Pipelines mithilfe von Delta Live-Tabellen (Öffentliche Vorschau)
26. Mai 2021
Databricks ist erfreut, Delta Live Tables vorstellen zu können, einen Clouddienst, der die Entwicklung von Extraktions-, Transformations- und Ladeprozessen (ETL) einfach, zuverlässig und skalierbar gestaltet. Delta Live Tables:
- Bietet eine intuitive und vertraute deklarative Schnittstelle zum Erstellen von Pipelines.
- Ermöglicht Ihnen die Überwachung von Datenverarbeitungspipelines, die Visualisierung von Abhängigkeiten und die Verwaltung von Pipelines und Abhängigkeiten in verschiedenen Umgebungen.
- Ermöglicht eine testgesteuerte Entwicklung, die Durchsetzung von Datenqualitätsbeschränkungen und die Anwendung einheitlicher Richtlinien für die Behandlung von Datenfehlern.
- Automatisiert die Bereitstellung Ihrer Datenverarbeitungspipelines, sodass Sie problemlos Upgrades, Rollbacks und inkrementelle Neuverarbeitungen von Daten durchführen können.
Weitere Informationen finden Sie unter Was sind Delta Live-Tabellen?.
Azure Spot VMs sind allgemein verfügbar
24. Mai 2021
Die Möglichkeit, Azure Databricks-Cluster mit Azure Spot Virtual Machines zu erstellen, ist jetzt allgemein verfügbar. Sie können jetzt den Vorteil deutlich kostengünstigerer Azure Spot-Instanzen nutzen und Ihre Gesamtbetriebskosten (Total Cost of Ownership, TCO) für Azure Databricks reduzieren. Sie können Azure Spot-Instanzen verwenden, wenn Sie:
- die Benutzeroberfläche verwenden, um einen Cluster zu erstellen und das Kontrollkästchen Spot-Instanzen aktivieren.
- die API verwenden, um einen Cluster zu erstellen und dabei das
azure_attributes
-Feld in denClusterattributen der Anforderung angeben. - die Benutzeroberfläche verwenden, um einen Instanzpool zu erstellen, wenn Sie die Option für Alle Spot-Instanzen auswählen.
- die API verwenden, um einen Instanzpool zu erstellen und das
azure_attributes
-Feld in der Anforderung zum Erstellen eines Instanzpools angeben.
Verschlüsseln der Abfragen und des Abfrageverlaufs von Databricks SQL mithilfe eines eigenen Schlüssels (Öffentliche Vorschau)
20. Mai 2021
Weitere Informationen finden Sie im Versionshinweis zu Databricks SQL.
Der Grenzwert für die Anzahl beendeter Universalcluster wurde erhöht.
18. Mai 2021: Version 3.46
Sie können jetzt bis zu 150 beendete Allzweckcluster in einem Azure Databricks-Arbeitsbereich haben. Zuvor lag das Maximum bei 120. Einzelheiten finden Sie unter Beenden von Compute. Die maximale Anzahl der beendeten allgemeinen Cluster, die von der Anforderung der Clusters-API zurückgegeben werden, beträgt jetzt ebenfalls 150.
Der Grenzwert für die Anzahl angehefteter Cluster wurde erhöht
18. Mai 2021: Version 3.46
Sie können jetzt bis zu 70 angeheftete Cluster in einem Azure Databricks-Arbeitsbereich verwenden. Zuvor lag das Maximum bei 50. Weitere Informationen finden Sie unter Anheften von Compute.
Verwalten des Speicherorts von Notebookergebnissen (Public Preview)
18. Mai 2021: Version 3.46
Sie können jetzt wählen, ob Sie alle Notebookergebnisse in Ihrer Azure Storage-Stamminstanz speichern möchten, unabhängig von der Größe oder Art der Ausführung. Standardmäßig werden einige Ergebnisse für interaktive Notebooks in Azure Databricks gespeichert. Mit einer neuen Konfiguration können Sie diese in der Azure Storage-Stamminstanz in Ihrem eigenen Konto speichern. Weitere Details finden Sie unter Konfigurieren des Speicherorts für Notebookergebnisse.
Dieses Feature hat keine Auswirkungen auf Notebooks, die als Aufträge ausgeführt werden, deren Ergebnisse immer in der Azure Storage-Stamminstanz gespeichert werden.
Verschlüsseln von Notebook- und Geheimnisdaten auf der Steuerungsebene mit Ihrem eigenen Schlüssel (Public Preview)
10. Mai 2021
Ein Azure Databricks-Arbeitsbereich umfasst eine Steuerungsebene, die in einem von Azure Databricks verwalteten Abonnement gehostet wird, sowie eine Computeebene, die in einem Azure-Abonnement bereitgestellt wird. Auf der Steuerungsebene werden die Daten Ihrer verwalteten Dienste gespeichert, darunter Notebookbefehle, Geheimnisse und andere Konfigurationsdaten für den Arbeitsbereich. Standardmäßig werden diese Daten mit einem von Azure Databricks verwalteten Schlüssel verschlüsselt, aber Sie können jetzt einen Schlüssel aus Ihrer Azure Key Vault-Instanz hinzufügen, um diese Daten zu verschlüsseln. Weitere Informationen finden Sie unter Aktivieren kundenseitig verwalteter Schlüssel für verwaltete Dienste.
Der Support für die Databricks Runtime 7.4-Serie läuft aus.
3. Mai 2021
Der Support für Databricks Runtime 7.4, Databricks Runtime 7.4 für Machine Learning und Databricks Runtime 7.4 für Genomics wurde am 3. Mai eingestellt. Weitere Informationen finden Sie unter Databricks-Supportlebenszyklus.
Repos-Benutzer können jetzt mit persönlichen Zugriffstoken in Azure DevOps integriert werden.
3. bis 10. Mai 2021: Version 3.45
Zusätzlich zu den Microsoft Entra ID-Zugriffstoken können Sie jetzt auch ein persönliches Zugriffstoken verwenden, um sich bei Azure DevOps zu authentifizieren. Ausführliche Informationen finden Sie unter Einrichten von Databricks Git-Ordnern.