Mars 2023
Ces fonctionnalités et améliorations de la plateforme Azure Databricks ont été publiées en mars 2023.
Remarque
Les publications se font par étapes. Il se peut que votre compte Azure Databricks ne soit pas mis à jour avant au moins une semaine suivant la date de publication initiale.
Fournisseur Databricks Terraform mis à jour vers la version 1.14.0
31 mars 2023
La version 1.14.0 ajoute un exemple de rotation automatique d’un jeton d’accès, d’une run_if
condition et d’un déclencheur d’arrivée de fichier à la databricks_job
ressource, etc. Pour obtenir plus d’informations, consultez le journal des modifications de la version 1.14.0.
Fin de la prise en charge de Databricks Runtime 7.3 LTS ML
31 mars 2023
La prise en charge de Databricks Runtime 7.3 LTS pour le Machine Learning a pris fin le 31 mars. Consultez Cycles de vie du support de Databricks.
Entraînement distribué avec TorchDistributor
27 mars 2023
Avec Databricks Runtime 13.0 ML et versions ultérieures, vous pouvez effectuer un entraînement distribué sur des modèles PyTorch ML à l’aide de TorchDistributor. Consultez Entraînement distribué avec TorchDistributor.
TorchDistributor est un module open source dans PySpark qui aide les utilisateurs à effectuer une formation distribuée avec PyTorch sur leurs clusters Spark. Il vous permet donc de lancer des travaux d’entraînement PyTorch en tant que travaux Spark.
Databricks Runtime 13.0 (bêta)
24 mars 2023
Databricks Runtime 13.0 et Databricks Runtime 13.0 ML sont désormais disponibles en versions bêta.
Consultez Databricks Runtime 13.0 (EoS) et Databricks Runtime 13.0 pour Machine Learning (EoS).
Éditeur de fichiers amélioré
24 mars 2023
L’éditeur de fichiers a été mis à jour pour intégrer de nombreuses fonctionnalités de notebook à votre expérience d’édition de fichiers. En outre, vous pouvez désormais exécuter directement des fichiers Python, SQL, R et Scala à partir de l’éditeur de fichiers. Pour plus d’informations, consultez Utiliser le notebook Databricks et l’éditeur de fichiers.
Modifier la redondance du stockage racine DBFS pour les espaces de travail Azure Databricks existants
23 mars 2023
Les utilisateurs ont désormais la possibilité de modifier la redondance de leur compte de stockage racine DBFS. Consultez Modifier les options de redondance du stockage de l’espace de travail.
Prise en charge des notebooks .ipynb (Jupyter) dans Repos (préversion)
22 mars 2023
La prise en charge de notebooks Jupyter (fichiers .ipynb) est disponible dans Repos. Vous pouvez cloner des référentiels avec des notebooks .ipynb, travailler dans l’interface utilisateur Databricks, ensuite valider et envoyer (push) en tant que notebooks .ipynb. Les métadonnées comme le tableau de bord du notebook sont conservées. Les administrateurs peuvent contrôler si les sorties peuvent être validées ou pas.
Vous pouvez également :
- Créez de nouveaux notebooks .ipynb.
- Convertissez les notebooks au format de fichier .ipynb.
- Affichez les différences comme code diff (modifications du code dans les cellules) ou différence brute (modifications du code au format JSON, y compris les métadonnées).
Consultez Autoriser la validation de la sortie .ipynb du notebook.
Prise en charge de reload4j
21 mars 2023
Reload4j 1.2.19 remplace log4j dans Databricks Runtime versions 10.4 et antérieures.
Nouvelles adresses IP pour la région Asie Est
15 mars 2023
Azure Databricks a ajouté un nouveau plan de contrôle dédié pour la région eastasia
. Si vous hébergez un espace de travail Azure Databricks dans votre propre réseau virtuel (également appelé injection de réseau virtuel) dans la région Asie Est, vous gérez probablement le trafic réseau pour votre espace de travail à l’aide d’itinéraires personnalisés (UDR). Dans ce cas, vous devez mettre à jour ces itinéraires à l’aide des adresses IP et domaines supplémentaires répertoriés dans Adresses IP et domaines pour les services et les ressources Azure Databricks.
Exécuter des cellules SQL dans le notebook en parallèle
15 mars 2023
Vous pouvez maintenant exécuter des cellules SQL dans des notebooks Azure Databricks en parallèle tout en étant attaché à un cluster interactif. Consultez Exécuter des cellules SQL en parallèle.
Créer des tâches de travail à l’aide de code Python stocké dans un référentiel Git
14 mars 2023
Vous pouvez désormais récupérer du code Python à partir d’un fournisseur Git lorsque vous ajoutez une tâche Python à un travail Azure Databricks, ce qui simplifie l’intégration de vos travaux à vos workflows CI/CD. Consultez Utiliser Git avec des travaux.
Fournisseur Databricks Terraform mis à jour vers la version 1.13.0
14 mars 2023
La version 1.13.0 ajoute une ressource databricks_sql_alert
, et bien plus encore. Pour obtenir plus d’informations, consultez le journal des modifications de la version 1.13.0.
Fournisseur Databricks Terraform mis à jour vers la version 1.12.0
9 mars 2023
La version 1.12.0 ajoute une databricks_model_serving
ressource, déprécie le schedule
bloc dans la databricks_sql_query
ressource, et bien plus encore. Pour obtenir plus d’informations, consultez le journal des modifications de la version 1.12.0.
Console d’administration SQL et console d’administration de l’espace de travail combinées
9 mars 2023
La console d’administration SQL a été combinée aux paramètres d’administration généraux pour créer une expérience unifiée pour les utilisateurs administrateurs. Tous les paramètres d’administration SQL sont désormais accessibles à partir de la console d’administration.
La mise en service de modèles est en disponibilité générale
7 mars 2023
Model Serving, anciennement Serverless Real-Time Inference, est désormais en disponibilité générale.
Model Serving fournit un service à haute disponibilité et à faible latence pour le déploiement de modèles. Le service effectue automatiquement un scale-up ou un scale-down pour répondre aux modifications de la demande au sein de la plage d’accès concurrentiel choisie. Consultez Service de modèle avec Azure Databricks.
La recherche automatique de fonctionnalités est en disponibilité générale
7 mars 2023
La recherche automatique de fonctionnalités avec le service de modèle est désormais en disponibilité générale. Pour plus d’informations, consultez recherche de fonctionnalités automatiques avec le service de modèles Databricks.
Pour les nouveaux espaces de travail qui utilisent des UDR, l’adresse IP de stockage Azure a besoin d’un UDR supplémentaire
6 mars 2023
En raison des modifications apportées au stockage racine DBFS pour les nouveaux espaces de travail, les nouveaux espaces de travail qui utilisent l’injection de réseau VNet et définissent des itinéraires définis par l’utilisateur (UDR) à l’aide d’adresses IP au lieu des balises de service recommandées doivent ajouter une UDR Azure supplémentaire pour chaque réseau virtuel (VNet). Pour configurer les deux UDR, consultez Adresse IP de stockage racine DBFS. Cette modification n’affecte pas les espaces de travail existants.
Le stockage racine DBFS Azure Databricks utilise Azure Data Lake Storage Gen2 pour les nouveaux espaces de travail
6 mars 2023
Les nouveaux espaces de travail Azure Databricks utilisent des comptes de stockage Azure Data Lake Storage Gen2 pour la racine DBFS. Les espaces de travail Azure Databricks existants continuent d’utiliser le stockage Blob pour la racine DBFS. Consultez Présentation d’Azure Data Lake Storage Gen2.
Disponibilité d’un nouveau Catalog Explorer
6 mars 2023
Une nouvelle version de Catalog Explorer est désormais disponible dans tous les espaces de travail qui utilisent une version prise en charge de Databricks Runtime 7.3 ou version ultérieure.
Afficher les requêtes fréquentes et les utilisateurs d’une table à l’aide de l’onglet Insights
6 mars 2023
Vous pouvez maintenant utiliser l’onglet Insights dans Catalog Explorer pour afficher les requêtes et les utilisateurs les plus fréquents de n’importe quelle table inscrite dans Unity Catalog. Vous devez disposer du SELECT
privilège sur une table pour afficher ces données, et vous ne voyez que les requêtes que vous êtes autorisé à afficher. Consultez Afficher les requêtes et les utilisateurs fréquents d’une table.
La recherche de correspondance exacte est disponible dans la recherche globale
3 mars 2023
Vous pouvez maintenant rechercher des expressions exactes à l’aide de guillemets dans recherche globale. Consultez Recherche des objets de l’espace de travail.
Afficher les informations de traçabilité de vos travaux Azure Databricks
3 mars 2023
Si Unity Catalog est activé dans votre espace de travail, vous pouvez afficher les informations de traçabilité de vos travaux dans l’interface utilisateur des travaux Azure Databricks, y compris amont tables à partir de laquelle le travail lit et les tables en aval dans lesquelles le travail écrit. Consultez Afficher les informations de traçabilité d’un travail.
Databricks Runtime 12.2 LTS et Databricks Runtime 12.2 LTS ML sont en disponibilité générale
2 mars 2023
Databricks Runtime 12.2 LTS et Databricks Runtime 12.2 LTS ML sont désormais en disponibilité générale.
Consultez Databricks Runtime 12.2 LTS et Databricks Runtime 12.2 LTS pour Machine Learning.
Les fichiers d’espace de travail sont désormais en préversion publique
6 mars 2023
Utiliser des fichiers non-notebooks dans un dépôt Azure Databricks. Les fichiers d’espaces de travail sont activés par défaut dans tous les espaces de travail. Consultez l’article Que sont les fichiers d’espace de travail ?.