Août 2020
Ces fonctionnalités et améliorations de la plateforme Azure Databricks ont été publiées en août 2020.
Notes
Les publications se font par étapes. Votre compte Azure Databricks peut ne pas être mis à jour jusqu’à une semaine après la date de publication initiale.
Important
La version 3.26 a été publiée pour les clients dans les régions du centre du Canada et de l’Inde centrale uniquement. Toutes les autres régions obtiendront les fonctionnalités 3.26 quand la version 3.27 sera publiée.
L’API de gestion des jetons est en disponibilité générale, et les administrateurs peuvent utiliser la console d’administration pour accorder et révoquer l’accès des utilisateurs aux jetons
26 août au 1er septembre 2020 : version 3.27
La gestion des jetons est désormais en disponibilité générale. Les administrateurs Azure Databricks peuvent utiliser l’API de gestion des jetons et la console d’administration pour gérer les jetons d’accès personnels Azure Databricks des utilisateurs. En tant qu’administrateur, vous pouvez :
- Superviser et révoquer les jetons d’accès personnels des utilisateurs.
- Contrôler la durée de vie des futurs jetons dans votre espace de travail.
- Contrôler quels utilisateurs peuvent créer et utiliser des jetons via l’API des autorisations ou dans la console d’administration.
Lors de la transition de la préversion publique à la disponibilité générale, le paramètre created_by
de l’API de gestion des jetons a été remplacé par created_by_id
et un nouveau paramètre created_by_username
a été ajouté.
Pour plus d’informations, consultez Surveiller et révoquer des jetons d’accès personnels.
Augmentation des limites de taille de message pour les applications Shiny
26 août au 1er septembre 2020 : version 3.27
La taille maximale des applications Shiny est passée de 10 à 20 Mo. Si la taille totale de votre application dépasse cette limite, passez en revue les recommandations dans Questions fréquentes (FAQ) sur Shiny.
Amélioration des instructions de configuration d’un cluster en mode local
26 août au 1er septembre 2020 : version 3.27
Dans l’interface utilisateur du cluster :
- Si vous créez un cluster avec 0 worker, une info-bulle s’affiche pour vous recommander d’utiliser le mode local et d’afficher le paramètre de configuration associé (
spark.master local[*]
). - Vous ne pouvez plus définir
spark.master local[*]
pour un cluster, sauf si le cluster a 0 worker.
Voir la version de notebook associée à une exécution
26 août au 1er septembre 2020 : version 3.27
À partir de la barre latérale Expériences, vous pouvez maintenant afficher la version d’un notebook associé à une exécution. Pour plus d’informations, consultez Afficher l’expérience du notebook.
Databricks Runtime 7.2 GA
20 août 2020
Databricks Runtime 7.2 apporte de nombreuses fonctionnalités et améliorations supplémentaires par rapport à Databricks Runtime 7.1, notamment :
- Le chargeur automatique est en disponibilité générale : il s’agit d’une méthode efficace pour l’ingestion incrémentielle d’un grand nombre de fichiers dans Delta Lake. Il est désormais en disponibilité générale et ajoute les fonctionnalités suivantes :
- Option du mode Liste de répertoires : le chargeur automatique ajoute un nouveau mode Liste de répertoires, en plus du mode Notification de fichiers existant, pour déterminer le moment où de nouveaux fichiers sont présents.
- API de gestion des ressources cloud : vous pouvez maintenant utiliser notre API Scala pour gérer les ressources cloud créées par le chargeur automatique. Vous pouvez répertorier les services de notification et supprimer des services de notification spécifiques à l’aide de cette API.
- Option de limitation de débit : vous pouvez maintenant utiliser l’option
cloudFiles.maxBytesPerTrigger
pour limiter la quantité de données traitées dans chaque microlot. - Validation des options : le chargeur automatique valide désormais les options que vous fournissez.
validation
échoue. Pour ignorer la validation des options, affectez àcloudFiles.validateOptions
la valeurfalse
.
- Copiez efficacement une table Delta par clonage.
- Améliorations :
- Le connecteur Snowflake a été mis à niveau vers la version 2.8.1, qui inclut la prise en charge de Spark 3.0.
- Améliorations du passage des informations d’identification
- Améliorations apportées à TensorBoard
- Bibliothèques Python et R mises à niveau
Pour plus d’informations, consultez les notes de publication complètes Databricks Runtime 7.2 (fin de support).
Databricks Runtime 7.2 ML GA
20 août 2020
Databricks Runtime 7.2 pour Machine Learning repose sur Databricks Runtime 7.2 et apporte des bibliothèques système et Python nouvelles et améliorées. Pour plus d’informations, consultez les notes de publication complètes Databricks Runtime 7.2 (fin de support).
Databricks Runtime 7.2 Genomics GA
20 août 2020
Databricks Runtime 7.2 pour Genomics est basé sur Databricks Runtime 7.2 et accélère considérablement la conversion des ndarrays de type float 1D et 2D numpy littéraux en tableaux Java. La documentation sur les études d’association pangénomique Glow reflète l’utilisation.
API Permissions (préversion publique)
18 août 2020
Databricks est heureux d’annoncer la préversion publique de l’API des autorisations, qui vous permet de gérer les autorisations pour :
- Jetons
- Clusters
- Pools
- travaux
- Notebooks
- Dossiers (répertoires)
- Modèles inscrits MLflow
Pour plus d’informations, consultez l’API Autorisations.
Databricks Connect 7.1 (GA)
12 août 2020
Databricks Connect prend désormais en charge Databricks Runtime 7.1.
Dans Databricks Runtime 7.1, Databricks vous recommande de toujours utiliser la version la plus récente de Databricks Connect.
Ordre d’installation reproductible pour les bibliothèques de clusters
12 au 25 août 2020 : version 3.26
Sur un cluster exécutant Databricks Runtime 7.2 ou version ultérieure, Azure Databricks traite désormais toutes les bibliothèques de clusters dans l’ordre dans lequel elles ont été installées.
Créer un modèle à partir de la page des modèles inscrits MLflow (préversion publique)
12 au 25 août 2020 : version 3.26
Vous pouvez maintenant créer un modèle à partir de la page des modèles inscrits MLflow. Pour plus d’informations, consultez Créer un modèle inscrit et lui assigner un modèle journalisé.
Databricks Container Services prend en charge les images GPU
12 au 25 août 2020 : version 3.26
Vous pouvez maintenant utiliser des services de conteneur Databricks sur des clusters avec des GPU pour créer des environnements de deep learning portables avec des bibliothèques personnalisées.
Pour obtenir plus d’informations, consultez Services conteneur Databricks sur un calcul GPU.