Janvier 2020
Ces fonctionnalités et améliorations de la plateforme Azure Databricks ont été publiées en janvier 2020.
Notes
Les publications se font par étapes. Votre compte Azure Databricks peut ne pas être mis à jour jusqu’à une semaine après la date de publication initiale.
Ce mois-ci, nous avons vu la publication de la plateforme Azure Databricks version 3.9 et 3.11. Il n’existe aucune publication des versions 3.10 ou 3.8. La version 3.7 était une version de stabilité et de correction des bogues uniquement.
Bientôt disponible : les étiquettes d’espace de travail, de pool et de cluster s’étendent aux détails de l’utilisation de DBU et aux machines virtuelles Azure pour améliorer les rapports de gestion des coûts
Le 10 février, nous mettrons à jour les détails d’utilisation de la propagation des balises pour Azure Databricks et les machines virtuelles Azure. La nouvelle fonction de propagation des balises combine les balises d'espace de travail (c'est-à-dire les balises de groupe de ressources), les balises de pool et les balises de cluster d'Azure Databricks et les propage dans les détails d'utilisation de la DBU de Databricks et les machines virtuelles Azure en tant que balises de ressources. Vous pourrez voir les informations de balises combinées dans le portail Azure Cost Management et dans les exportations de détails d'utilisation, ce qui vous donnera une meilleure visibilité de l'utilisation d'Azure Databricks (coût total de possession) et une attribution précise aux unités commerciales et aux équipes.
Azure Databricks et Azure Lighthouse peuvent maintenant se trouver dans le même abonnement
29 janvier 2020
Tous les espaces de travail Azure Databricks existants ont migré de l’utilisation de verrous managés pour Affectation de refus. Tous les nouveaux espaces de travail créés auront des affectations refus. Cela ne modifie pas le comportement existant et le niveau de sécurité reste le même. S'il vous est possible d'intégrer des abonnements utilisant Azure Databricks, les utilisateurs du locataire gestionnaire ne peuvent pas lancer d'espaces de travail Azure Databricks sur un abonnement délégué pour le moment.
Databricks Runtime 6.3 pour Genomics GA
22 janvier 2020
Databricks Runtime 6.3 pour Genomics est basé sur Databricks Runtime 6.3. La version comprend de nombreuses améliorations et mises à niveau de Databricks Runtime 6.2 pour Genomics.
Les fonctionnalités clés sont les suivantes :
- Prise en charge des tables Delta comme entrée pour le pipeline de génotypage conjoint
- Analyse automatique des annotations lors de la lecture de VCF
- Séparateur de variantes multiallelic amélioré
- Fonctions plus rapides de régression linéaire et logistique
Databricks Runtime 6.3 ML GA
22 janvier 2020
Databricks Runtime 6.3 ML en disponibilité générale apporte de nombreuses mises à niveau de bibliothèque, notamment :
- PyTorch : 1.3.0 à 1.3.1
- torchvision : de 0.4.1 à 0.4.2
- MLflow : 1.4.0 à 1.5.0
- Hyperopt : 0.2.1 à 0.2.2
Pour plus d’informations, consultez les notes de publication complètes Databricks Runtime 6.3 pour ML (fin de support).
Databricks Runtime 6.3 GA
22 janvier 2020
Databricks Runtime 6.3, disponibilité générale, apporte de nouvelles fonctionnalités, des améliorations et de nombreux correctifs de bogues.
Cette version offre une meilleure concurrence. Les fonctionnalités clés sont les suivantes :
- Concurrence améliorée pour toutes les opérations Delta Lake
- Prise en charge améliorée de la compression de fichiers
- Amélioration des performances pour la fusion en insertion seule
Pour plus d’informations, consultez les notes de publication complètes Databricks Runtime 6.3 (fin de support).
Mise en cache de disque activée par défaut
7-14 janvier 2020 : Version 3.9
La mise en cache de disque est maintenant activé par défaut sur les instances de la série Lsv2 pour toutes les versions de Databricks Runtime prises en charge. Voir Sélection des types d'instances pour utiliser la mise en cache disque.
L’étape de mise à l’échelle automatique standard de cluster est maintenant configurable
7-14 janvier 2020 : Version 3.9
Par défaut, la première étape de la mise à l’échelle automatique standard ajoute 8 nœuds. Vous pouvez maintenant définir la valeur de l’étape dans la configuration du cluster Spark. Consultez Informations de référence sur la configuration de calcul.
L’API SCIM prend en charge la pagination pour Get Users et Get Groups (préversion publique)
7-14 janvier 2020 : Version 3.9
L’API SCIM prend en charge la pagination pour Get Users et Get Groups. Lorsque vous spécifiez les paramètres de requête startIndex
et count
, SCIM retourne un sous-ensemble d’utilisateurs/groupes. Le paramètre startIndex
est l’index de base 1 du premier résultat. Le paramètre count
correspond au nombre maximal d’utilisateurs ou de groupes à retourner. Cela garantit l’extensibilité du client SCIM et simplifie les appels SCIM pour les administrateurs de Azure Databricks. Consultez l’API Groupes.
La largeur de couloir de l’Explorateur de fichiers est passée à 240px
7-14 janvier 2020 : Version 3.9
L’augmentation de la largeur réduit la nécessité de passer la souris sur les objets pour voir le nom de fichier complet.
Fin du support de Databricks Runtime 3.5 LTS
2 janvier 2020
La prise en charge de Databricks Runtime 3.5 LTS (Long Term Support) a pris fin le 2 janvier. Consultez Cycles de vie du support de Databricks.