Nouveautés de SQL Server Machine Learning Services
S’applique à : SQL Server 2016 (13.x) et versions ultérieures
Cet article décrit les nouvelles fonctionnalités de chaque version de SQL Server Machine Learning Services. Des fonctionnalités de machine learning sont ajoutées à SQL Server dans chaque version, car nous continuons à développer, étendre et approfondir l’intégration entre la plateforme de données, l’analytique avancée et la science des données.
Notes
Les fonctionnalités des caractéristiques et les options d’installation varient entre les versions de SQL Server. Utilisez la liste déroulante du sélecteur de version pour choisir la version appropriée de SQL Server.
Nouveautés de SQL Server 2022
À compter de SQL Server 2022 (16.x), les runtimes pour R, Python et Java ne sont plus installés avec le programme d’installation de SQL. Au lieu de cela, installez le ou les runtimes et packages personnalisés souhaités. Pour plus d’informations, consultez Installer SQL Server 2022 Machine Learning Services (Python et R) sur Windows ou Installer SQL Server Machine Learning Services (Python et R) sur Linux.
Nouveautés de SQL Server 2019
Cette version ajoute les fonctionnalités les plus demandées pour les opérations de machine learning Python et R dans SQL Server. Pour plus d’informations sur toutes les fonctionnalités de cette version, consultez Nouveautés de SQL Server 2019 et notes de publication de SQL Server 2019.
Pour obtenir la documentation sur les nouveautés Java et C# dans SQL Server 2019, consultez Nouveautés des extensions de langage SQL Server.
Vous trouverez ci-dessous les nouvelles fonctionnalités de SQL Server Machine Learning Services, disponibles à la fois sur Windows et sur Linux :
- La prise en charge de la plateforme Linux a été ajoutée dans Machine Learning Services pour Python et R. Commencez par Installation de SQL Server Machine Learning Services sur Linux.
- Connexion de bouclage à SQL Server à partir d’un script Python ou R.
- CREATE EXTERNAL LIBRARY (Transact-SQL) pour Python et R.
- sp_execute_external_script introduit deux nouveaux paramètres qui vous permettent de générer facilement plusieurs modèles à partir de données partitionnées. Pour plus d’informations, consultez le tutoriel Créer des modèles basés sur des partitions en R.
- La prise en charge des clusters de basculement est disponible pour le service SQL Server Launchpad, à condition qu’il soit démarré sur tous les nœuds. Pour plus d’informations, consultez Installation d’un cluster de basculement SQL Server.
- Modification des mécanismes d’isolation pour Machine Learning Services. Pour plus d’informations, consultez SQL Server 2019 sur Windows : Modifications de l’isolation dans Machine Learning Services.
Nouveautés de SQL Server 2017
Cette version ajoute la prise en charge de Python et les algorithmes de machine learning de pointe. Renommé pour refléter la nouvelle étendue, SQL Server 2017 marque l’introduction de SQL Server Machine Learning Services (dans la base de données) avec prise en charge linguistique pour Python et R.
Pour voir la totalité des annonces concernant les fonctionnalités, consultez Nouveautés de SQL Server 2017.
Améliorations de R
Le composant R de SQL Server Machine Learning Services est la prochaine génération de SQL Server 2016 R Services, avec des versions mises à jour de base R, RevoScaler et d’autres packages.
Les nouvelles fonctionnalités de R incluent la gestion des packages, avec les points importants suivants :
- Les rôles de base de données aident les DBA à gérer les packages et à affecter des autorisations pour l’installation des packages.
- CREATE EXTERNAL LIBRARY aide les DBA à gérer les packages dans le langage T-SQL familier.
- Les fonctions RevoScaleR permettent d’installer, de supprimer ou de lister les packages détenus par les utilisateurs. Pour plus d’informations, consultez Guide pratique pour utiliser les fonctions RevoScaleR pour rechercher ou installer des packages R sur SQL Server.
Bibliothèques R
Package | Description |
---|---|
MicrosoftML | Dans cette version, MicrosoftML est inclus dans une installation de R par défaut, ce qui élimine l’étape de mise à niveau requise dans la précédente version de SQL Server 2016 R Services. MicrosoftML fournit des algorithmes de machine learning et des transformations de données de pointe qui peuvent être mis à l’échelle ou exécutés dans des contextes de calcul distants. Les algorithmes incluent des réseaux neuronaux profonds personnalisables, des arbres de décision et des forêts d’arbres décisionnels rapides ainsi que les régressions linéaires et logistiques. |
Intégration de Python pour l’analytique dans la base de données
Python est un langage qui offre une grande flexibilité et efficacité pour un large éventail de tâches de machine learning. Les bibliothèques open source pour Python incluent plusieurs plateformes pour les réseaux neuronaux personnalisables ainsi que des bibliothèques populaires pour le traitement en langage naturel.
Étant donné que Python est intégré au moteur de base de données, vous pouvez conserver l’analytique proche des données et éliminer les coûts et les risques de sécurité liés au déplacement des données. Vous pouvez déployer des solutions machine learning basées sur Python à l’aide d’outils tels que Visual Studio. Vos applications de production peuvent se procurer des prédictions, des modèles ou des visuels à partir du runtime Python 3.5 à l’aide des méthodes d’accès aux données SQL Server.
L’intégration de T-SQL et Python est prise en charge via la procédure stockée système sp_execute_external_script. Vous pouvez appeler n’importe quel code Python à l’aide de cette procédure stockée. Le code s’exécute dans une architecture sécurisée et double qui permet le déploiement à l’échelle de l’entreprise de modèles et de scripts Python pouvant être appelés à partir d’une application à l’aide d’une procédure stockée simple. Des gains de performances supplémentaires sont réalisés en diffusant des données de SQL vers des processus Python et une parallélisation de sonnerie MPI.
Vous pouvez utiliser la fonction T-SQL PREDICT pour effectuer un scoring en natif sur un modèle préentraîné qui a déjà été enregistré au format binaire requis.
Bibliothèques Python
Package | Description |
---|---|
revoscalepy | Équivalent Python de RevoScaleR. Vous pouvez créer des modèles Python pour les régressions linéaires et logistiques, les arbres de décision, les arbres amplifiés et les forêts aléatoires, tous parallélisables et capables d’être exécutés dans des contextes de calcul distants. Ce package prend en charge l’utilisation de plusieurs sources de données et de contextes de calcul distants. Le scientifique de données ou le développeur peut exécuter du code Python sur un serveur SQL Server distant pour explorer des données ou créer des modèles sans déplacer les données. |
microsoftml | Équivalent Python du package R MicrosoftML. |
Modèles dont l’apprentissage a déjà été effectué
Des modèles préentraînés sont disponibles pour Python et R. Utilisez ces modèles pour la reconnaissance d’images et l’analyse des sentiments positifs-négatifs afin de générer des prédictions sur vos propres données.
Serveur autonome en tant que fonctionnalité partagée dans le programme d’installation de SQL Server
Cette version ajoute également SQL Server Machine Learning Server (autonome), un serveur de science des données entièrement indépendant, prenant en charge l’analytique statistique et prédictive dans R et Python. Comme avec R Services, ce serveur est la prochaine version de SQL Server 2016 R Server (autonome). Avec le serveur autonome, vous pouvez distribuer et mettre à l’échelle des solutions R ou Python sans dépendances sur SQL Server.
Nouveautés de SQL Server 2016
Cette version a introduit des fonctionnalités de machine learning dans SQL Server par le biais de SQL Server 2016 R Services, un moteur d’analytique dans la base de données pour le traitement de script R sur des données résidentes au sein d’une instance du moteur de base de données.
De plus, SQL Server 2016 R Server (autonome) a été publié comme moyen d’installer R Server sur un serveur Windows. Initialement, le programme d’installation de SQL Server fournissait la seule façon d’installer R Server pour Windows. Dans les versions ultérieures, les développeurs et les scientifiques de données qui souhaitaient R Server sur Windows pouvaient utiliser un autre programme d’installation autonome pour atteindre le même objectif. Le serveur autonome dans SQL Server est fonctionnellement équivalent au produit serveur autonome, Microsoft R Server pour Windows.
Pour voir la totalité des annonces concernant les fonctionnalités, consultez Nouveautés de SQL Server 2016.
Libérer | Mise à jour des fonctionnalités |
---|---|
Ajouts de CU | Le scoring en temps réel repose sur les bibliothèques C++ natives pour lire un modèle stocké dans un format binaire optimisé, puis générer des prédictions sans devoir appeler le runtime R. Cela rend les opérations de scoring beaucoup plus rapides. Avec le scoring en temps réel, vous pouvez exécuter une procédure stockée ou effectuer un scoring en temps réel à partir du code R. Le scoring en temps réel est également disponible pour SQL Server 2016, si l’instance est mise à niveau vers la dernière version de Microsoft R Server. |
Version initiale | Intégration de R pour l’analytique dans la base de données. Packages R pour appeler des fonctions R dans T-SQL, et vice versa. Les fonctions RevoScaleR fournissent l’analytique R à l’échelle en segmentant les données en composants du produit, en coordonnant et en gérant le traitement distribué et en agrégeant les résultats. Dans SQL Server 2016 R Services (dans la base de données), le moteur RevoScaleR est intégré à une instance du moteur de base de données, ce qui permet de rassembler les données et l’analytique dans le même contexte de traitement. Intégration de T-SQL et R via sp_execute_external_script. Vous pouvez appeler n’importe quel code R à l’aide de cette procédure stockée. Cette infrastructure sécurisée permet le déploiement à l’échelle de l’entreprise de modèles et de scripts R pouvant être appelés à partir d’une application à l’aide d’une procédure stockée simple. Des gains de performances supplémentaires sont réalisés en diffusant des données de SQL vers des processus R et une parallélisation de sonnerie MPI. Vous pouvez utiliser la fonction T-SQL PREDICT pour effectuer un scoring en natif sur un modèle préentraîné qui a déjà été enregistré au format binaire requis. |
Prise en charge Linux
SQL Server 2019 ajoute la prise en charge Linux pour R et Python quand vous installez les packages machine learning avec une instance du moteur de base de données. Pour plus d’informations, consultez Installer SQL Server Machine Learning Services sur Linux.
Sur Linux, SQL Server 2017 ne dispose pas de l’intégration de R ni Python, mais vous pouvez utiliser le scoring en natif sur Linux, car cette fonctionnalité est disponible via la fonction T-SQL PREDICT, qui s’exécute sur Linux. Le scoring en natif permet un scoring à hautes performances à partir d’un modèle préentraîné, sans appeler ni même exiger un runtime R.