Partilhar via


O que há de novo nos Serviços de Aprendizado de Máquina do SQL Server?

Aplica-se a: SQL Server 2016 (13.x) e versões posteriores

Este artigo descreve quais novos recursos estão incluídos em cada versão do SQL Server Machine Learning Services. Os recursos de aprendizado de máquina são adicionados ao SQL Server em cada versão, à medida que continuamos a expandir, ampliar e aprofundar a integração entre a plataforma de dados, a análise avançada e a ciência de dados.

Observação

Os recursos e as opções de instalação variam entre as versões do SQL Server. Use a lista suspensa do seletor de versão para escolher a versão apropriada do SQL Server.

Novo no SQL Server 2022

A partir do SQL Server 2022 (16.x), os tempos de execução para R, Python e Java não são mais instalados com a Instalação do SQL. Em vez disso, instale qualquer um dos tempos de execução personalizados e os pacotes desejados. Para obter mais informações, consulte Instalar os Serviços de Aprendizado de Máquina do SQL Server 2022 (Python e R) no Windows ou Instalar os Serviços de Aprendizado de Máquina do SQL Server (Python e R) no Linux.

Novo no SQL Server 2019

Esta versão adiciona os recursos mais solicitados para operações de aprendizado de máquina Python e R no SQL Server. Para obter mais informações sobre todos os recursos desta versão, consulte Novidades no SQL Server 2019 e as notas de lançamento do SQL Server 2019.

Para obter a nova documentação sobre Java e C# no SQL Server 2019, consulte o O que há de novo nas extensões de linguagem do SQL Server?.

Abaixo estão os novos recursos do SQL Server Machine Learning Services, disponíveis no Windows e no Linux:

Novo no SQL Server 2017

Esta versão adiciona suporte Python e algoritmos de aprendizado de máquina líderes do setor. Renomeado para refletir o novo escopo, o SQL Server 2017 marca a introdução do SQL Server Machine Learning Services (In-Database), com suporte à linguagem Python e R.

Para anúncios gerais de funcionalidades, consulte Novidades no SQL Server 2017.

Melhorias em R

O componente R dos Serviços de Aprendizado de Máquina do SQL Server é a próxima geração do SQL Server 2016 R Services, com versões atualizadas do R base, RevoScaler e outros pacotes.

As novas capacidades do R incluem: gestão de pacotes, com os seguintes destaques:

Bibliotecas R

Embalagem Descrição
MicrosoftML Nesta versão, o MicrosoftML está incluído em uma instalação R padrão, eliminando a etapa de atualização necessária no SQL Server 2016 R Services anterior. O MicrosoftML fornece algoritmos de aprendizado de máquina de última geração e transformações de dados que podem ser dimensionados ou executados em contextos de computação remota. Os algoritmos incluem redes neurais profundas personalizáveis, árvores de decisão rápidas e florestas de decisão, regressão linear e regressão logística.

Integração Python para análise no banco de dados

Python é uma linguagem que oferece grande flexibilidade e poder para uma variedade de tarefas de aprendizado de máquina. As bibliotecas de código aberto para Python incluem várias plataformas para redes neurais personalizáveis, bem como bibliotecas populares para processamento de linguagem natural.

Como o Python é integrado ao mecanismo de banco de dados, você pode manter a análise próxima aos dados e eliminar os custos e riscos de segurança associados à movimentação de dados. Você pode implantar soluções de aprendizado de máquina baseadas em Python usando ferramentas como o Visual Studio. Seus aplicativos de produção podem obter previsões, modelos ou visuais do tempo de execução do Python 3.5 usando métodos de acesso a dados do SQL Server.

A integração de T-SQL e Python é suportada através do procedimento armazenado do sistema sp_execute_external_script. Você pode chamar qualquer código Python usando este procedimento armazenado. O código é executado em uma arquitetura dupla segura que permite a implantação de nível empresarial de modelos e scripts Python, chamáveis a partir de um aplicativo usando um procedimento armazenado simples. Ganhos adicionais de desempenho são alcançados pelo streaming de dados de processos SQL para Python e paralelização de anel MPI.

Você pode usar a função T-SQL PREDICT para executar de pontuação nativa em um modelo pré-treinado que tenha sido salvo anteriormente no formato binário necessário.

Bibliotecas Python

Embalagem Descrição
revoscalepy Equivalente em Python ao RevoScaleR. Você pode criar modelos Python para regressões lineares e logísticas, árvores de decisão, árvores impulsionadas e florestas aleatórias, todos paralelizáveis e capazes de serem executados em contextos de computação remota. Este pacote suporta o uso de várias fontes de dados e contextos de computação remota. O cientista de dados ou desenvolvedor pode executar código Python em um SQL Server remoto, para explorar dados ou criar modelos sem mover dados.
#microsoftml Equivalente em Python do pacote MicrosoftML R.

Modelos pré-treinados

Modelos pré-treinados estão disponíveis para Python e R. Use esses modelos para reconhecimento de imagem e análise de sentimento positivo-negativo, para gerar previsões em seus próprios dados.

Servidor autônomo como um recurso compartilhado na Instalação do SQL Server

Esta versão também adiciona SQL Server Machine Learning Server (Standalone), um servidor de ciência de dados totalmente independente, suportando análises estatísticas e preditivas em R e Python. Tal como acontece com o R Services, este servidor é a próxima versão do SQL Server 2016 R Server (Autónomo). Com o servidor autônomo, você pode distribuir e dimensionar soluções R ou Python sem dependências do SQL Server.

Novo no SQL Server 2016

Esta versão introduziu capacidades de aprendizagem automática no SQL Server através do SQL Server 2016 R Services, um motor de análise embutido para o processamento de scripts R em dados residentes numa instância do motor de base de dados.

Além disso, SQL Server 2016 R Server (Independente) foi lançado como uma forma de instalar o R Server num servidor Windows. Inicialmente, a Instalação do SQL Server fornecia a única maneira de instalar o R Server para Windows. Em versões posteriores, desenvolvedores e cientistas de dados que queriam o R Server no Windows poderiam usar outro instalador autônomo para atingir o mesmo objetivo. O servidor autônomo no SQL Server é funcionalmente equivalente ao produto de servidor autônomo, Microsoft R Server para Windows.

Para anúncios de recursos completos, consulte Novidades no SQL Server 2016.

Lançamento Atualização de funcionalidades
Adições de UC A pontuação em tempo real depende de bibliotecas C++ nativas para ler um modelo armazenado num formato binário otimizado e, posteriormente, gerar previsões sem ter de recorrer ao tempo de execução do R. Isso torna as operações de pontuação muito mais rápidas. Com a pontuação em tempo real, você pode executar um procedimento armazenado ou executar a pontuação em tempo real a partir do código R. A pontuação em tempo real também está disponível para o SQL Server 2016, se a instância for atualizada para a versão mais recente do Microsoft R Server.
Versão inicial Integração R para análise em banco de dados.

Pacotes R para chamar funções R em T-SQL e vice-versa. As funções do RevoScaleR fornecem análises de R em escala, dividindo dados em partes de componentes, coordenando e gerenciando o processamento distribuído e agregando resultados. No SQL Server 2016 R Services (In-Database), o mecanismo RevoScaleR é integrado a uma instância do mecanismo de banco de dados, reunindo dados e análises no mesmo contexto de processamento.

Integração da T-SQL e R através de sp_execute_external_script. Você pode chamar qualquer código R usando este procedimento armazenado. Essa infraestrutura segura permite a implantação de nível empresarial de modelos e scripts Rn que podem ser chamados de um aplicativo usando um procedimento armazenado simples. Ganhos adicionais de desempenho são alcançados pelo streaming de dados de processos SQL para R e paralelização de anel MPI.

Você pode usar a função T-SQL PREDICT para executar pontuação nativa num modelo pré-treinado que foi previamente salvo no formato binário necessário.

Suporte Linux

O SQL Server 2019 adiciona suporte ao Linux para R e Python quando você instala os pacotes de aprendizado de máquina com uma instância do mecanismo de banco de dados. Para obter mais informações, consulte Instalar os Serviços de Aprendizado de Máquina do SQL Server no Linux.

No Linux, o SQL Server 2017 não tem integração com o R ou o Python, mas pode utilizar a pontuação nativa de no Linux porque essa funcionalidade está disponível através do T-SQL PREDICT, que é executado no Linux. A pontuação nativa permite pontuação com alto desempenho a partir de um modelo pré-treinado, sem a necessidade de chamar ou mesmo exigir um ambiente de execução R.

Próximos passos