microsoftml (pacote de Python nos Serviços de Machine Learning do SQL Server)
Aplica-se a: SQL Server 2017 (14.x) e versões posteriores
O microsoftml é um pacote de Python da Microsoft que fornece algoritmos de machine learning de alto desempenho. Ele inclui funções para treinamento e transformações, pontuação, análise de texto e imagem e extração de recursos para obtenção de valores dos dados existentes. O pacote está incluído nos Serviços de Machine Learning do SQL Server e dá suporte ao alto desempenho em Big Data usando o processamento de vários núcleos e o streaming de dados rápido.
Detalhes do pacote | Informações |
---|---|
Versão atual: | 9,4 |
Com base em: | Distribuição Anaconda 4.2 do Python 3.7.1 |
Distribuição de pacote: | Serviços de Machine Learning do SQL Server versão 2017 ou 2019. |
Como usar o microsoftml
O módulo microsoftml é instalado como parte dos Serviços de Machine Learning do SQL Server quando você adiciona o Python à instalação. Você obtém a coleção completa de pacotes proprietários, além de uma distribuição do Python com os respectivos módulos e intérpretes. É possível usar qualquer IDE Python para escrever funções de chamada de script Python no microsoftml, mas o script precisa ser executado em um computador que tenha os Serviços de Machine Learning do SQL Server com Python.
O microsoftml e o revoscalepy são fortemente acoplados. As fontes de dados usadas no microsoftml são definidas como objetos do revoscalepy. Limitações do contexto de computação na transferência do revoscalepy para o microsoftml. Todas as funcionalidades estão disponíveis para operações locais, mas a mudança para um contexto de computação remota exige o RxSpark ou o RxInSQLServer.
Versões e plataformas
O módulo microsoftml está disponível somente quando você instala um dos seguintes produtos ou downloads da Microsoft:
- Serviços de Machine Learning do SQL Server
- Bibliotecas de clientes do Python para um cliente de ciência de dados
Observação
As versões completas do produto são somente Windows no SQL Server 2017. Há suporte no Windows e no Linux para o microsoftml no SQL Server 2019.
Dependências do pacote
Os algoritmos do microsoftml dependem do revoscalepy para:
- Objetos de fonte de dados – Os dados consumidos pelas funções do microsoftml são criados usando as funções do revoscalepy.
- Computação remota (mudança da execução da função para uma instância remota do SQL Server) – O pacote revoscalepy fornece funções para criar e ativar um contexto de computação remota para o SQL Server.
Na maioria dos casos, você carregará os pacotes juntos sempre que estiver usando o microsoftml.
Funções por categoria
Esta seção lista as funções por categoria para dar uma ideia de como cada uma é usada. Use também o sumário para localizar as funções em ordem alfabética.
1 – Funções de treinamento
Função | Descrição |
---|---|
microsoftml.rx_ensemble | Treine um ensemble de modelos. |
microsoftml.rx_fast_forest | Floresta aleatória. |
microsoftml.rx_fast_linear | Modelo linear. com o Ascendente de Coordenada Dupla Alheatória. |
microsoftml.rx_fast_trees | Árvores aumentadas. |
microsoftml.rx_logistic_regression | Regressão logística. |
microsoftml.rx_neural_network | Rede neural. |
microsoftml.rx_oneclass_svm | Detecção de anomalias. |
2 – Funções de transformação
Tratamento de variável categórica
Função | Descrição |
---|---|
microsoftml.categorical | Converte uma coluna de texto em categorias. |
microsoftml.categorical_hash | Realiza hash e converte uma coluna de texto em categorias. |
Manipulação de esquema
Função | Descrição |
---|---|
microsoftml.concat | Concatena várias colunas em um único vetor. |
microsoftml.drop_columns | Remove colunas de um conjunto de dados. |
microsoftml.select_columns | Retém colunas de um conjunto de dados. |
Seleção de variáveis
Função | Descrição |
---|---|
microsoftml.count_select | Seleção de recursos com base em contagens. |
microsoftml.mutualinformation_select | Seleção de recursos com base em informações mútuas. |
Análise de Texto
Função | Descrição |
---|---|
microsoftml.featurize_text | Converte as colunas de texto em recursos numéricos. |
microsoftml.get_sentiment | Análise de sentimento. |
Análise de imagem
Função | Descrição |
---|---|
microsoftml.load_image | Carrega uma imagem. |
microsoftml.resize_image | Redimensiona uma imagem. |
microsoftml.extract_pixels | Extrai os pixels de uma imagem. |
microsoftml.featurize_image | Converte uma imagem em recursos. |
Funções de personalização
Função | Descrição |
---|---|
microsoftml.rx_featurize | Transformação de dados para fontes de dados |
Funções de pontuação
Função | Descrição |
---|---|
microsoftml.rx_predict | Pontuações usando um modelo de machine learning da Microsoft |
Como chamar o microsoftml
As funções do microsoftml podem ser chamadas no código Python encapsulado em procedimentos armazenados. A maioria dos desenvolvedores cria soluções do microsoftml localmente e, em seguida, migra o código do Python concluído para procedimentos armazenados como um exercício de implantação.
O pacote microsoftml para o Python está instalado por padrão, mas, ao contrário do revoscalepy, ele não é carregado por padrão quando você inicia uma sessão do Python usando os executáveis do Python instalados com o SQL Server.
Como uma primeira etapa, importe o pacote microsoftml e importe o revoscalepy caso precise usar contextos de computação remota ou objetos de fonte de dados ou conectividade relacionados. Em seguida, faça referência às funções individuais de que você precisa.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource