Referência do componente Algorithm & para o designer do Azure Machine Learning
APLICA-SE A: Python SDK azure-ai-ml v2 (atual)
Nota
O Designer suporta dois tipos de componentes, componentes pré-construídos clássicos e componentes personalizados. Estes dois tipos de componentes não são compatíveis.
Os componentes pré-construídos clássicos fornecem componentes pré-construídos principalmente para processamento de dados e tarefas tradicionais de aprendizado de máquina, como regressão e classificação. Este tipo de componente continua a ser suportado, mas não terá novos componentes adicionados.
Os componentes personalizados permitem que você forneça seu próprio código como um componente. Suportam a partilha entre áreas de trabalho e a criação totalmente fácil transversalmente nas interfaces do Studio, da CLI e do SDK.
Este artigo aplica-se a componentes pré-construídos clássicos.
Este conteúdo de referência fornece a base técnica sobre cada um dos componentes pré-criados clássicos disponíveis no designer do Azure Machine Learning.
Cada componente representa um conjunto de código que pode ser executado de forma independente e executar uma tarefa de aprendizado de máquina, dadas as entradas necessárias. Um componente pode conter um algoritmo específico ou executar uma tarefa que é importante no aprendizado de máquina, como substituição de valor ausente ou análise estatística.
Para obter ajuda com a escolha de algoritmos, consulte
Gorjeta
Em qualquer pipeline no designer, você pode obter informações sobre um componente específico. Selecione o link Saiba mais na placa de componente ao passar o mouse sobre o componente na lista de componentes ou no painel direito do componente.
Componentes de preparação de dados
Funcionalidade | Description | componente |
---|---|---|
Data Input and Output | Mova dados de fontes de nuvem para seu pipeline. Escreva seus resultados ou dados intermediários no Armazenamento do Azure ou no Banco de Dados SQL enquanto executa um pipeline ou use o armazenamento em nuvem para trocar dados entre pipelines. | Inserir dados manualmente Exportar dados Importar dados |
Transformação de Dados | Operações em dados que são exclusivos do aprendizado de máquina, como normalização ou vinculação de dados, redução de dimensionalidade e conversão de dados entre vários formatos de arquivo. | Adicionar colunas Adicionar linhas Aplicar operação matemática Aplicar transformação SQL Limpar dados ausentes Valores do clipe Converter em CSV Converter em conjunto de dados Converter em valores indicadores Editar metadados Agrupar dados em compartimentos Juntar dados Normalizar dados Partição e amostra Remover linhas duplicadas SMOTE Selecionar Transformação de Colunas Selecionar colunas no conjunto de dados Dividir dados |
Feature Selection | Selecione um subconjunto de recursos relevantes e úteis para usar para criar um modelo analítico. | Seleção de recursos baseada em filtro Importância da característica de permutação |
Funções Estatísticas | Fornecer uma ampla variedade de métodos estatísticos relacionados à ciência de dados. | Resumir dados |
Algoritmos de aprendizagem automática
Funcionalidade | Description | componente |
---|---|---|
Regressão | Preveja um valor. | Regressão da árvore de decisão impulsionada Regressão Florestal de Decisão Regressão Quantílica Rápida da Floresta Regressão Linear Regressão de Rede Neural Regressão de Poisson |
Clustering | Agrupe os dados. | Agrupamento K-Means |
Classificação | Preveja uma classe. Escolha entre algoritmos binários (de duas classes) ou multiclasse. | Árvore de decisão impulsionada por várias classes Floresta de Decisão Multiclasse Regressão Logística Multiclasse Rede Neural Multiclasse Um contra Todos Multiclasse Um contra um multiclasse Perceptron médio de duas classes Árvore de decisão impulsionada de duas classes Floresta de decisão de duas classes Regressão Logística de Duas Classes Rede Neural de Duas Classes Máquina vetorial de suporte de duas classes |
Componentes para construção e avaliação de modelos
Serviço Web
Saiba mais sobre os componentes de serviço Web, que são necessários para inferência em tempo real no designer do Azure Machine Learning.
Mensagens de erro
Saiba mais sobre as mensagens de erro e códigos de exceção que você pode encontrar usando componentes no designer do Azure Machine Learning.
Ambiente de componentes
Todos os componentes incorporados no estruturador serão executados num ambiente estabelecido fornecido pela Microsoft.
Anteriormente, este ambiente tinha por base o Python 3.6, tendo agora sido atualizado para o Python 3.8. Esta atualização é transparente, ou seja, os componentes serão executados automaticamente no ambiente Python 3.8 e não é necessária qualquer ação por parte do utilizador. A atualização do ambiente pode afetar as saídas de componentes e a implantação de pontos de extremidade em tempo real a partir de uma inferência em tempo real, consulte as seções a seguir para saber mais.
As saídas dos componentes são diferentes dos resultados anteriores
Depois que a versão do Python é atualizada de 3.6 para 3.8, as dependências dos componentes internos também podem ser atualizadas de acordo. Assim, você pode achar que algumas saídas de componentes são diferentes dos resultados anteriores.
Se você estiver usando o componente Execute Python Script e tiver instalado anteriormente pacotes vinculados ao Python 3.6, poderá encontrar erros como:
- "Não foi possível encontrar uma versão que satisfaça o requisito."
- "Nenhuma distribuição correspondente encontrada." Em seguida, você precisará especificar a versão do pacote adaptada para Python 3.8 e executar seu pipeline novamente.
Implante o ponto de extremidade em tempo real a partir do problema do pipeline de inferência em tempo real
Se você implantar diretamente o ponto de extremidade em tempo real de um pipeline de inferência em tempo real concluído anteriormente, ele poderá encontrar erros.
Recomendação: clone o pipeline de inferência e envie-o novamente e, em seguida, implante no endpoint em tempo real.