Partilhar via


Folha de truques do algoritmo de aprendizado de máquina para o designer do Azure Machine Learning

O Azure Machine Learning Algorithm Cheat Sheet ajuda você a escolher o algoritmo certo do designer para um modelo de análise preditiva.

Nota

O Designer suporta dois tipos de componentes, componentes pré-construídos clássicos (v1) e componentes personalizados (v2). Estes dois tipos de componentes NÃO são compatíveis.

Os componentes pré-construídos clássicos fornecem componentes pré-construídos principalmente para processamento de dados e tarefas tradicionais de aprendizado de máquina, como regressão e classificação. Este tipo de componente continua a ser suportado, mas não terá novos componentes adicionados.

Os componentes personalizados permitem que você envolva seu próprio código como um componente. Ele suporta o compartilhamento de componentes entre espaços de trabalho e a criação contínua nas interfaces Studio, CLI v2 e SDK v2.

Para novos projetos, sugerimos que você use o componente personalizado, que é compatível com o AzureML V2 e continuará recebendo novas atualizações.

Este artigo se aplica a componentes pré-criados clássicos e não são compatíveis com CLI v2 e SDK v2.

O Azure Machine Learning tem uma grande biblioteca de algoritmos das famílias de classificação, sistemas de recomendação, clustering, deteção de anomalias, regressão e análise de texto. Cada um é projetado para abordar um tipo diferente de problema de aprendizado de máquina.

Para obter mais informações, consulte Como selecionar algoritmos.

Download: Algoritmo de Aprendizado de Máquina Cheat Sheet

Faça o download do cheat sheet aqui: Machine Learning Algorithm Cheat Sheet (11x17 pol.)

Machine Learning Algorithm Cheat Sheet: Saiba como escolher um algoritmo de Machine Learning.

Transfira e imprima o Machine Learning Algorithm Cheat Sheet em tamanho tabloide para o manter à mão e obter ajuda na escolha de um algoritmo.

Como usar o algoritmo de aprendizado de máquina Cheat Sheet

As sugestões oferecidas neste cheat sheet de algoritmo são regras gerais aproximadas. Alguns podem ser dobrados, e outros podem ser flagrantemente violados. Este cheat sheet destina-se a sugerir um ponto de partida. Não tenha medo de fazer uma competição direta entre vários algoritmos em seus dados. Simplesmente não há substituto para entender os princípios de cada algoritmo e o sistema que gerou seus dados.

Cada algoritmo de aprendizado de máquina tem seu próprio estilo ou viés indutivo. Para um problema específico, vários algoritmos podem ser apropriados, e um algoritmo pode ser mais adequado do que outros. Mas nem sempre é possível saber de antemão qual é o melhor ajuste. Em casos como estes, vários algoritmos são listados juntos no cheat sheet. Uma estratégia apropriada seria tentar um algoritmo e, se os resultados ainda não forem satisfatórios, tentar os outros.

Para saber mais sobre os algoritmos no designer do Azure Machine Learning, vá para Referência de algoritmo e componente.

Tipos de aprendizagem automática

Existem três categorias principais de aprendizagem automática: aprendizagem supervisionada, aprendizagem não supervisionada e aprendizagem por reforço.

Aprendizagem supervisionada

Na aprendizagem supervisionada, cada ponto de dados é rotulado ou associado a uma categoria ou valor de interesse. Um exemplo de rótulo categórico é atribuir uma imagem como um "gato" ou um "cão". Um exemplo de etiqueta de valor é o preço de venda associado a um carro usado. O objetivo da aprendizagem supervisionada é estudar muitos exemplos rotulados como estes e, em seguida, ser capaz de fazer previsões sobre pontos de dados futuros. Por exemplo, identificar novas fotos com o animal correto ou atribuir preços de venda precisos a outros carros usados. Este é um tipo popular e útil de aprendizado de máquina.

Aprendizagem não supervisionada

Na aprendizagem não supervisionada, os pontos de dados não têm rótulos associados a eles. Em vez disso, o objetivo de um algoritmo de aprendizagem não supervisionado é organizar os dados de alguma forma ou descrever sua estrutura. A aprendizagem não supervisionada agrupa dados em clusters, como faz o K-means, ou encontra diferentes formas de olhar para dados complexos para que pareçam mais simples.

Aprendizagem por reforço

Na aprendizagem por reforço, o algoritmo escolhe uma ação em resposta a cada ponto de dados. É uma abordagem comum na robótica, onde o conjunto de leituras do sensor em um ponto no tempo é um ponto de dados, e o algoritmo deve escolher a próxima ação do robô. É também um ajuste natural para aplicações de Internet das Coisas. O algoritmo de aprendizagem também recebe um sinal de recompensa pouco tempo depois, indicando o quão boa foi a decisão. Com base nesse sinal, o algoritmo modifica sua estratégia para alcançar a maior recompensa.

Próximos passos