Entender a ciência de dados para machine learning

Iniciante
Engenheiro de IA
Cientista de Dados
Desenvolvedor
Estudante
Azure

O Microsoft Learn fornece várias maneiras interativas de obter uma introdução ao machine learning clássico. Esses roteiros de aprendizagem tornarão você produtivo e são uma excelente base ao avançar para tópicos de aprendizado profundo.

Desde os modelos de machine learning clássicos mais básicos, até a análise exploratória de dados e a personalização de arquiteturas, você será guiado por meio de um conteúdo conceitual fácil de aprender e notebooks Jupyter interativos, tudo isso sem sair do navegador.

Escolha o próprio roteiro de acordo com a sua formação e interesses educacionais.

Opção 1: o curso completo: Conceitos base de ciência de dados para machine learning

Esse roteiro é recomendado para a maioria das pessoas. Ele tem os mesmos módulos que os outros dois roteiros de aprendizagem com um fluxo personalizado que maximiza o reforço de conceitos. Se você quer saber mais sobre os conceitos subjacentes e como começar a criar modelos com as ferramentas de machine learning mais comuns, esse roteiro é para você. Ele também é o melhor roteiro se você planeja ir além do machine learning clássico e aprender sobre redes neurais e aprendizado profundo, que são conceitos apenas apresentados aqui.

✔ Opção 2: o roteiro de aprendizagem Entender a ciência de dados para machine learning

Se você quer entender como o machine learning funciona e não tem muita formação matemática, esse roteiro é para você. Ele não necessita de formação anterior (exceto por um pouco de familiaridade com conceitos de codificação) e ensina com código, metáforas e visuais que resultam em um "momento eureca". Ele é prático, mas se concentra mais na compreensão dos conceitos básicos e menos na capacidade das ferramentas e bibliotecas disponíveis.

✔ No momento, você está neste roteiro. Role para baixo para começar.

Opção 3: o roteiro de aprendizagem Criar modelos de machine learning

Caso você já tenha ideia do que é o machine learning ou tenha uma formação matemática avançada, talvez seja melhor ir direto para o roteiro de aprendizagem Criar modelos de machine learning. Estes módulos ensinam alguns conceitos de machine learning, mas são sucintos para que seja possível aprender sobre ferramentas avançadas, como scikit-learn, TensorFlow e PyTorch. Esse roteiro de aprendizagem também é o melhor se você está buscando obter apenas conhecimento suficiente para entender exemplos de machine learning em produtos como o Azure ML ou o Azure Databricks.

Pré-requisitos

Nenhum

Módulos neste roteiro de aprendizagem

Uma visão geral de alto nível do machine learning para pessoas com pouco ou nenhum conhecimento sobre ciência da computação e estatísticas. Você aprenderá alguns conceitos essenciais, explorará dados e examinará de forma interativa o ciclo de vida do aprendizado de máquina, usando o Python para treinar, salvar e usar um modelo de aprendizado de máquina, exatamente como no mundo real.

O aprendizado supervisionado é uma forma de aprendizado de máquina em que um algoritmo aprende com exemplos de dados. Vamos traçar de forma progressiva um panorama de como o aprendizado supervisionado gera automaticamente um modelo que pode fazer previsões sobre o mundo real. Também vamos mencionar a maneira em que esses modelos são testados e as dificuldades que podem surgir ao treiná-los.

O poder dos modelos de machine learning é proveniente dos dados usados para treiná-los. Por meio de conteúdo e exercícios, exploramos como entender seus dados, como codificá-los para que o computador possa interpretá-los corretamente, como limpar erros e dicas que ajudarão você a criar modelos de alto desempenho.

A regressão talvez seja a técnica de machine learning mais usada, e costuma estar na raiz de descobertas científicas, do planejamento de negócios e da análise do mercado de ações. Esse material de aprendizagem aprofunda algumas análises de regressão comuns, tanto simples quanto mais complexas, e fornece alguns insights sobre como avaliar o desempenho de um modelo.

Quando pensamos em aprendizado de máquina, geralmente nos concentramos no processo de treinamento. Alguma preparação antes desse processo pode não só acelerar e melhorar o aprendizado, mas também nos dar confiança a respeito de como nossos modelos funcionarão quando nos depararmos com alguns dados que nunca vimos antes.

Classificação significa atribuir itens a categorias ou também pode ser pensada na tomada de decisão automatizada. Aqui, apresentamos modelos de classificação por meio da regressão logística, fornecendo um passo a passo para métodos de classificação mais complexos e empolgantes.

Em geral, modelos mais complexos podem ser personalizados manualmente para aprimorar a eficácia deles. Por meio de exercícios e conteúdo explicativo, vamos explorar como a alteração da arquitetura de modelos mais complexos pode trazer resultados mais eficazes.

Como sabemos se um modelo é bom ou ruim na classificação de nossos dados? Às vezes, pode ser difícil compreender a maneira como os computadores avaliam o desempenho do modelo, ou isso posso simplificar a forma como o modelo se comportará no mundo real. Para criar modelos que funcionam de maneira satisfatória, precisamos encontrar maneiras intuitivas de avaliá-los e entender como essas métricas podem desviar nossa exibição.

As curvas de características de operação do receptor são uma forma avançada de avaliar e ajustar os modelos de classificação treinados. Apresentaremos e explicaremos a utilidade dessas curvas por meio de conteúdo de aprendizado e exercícios práticos.