Introdução
A regressão é uma técnica de análise de dados simples, comum e altamente útil, coloquialmente conhecida como "ajustar uma linha de tendência". A regressão identifica a força da relação entre um ou mais recursos e um único rótulo. Sua simplicidade, previsibilidade, capacidade de previsão e alto nível de interpretabilidade fazem com que essa técnica seja usada em finanças, negócios, ciências sociais, epidemiologia e medicina.
Neste módulo, vamos nos aprofundar no funcionamento da regressão, entender suas limitações e aprender a avaliar o seu desempenho.
Cenário: Infestação em uma clínica veterinária
Ao longo deste módulo, vamos usar o cenário de exemplo a seguir para explicar os conceitos por trás da regressão. Esse cenário foi projetado para fornecer um exemplo de como você pode usar essa técnica ao analisar dados futuros.
A instituição beneficente para cães de resgate em avalanches que você dirige teve uma súbita onda de doenças. Depois de um dia de retreinamento e de algumas atividades sociais, muitos de seus cães adoeceram. O principal sintoma é a febre. Preocupada com os cães que ainda não apresentaram sintomas, sua equipe coletou informações básicas sobre os primeiros 100 cães que adoeceram. Seu trabalho é identificar quais tipos de cachorros têm maior risco de doença, para que eles possam ser verificados preventivamente pelo veterinário.
Objetivos de aprendizagem
Neste módulo, você vai:
- Entender o funcionamento da regressão.
- Trabalhar com novos algoritmos: regressão linear, regressão linear múltipla e regressão polinomial.
- Entender os pontos fortes e as limitações dos modelos de regressão.
- Visualizar funções de erro e de custo na regressão linear.
- Entender as métricas básicas de avaliação da regressão.
Pré-requisitos
- Familiaridade com modelos de machine learning