Resumo
Concluímos nossa introdução sobre classificação, então vamos recapitular alguns pontos-chave.
Vimos que a classificação tem muito em comum com a regressão clássica. Nas duas, podemos usar o aprendizado supervisionado, uma função de custo e conjuntos de dados de teste e treinamento para estimar o desempenho real. Nosso foco aqui é a regressão logística, que é quase um híbrido entre esses dois tipos de modelo, e mostramos como o limite da saída nos dá um rótulo categórico, como avalanche
/no-avalanche
.
Discutimos como a avaliação de modelos de classificação pode ser um pouco mais difícil do que com modelos de regressão, especialmente porque as funções de custos envolvidas são geralmente intuitivas.
Também exploramos como adicionar e combinar funcionalidades pode resultar em melhorias substanciais do modelo. O mais importante é que mostramos como pensar no significado dos dados é a chave para alcançar o melhor resultado.
Neste módulo, trabalhamos com regressão logística. Mas tenha em mente que a maioria dos assuntos abordados aqui também se aplicam a muitos outros tipos de modelos de classificação. Incluindo modelos que tentam prever mais de duas categorias possíveis.