Introduction

Effectué

La régression est une technique d’analyse des données simple, courante et très utile, appelée familièrement « ajustement de ligne de tendance ». La régression identifie la force de la relation entre une ou plusieurs caractéristiques et une seule étiquette. Grâce à sa simplicité, à son comportement prévisible, à sa capacité à prévoir et à son niveau élevé d'interprétabilité, cette technique est utilisée dans les domaines de la finance, des affaires, des sciences sociales, de l'épidémiologie et de la médecine.

Dans ce module, nous allons étudier plus en détail le fonctionnement de la régression, comprendre ses limites et apprendre à évaluer ses performances.

Scénario : Saturation d'une clinique vétérinaire

Tout au long de ce module, nous utiliserons l'exemple suivant pour expliquer les concepts sur lesquels repose la régression. Ce scénario est conçu pour fournir un exemple d'utilisation de cette technique lors de l'analyse de futures données.

L'association de chiens d'avalanche que vous dirigez a été confrontée à une vague soudaine de malades. Après une journée de stage de remise à niveau et quelques activités sociales, de nombreux chiens avec lesquels vous travaillez sont tombés malades, le principal symptôme étant la fièvre (température corporelle élevée). Soucieuse de l’état de santé des chiens qui n’ont pas encore présenté de symptômes, votre équipe a collecté des informations de base sur les 100 premiers chiens tombés malades. Votre travail consiste à identifier les types de chiens les plus exposés à la maladie afin qu'ils puissent être examinés de manière proactive par le vétérinaire.

Objectifs d’apprentissage

Dans ce module, vous allez :

  • Découvrir le fonctionnement de la régression.
  • Utiliser de nouveaux algorithmes : régression linéaire, régression linéaire multiple et régression polynomiale.
  • Découvrir les points forts et les limites des modèles de régression.
  • Visualiser les fonctions d’erreur de coût dans le cadre de la régression linéaire.
  • Découvrir les métriques d’évaluation de base pour la régression.

Prérequis

  • Connaissance des modèles Machine Learning