Résumé

Effectué

Nous avons abordé un nouveau jargon important dans ce module. Récapitulons ce que nous avons appris :

  • L’objectif du Machine Learning est de trouver des modèles dans des données et de les utiliser pour faire des estimations.

  • Le machine learning diffère du développement logiciel normal dans la mesure où nous utilisons du code spécial, au lieu de notre propre intuition, pour améliorer le fonctionnement du logiciel.

  • Conceptuellement, le processus d’entraînement utilise quatre composants :

    • Des données, qui sont les informations utilisées pour l’apprentissage.
    • Un modèle, qui fait des estimations sur les données.
    • Un objectif que le modèle tente d’atteindre.
    • Un optimiseur, code supplémentaire qui modifie le modèle en fonction de ses performances.
  • Vous pouvez considérer les données comme un ensemble de caractéristiques et d’étiquettes. Les caractéristiques correspondent aux entrées potentielles du modèle, tandis que les étiquettes correspondent aux sorties du modèle ou aux sorties souhaitées du modèle.

  • Pandas et Plotly sont des outils puissants pour explorer les jeux de données dans Python.

  • Une fois que nous avons un modèle entraîné, nous pouvons l’enregistrer sur disque pour l’utiliser ultérieurement.