Introdução
O aprendizado de máquina é a base para a maioria das soluções de inteligência artificial e funciona usando grandes quantidades de dados para treinar modelos preditivos.
Para treinar um modelo preditivo, use uma estrutura de aprendizado de máquina para determinar uma relação entre os recursos das entidades e os rótulos que você deseja prever para elas. Por exemplo, você pode treinar um modelo para prever o preço esperado de uma casa com base em recursos como o tamanho da propriedade, o número de quartos, o CEP e assim por diante.
O Azure Databricks fornece uma plataforma de processamento de dados baseada no Apache Spark que dá suporte a várias estruturas populares de aprendizado de máquina; incluindo Scikit-Learn, PyTorch, TensorFlow e outros. Este módulo usa a estrutura de aprendizado de máquina do Spark MLlib para mostrar exemplos, mas os princípios que ele descreve se aplicam a todas as estruturas de aprendizado de máquina.