Usar o Apache Spark no Azure Databricks

Intermédio
Data Engineer
Azure Databricks

O Azure Databricks é baseado no Apache Spark e permite que engenheiros e analistas de dados executem trabalhos do Spark para transformar, analisar e visualizar dados em escala.

Objetivos de aprendizagem

Neste módulo, irá saber como:

  • Descreva os principais elementos da arquitetura do Apache Spark.
  • Crie e configure um cluster do Spark.
  • Descreva casos de uso do Spark.
  • Use o Spark para processar e analisar dados armazenados em arquivos.
  • Use o Spark para visualizar dados.

Pré-requisitos

Antes de iniciar este módulo, você deve ter um conhecimento básico do Azure Databricks. Considere concluir o módulo Explore Azure Databricks antes deste.