Usar o Apache Spark no Azure Databricks
O Azure Databricks é baseado no Apache Spark e permite que engenheiros e analistas de dados executem trabalhos do Spark para transformar, analisar e visualizar dados em escala.
Objetivos de aprendizagem
Neste módulo, irá saber como:
- Descreva os principais elementos da arquitetura do Apache Spark.
- Crie e configure um cluster do Spark.
- Descreva casos de uso do Spark.
- Use o Spark para processar e analisar dados armazenados em arquivos.
- Use o Spark para visualizar dados.
Pré-requisitos
Antes de iniciar este módulo, você deve ter um conhecimento básico do Azure Databricks. Considere concluir o módulo Explore Azure Databricks antes deste.