Usar o Apache Spark no Azure Databricks

Módulo
9 Unidades

Intermédio

Data Engineer

Azure Databricks

O Azure Databricks é baseado no Apache Spark e permite que engenheiros e analistas de dados executem trabalhos do Spark para transformar, analisar e visualizar dados em escala.

Objetivos de aprendizagem

Neste módulo, irá saber como:

Descreva os principais elementos da arquitetura do Apache Spark.
Crie e configure um cluster do Spark.
Descreva casos de uso do Spark.
Use o Spark para processar e analisar dados armazenados em arquivos.
Use o Spark para visualizar dados.

Pré-requisitos

Antes de iniciar este módulo, você deve ter um conhecimento básico do Azure Databricks. Considere concluir o módulo Explore Azure Databricks antes deste.

Introdução min
Conheça o Spark min
Criar um cluster do Spark min
Usar o Spark em blocos de anotações min
Usar o Spark para trabalhar com arquivos de dados min
Visualizar os dados min
Exercício - Usar o Spark no Azure Databricks min
Verificação de conhecimento min
Resumo min