Não há mais suporte para esse navegador.
Atualize o Microsoft Edge para aproveitar os recursos, o suporte técnico e as atualizações de segurança mais recentes.
Qual é a melhor definição do Apache Spark?
Um sistema de gerenciamento de banco de dados relacional altamente escalonável.
Um servidor virtual com um runtime do Python.
Uma plataforma distribuída para processamento de dados paralelos usando vários idiomas.
Você precisa usar o Spark para analisar dados em um arquivo parquet. O que você deve fazer?
Carregue o arquivo parquet em um dataframe.
Importe os dados para uma tabela em um pool de SQL sem servidor.
Converta os dados no formato CSV.
Você quer escrever código em uma célula de notebook que usa uma consulta SQL para recuperar dados de uma exibição no catálogo do Spark. Qual magic você deve usar?
%spark
%pyspark
%sql
É necessário responder a todas as perguntas antes de verificar o trabalho.
Esta página foi útil?