Transformar dados do Azure Synapse Link for Dataverse com o Apache Spark
Pode usar o Azure Synapse Link para ligar os seus dados do Microsoft Dataverse ao Azure Synapse Analytics para explorar os seus dados e acelerar o tempo até às informações. Este artigo mostra-lhe como transformar os seus dados do Dataverse usando o motor do Apache Spark disponível na sua área de trabalho do Synapse.
Nota
O Azure Synapse Link for Microsoft Dataverse era anteriormente conhecido como o serviço Exportar para data lake. O serviço foi renomeado a partir de maio de 2021 e continuará a exportar dados para o Azure Data Lake, bem como Azure Synapse Analytics.
Pré-requisitos
Esta secção descreve os pré-requisitos necessários para transformar dados do Dataverse com o Apache Spark após a utilização do serviço Azure Synapse Link for Dataverse.
Azure Synapse Link for Dataverse. Este guia assume que já exportou dados do Dataverse através do Azure Synapse Link for Dataverse.
Acesso à Conta de Armazenamento. É necessário ser-lhe concedida uma das seguintes funções para a conta de armazenamento: Leitor de Dados do Storage Blob, Contribuidor de Dados do Storage Blob ou Proprietário de Dados do Storage Blob.
Administrador de Synapse. Deve ser-lhe concedida a função Administrador Synapse dentro do estúdio Synapse.
Transformar os seus dados com um bloco de notas do Apache Spark
Em Power Apps, selecione o desejado Azure Synapse Link da lista e, em seguida, selecione Ir para o Azure Synapse workspace.
Expanda Bases de dados, selecione o seu contentor do Dataverse. As suas tabelas exportadas serão apresentadas sob o diretório Tabelas na barra lateral esquerda.
Clique com o botão direito na tabela desejada e selecione Novo caderno > Carregar em DataFrame.
Anexe o caderno a um conjunto do Apache Spark selecionando um conjunto do menu pendente. Se não tiver um conjunto do Apache Spark, selecione Gerir conjuntos para criar um.
Adicione células de código para transformar os seus dados. Executar as células individuais selecionando o botão de reprodução à esquerda de cada célula ou executar todas as células sucessivamente selecionando Executar tudo a partir da barra superior.
Consulte também
Blogue: Anúncio do Azure Synapse Link for Dataverse
O que é o Apache Spark no Azure HDInsight
Nota
Pode indicar-nos as suas preferências no que se refere ao idioma da documentação? Responda a um breve inquérito. (tenha em atenção que o inquérito está em inglês)
O inquérito irá demorar cerca de sete minutos. Não são recolhidos dados pessoais (declaração de privacidade).