Migrar o Azure Data Lake Analytics para o Azure Synapse Analytics
O Azure Data Lake Analytics será desativado em 29 de fevereiro de 2024. Saiba mais nesse comunicado.
Se você já estiver usando o Azure Data Lake Analytics, crie um plano de migração para o Azure Synapse Analytics na sua organização.
A Microsoft iniciou o Azure Synapse Analytics que visa unificar os dois data lakes e o data warehouse, oferecendo uma experiência única de análise de Big Data. Isso ajudará você a coletar e analisar seus dados a fim de resolver a ineficiência de dados e ajudar suas equipes a trabalharem juntas. Além disso, a integração do Azure Synapse com o Azure Machine Learning e o Power BI aumentará a capacidade das organizações de obter insights dos dados e executar machine learning em todos os aplicativos inteligentes.
O documento mostra como fazer a migração do Azure Data Lake Analytics para o Azure Synapse Analytics.
Abordagem recomendada
- Etapa 1: Avaliar a preparação
- Etapa 2: Preparar para migrar
- Etapa 3: Migrar dados e cargas de trabalho de aplicativos
- Etapa 4: Migrar do Azure Data Lake Analytics para o Azure Synapse Analytics
Etapa 1: Avaliar a preparação
Confira o Apache Spark no Azure Synapse Analytics e conheça as principais diferenças do Azure Data Lake Analytics e do Spark no Azure Synapse Analytics.
Item Análise Azure Data Lake O Spark no Synapse Preços Por unidade de hora da Análise Por hora do vCore Mecanismo Análise Azure Data Lake Apache Spark Linguagem de programação padrão U-SQL T-SQL, Python, Scala, Spark SQL e .NET Fontes de dados Armazenamento do Azure Data Lake Armazenamento de Blobs do Azure, Azure Data Lake Storage Revisar o Questionário de Avaliação de Migração e listar os possíveis riscos a serem considerados.
Etapa 2: Preparar para migrar
Identificar os trabalhos e os dados que serão migrados.
- Aproveite essa oportunidade para limpar os trabalhos que não são mais usados. A menos que planeje migrar todos os trabalhos ao mesmo tempo, reserve um tempo para identificar grupos lógicos dos trabalhos que podem ser migrados em fases.
- Avalie o tamanho dos dados e conheça o formato de dados do Apache Spark. Examine os scripts do U-SQL, avalie as ações para reescrever os scripts e entenda o conceito de código do Apache Spark.
Determine o impacto que uma migração terá em sua empresa. Por exemplo, se você pode permitir algum tempo de inatividade durante a migração.
Crie um plano de migração.
Etapa 3: Migrar dados e carga de trabalho de aplicativos
Migrar os dados do Azure Data Lake Storage Gen1 para o Azure Data Lake Storage Gen2.
A desativação do Azure Data Lake Storage Gen1 será em fevereiro de 2024, confira o comunicado oficial. Em primeiro lugar, sugerimos a migração dos dados para o Gen2. Confira Conheça os formatos de dados do Apache Spark para desenvolvedores de U-SQL do Azure Data Lake Analytics e mover o arquivo e os dados armazenados em tabelas U-SQL para torná-los acessíveis ao Azure Synapse Analytics. Encontre mais detalhes sobre o guia de migração aqui.Transformar os scripts U-SQL em Spark. Consulte Conheça os conceitos de código do Apache Spark para desenvolvedores de U-SQL do Azure Data Lake Analytics para transformar os scripts U-SQL em Spark.
Transforme ou recrie seus pipelines de orquestração de trabalho para o novo programa Spark.
Etapa 4: Migrar do Azure Data Lake Analytics para o Azure Synapse Analytics
Depois de ter certeza de que seus aplicativos e cargas de trabalho estão estáveis, é possível começar a usar o Azure Synapse Analytics para satisfazer seus cenários de negócios. Desative todos os pipelines restantes em execução no Azure Data Lake Analytics e desative suas contas do Azure Data Lake Analytics.
Questionário para Avaliação de Migração
Categoria | Perguntas | Referência |
---|---|---|
Avaliar o tamanho da migração | Quantas contas você têm do Azure Data Lake Analytics? Quantos pipelines estão em uso? Quantos scripts de U-SQL estão em uso? | Quanto mais dados e scripts forem migrados e quanto mais UDO/UDF forem usados em scripts, mais difícil será para migrar. O tempo e os recursos necessários para migração precisam ser bem planejados de acordo com a escala do projeto. |
Fonte de dados | Qual é o tamanho da fonte de dados? Quais são os tipos de formato de dados para processamento? | Saiba mais sobre os formatos de dados do Apache Spark para os desenvolvedores de U-SQL do Azure Data Lake Analytics |
Saída de dados | Você manterá os dados de saída para usar depois? Como tratar os dados de saída se eles forem salvos em tabelas U-SQL? | Se os dados de saída forem usados com frequência e salvos em tabelas U-SQL, você precisará alterar os scripts e alterar os dados de saída para o formato de dados com suporte do Spark. |
Migração de dados | Você fez o plano de migração de armazenamento? | Migrar do Azure Data Lake Storage do Gen1 para o Gen2 |
Transformar scripts de U-SQL | Você usa UDO/UDF (.NET, Python, etc.)? Se a resposta acima for afirmativa, qual linguagem você usa em seu UDO/UDF e nos problemas para a transformação durante a transformação? A consulta federada está sendo usada no U-SQL? | Conheça os conceitos de código do Apache Spark para desenvolvedores de U-SQL do Azure Data Lake Analytics |