Migrar notebooks do Spark do Azure Synapse Analytics para o Fabric
O Azure Synapse e o Fabric dão suporte a notebooks. A migração de um notebook do Azure Synapse para o Fabric pode ser feita de duas maneiras:
- Opção 1: você pode exportar notebooks do Azure Synapse (.ipynb) e importá-los para o Fabric (manualmente).
- Opção 2: você pode usar um script para exportar notebooks do Azure Synapse e importá-los no Fabric usando a API.
Para considerações sobre notebook, confira diferenças entre o Spark do Azure Synapse e o Fabric.
Pré-requisitos
Se você ainda não tiver um, crie um workspace do Fabric em seu locatário.
Opção 1: exportar e importar o notebook manualmente
Para exportar um notebook do Azure Synapse:
- Abra o Synapse Studio: entre no Azure. Navegue até o workspace do Azure Synapse e abra o Synapse Studio.
- Localize o notebook: no Synapse Studio, localize o notebook que deseja exportar na seção Notebooks do seu workspace.
- Exportar notebook:
- Clique com o botão direito do mouse no notebook que deseja exportar.
- Selecione Exportar>Notebook (.ipynb).
- Escolha uma pasta de destino e forneça um nome para o arquivo de notebook exportado.
- Quando a exportação for concluída, você terá o arquivo de notebook disponível para upload.
Para importar o notebook exportado no Fabric:
- Acesse o workspace do Fabric: entre no Fabric e acesse seu workspace.
- Navegue até a página inicial de Engenharia de Dados: no workspace do Fabric, acesse a página inicial de Engenharia de Dados.
- Importar notebook:
- Selecione Importar notebook. Você pode importar um ou mais notebooks existentes do computador local para um workspace do Fabric.
- Procure os arquivos de notebook .ipynb que você baixou do Azure Synapse Analytics.
- Selecione os arquivos de notebook e clique em Carregar.
- Abrir e usar o Notebook: após a importação, você poderá abrir e usar o notebook no workspace do Fabric.
Após a importação do notebook, valide as dependências dele:
- Confirme se está usando a mesma versão do Spark.
- Se você estiver usando notebooks referenciados, poderá usar msparkutils também no Fabric. No entanto, se você importar um notebook que faça referência a outro, também precisará importá-lo. O workspace do Fabric não dá suporte a pastas por enquanto. Portanto, todas as referências a notebooks em outras pastas devem ser atualizadas. Você pode usar os recursos do notebook se necessário.
- Se um notebook estiver usando bibliotecas e configurações específicas do pool, você também precisará importar essas bibliotecas e/ou configurações.
- Serviços vinculados, conexões de fonte de dados e pontos de montagem.
Opção 2: usar a API do Fabric
Siga estas etapas importantes para migração:
- Pré-requisitos.
- Etapa 1: exportar notebooks do Azure Synapse para o OneLake (.ipynb).
- Etapa 2: importar notebooks automaticamente para o Fabric usando a API do Fabric.
Pré-requisitos
Os pré-requisitos incluem ações que você precisa considerar antes de iniciar a migração do notebook para o Fabric.
- Um workspace do Fabric.
- Se você ainda não tiver um, crie um lakehouse do Fabric no seu workspace.
Etapa 1: exportar notebooks do workspace do Azure Synapse
O foco da Etapa 1 é exportar os notebooks do workspace do Azure Synapse para o OneLake no formato .ipynb. Esse processo é o seguinte:
- 1.1) Importar o notebook de migração para o workspace do Fabric. Esse notebook exporta todos os notebooks de um determinado workspace do Azure Synapse para um diretório intermediário no OneLake. A API do Synapse é usada para exportar notebooks.
- 1.2) Configure os parâmetros no primeiro comando para exportar notebooks para um armazenamento intermediário (OneLake). O snippet a seguir é usado para configurar os parâmetros de origem e destino. Substitua-os por seus próprios valores.
# Azure config
azure_client_id = "<client_id>"
azure_tenant_id = "<tenant_id>"
azure_client_secret = "<client_secret>"
# Azure Synapse workspace config
synapse_workspace_name = "<synapse_workspace_name>"
# Fabric config
workspace_id = "<workspace_id>"
lakehouse_id = "<lakehouse_id>"
export_folder_name = f"export/{synapse_workspace_name}"
prefix = "" # this prefix is used during import {prefix}{notebook_name}
output_folder = f"abfss://{workspace_id}@onelake.dfs.fabric.microsoft.com/{lakehouse_id}/Files/{export_folder_name}"
- 1.3) Execute as duas primeiras células do notebook de exportação/importação para exportar notebooks para o OneLake. Depois que as células forem preenchidas, essa estrutura de pastas no diretório de saída intermediário será criada.
Etapa 2: importar notebooks para o Fabric
A etapa 2 acontece quando notebooks são importadas do armazenamento intermediário para o workspace do Fabric. Esse processo é o seguinte:
- 2.1) Valide as configurações da etapa 1.2 para garantir que o workspace e os valores de prefixo certos sejam indicados para importar os notebooks.
- 2.2) Execute a terceira célula do notebook de exportação/importação para importar todos os notebooks da localização intermediária.