Usar o Azure Synapse Analytics com análises em escala de nuvem

Artigo
12/13/2024

O Azure Synapse Analytics é o serviço de análise integrado e provisionado que acelera o tempo de insight em armazéns de dados e sistemas de big data. O Azure Synapse Analytics reúne:

As melhores tecnologias SQL usadas no armazenamento de dados corporativo.
Tecnologias Spark usadas para big data.
Pipelines para aplicação de dados (alinhado à fonte) e extrair, transformar e carregar (ETL) ou extrair, carregar e transformar (ELT).

O Azure Synapse studio é uma ferramenta no Azure Synapse que fornece uma experiência unificada para gerenciamento, monitoramento, codificação e segurança. O Synapse studio tem integração profunda com outros serviços do Azure, como Power BI, Azure Cosmos DB e Azure Machine Learning.

Observação

Esta seção tem como objetivo descrever as configurações prescritas que são específicas para análises em escala de nuvem. É um elogio à documentação oficial do Azure Synapse Analytics.

Visão geral

Durante a configuração inicial de uma zona de aterrissagem de dados , você pode implantar um único espaço de trabalho do Azure Synapse Analytics para uso por todos os analistas e cientistas de dados. Você pode criar mais espaços de trabalho para integrações de dados ou produtos de dados específicos.

Você pode precisar de espaços de trabalho adicionais do Azure Synapse Analytics se o seu produto de dados precisar fornecer acesso aos dados padronizados com segurança em nível de linha e de coluna. Você pode fornecer esses espaços de trabalho com pools do Azure Synapse. As equipas de produtos de dados podem necessitar do seu próprio espaço de trabalho para criar produtos de dados e de um espaço de trabalho separado, destinado exclusivamente a equipas de produto com acesso restrito ao desenvolvimento.

Configuração do Azure Synapse Analytics

A primeira etapa na implantação do Azure Synapse Analytics é configurar um espaço de trabalho do Azure Synapse que esteja conectado a uma conta do Microsoft Purview.

Rede do Azure Synapse Analytics

Uma zona de aterragem de dados cria espaços de trabalho com uma rede virtual gerida por Azure Synapse Analytics. A comunicação com o Azure Synapse acontece através dos três endereços que expõe: pool SQL, SQL sob demanda e o endereço de desenvolvimento.

No nível da rede, a análise em escala de nuvem usa pontos de extremidade privados geridos por sinapse. Esses pontos de extremidade garantem que todo o tráfego entre a rede virtual da zona de aterrissagem de dados e os espaços de trabalho do Azure Synapse seja conduzido inteiramente pela rede principal da Microsoft.

Controle de acesso a dados do Azure Synapse

Use listas de controle de acesso com passagem do Microsoft Entra no Azure Synapse Analytics para gerenciar o acesso aos arquivos no data lake.

Para dados em que você precisa restringir colunas e linhas retornadas, recomendamos a segurança em nível de linha e coluna para restringir o acesso a dados nas tabelas no pool dedicado ou sem servidor do Azure Synapse SQL. A segurança em nível de linha e a segurança em nível de coluna são implementadas no nível do banco de dados e além das funções do banco de dados.

Por exemplo, a segurança em nível de linha garante que os usuários em um aplicativo de dados específico (alinhado à fonte) ou produto de dados vejam apenas seus próprios dados. Mesmo que a tabela contenha dados para toda a empresa.

Você pode combinar segurança em nível de linha com segurança em nível de coluna para restringir o acesso a colunas com dados confidenciais. Dessa forma, a segurança em nível de linha e a segurança em nível de coluna aplicam a lógica de restrição de acesso na camada de banco de dados em vez da camada de aplicativo. A permissão é avaliada sempre que o acesso aos dados é tentado a partir de qualquer camada.

Observação

O pool SQL sem servidor do Azure Synapse dá suporte a de segurança em nível de coluna para exibições e não para tabelas externas. No caso de tabelas externas, pode-se criar uma visualização lógica em cima da tabela externa e aplicar segurança em nível de coluna. No caso de segurança em nível de linha, modos de exibição personalizados podem ser usados como uma solução alternativa.

Para mais informações, consulte Azure Synapse Analytics controle de acesso a dados.

Controle de acesso a dados do Azure Synapse no Azure Data Lake

Ao implantar um espaço de trabalho do Azure Synapse Analytics, precisa-se de uma conta do Armazenamento do Azure Data Lake da assinatura ou usar manualmente a URL da conta de armazenamento. A conta de armazenamento especificada é definida como principal para armazenar os dados do espaço de trabalho Synapse do Azure implantado. O Azure Synapse armazena dados em um contêiner que inclui tabelas do Apache Spark e logs de aplicativos do Spark em uma pasta chamada /synapse/{workspaceName}. Ele também tem um contêiner para gerenciar quaisquer bibliotecas que você optar por instalar.

Dica

Recomendamos usar um container dedicado na camada de desenvolvimento ou na conta do data lake três. Esse contêiner é usado como armazenamento principal para armazenar metadados do Spark.

Consulte de controle de acesso a dados do Azure Synapse Analytics para obter recomendações sobre como configurar o acesso a dados.

Partilhar via