Usar o Azure Synapse Analytics com a análise de escala de nuvem
O Azure Synapse Analytics é o serviço de análise integrado e provisionado que acelera o tempo para obter insights em data warehouses e sistemas de Big Data. O Azure Synapse Analytics reúne:
- As melhores tecnologias SQL usadas em data warehouses empresariais.
- Tecnologias Spark usadas em Big Data.
- Pipelines para aplicativo de dados (alinhado à origem) e ETL (extração, transformação e carregamento) ou ELT (extração, carregamento e transformação).
O estúdio do Azure Synapse é uma ferramenta no Azure Synapse que fornece uma experiência unificada de gerenciamento, monitoramento, codificação e segurança. O estúdio do Synapse tem integração profunda com outros serviços do Azure, como o Power BI, o Azure Cosmos DB e o Azure Machine Learning.
Observação
Esta seção visa descrever as configurações prescritas que são específicas para a análise de escala de nuvem. Ela é um complemento da documentação oficial do Azure Synapse Analytics.
Visão geral
Durante a configuração inicial de uma zona de destino de dados, você pode implantar um único espaço de trabalho do Azure Synapse Analytics para uso por todos os analistas e cientistas de dados. É possível criar mais espaços de trabalho para integrações de dados ou produtos de dados específicos.
Talvez você precise de espaços de trabalho adicionais do Azure Synapse Analytics se o produto de dados precisar fornecer acesso a dados padronizados com segurança em nível de linha e de coluna. Você pode fornecer esses espaços de trabalho com pools do Azure Synapse. As equipes de produtos de dados podem exigir o próprio espaço de trabalho para criar produtos de dados e um espaço de trabalho separado apenas para equipes de produtos com acesso de desenvolvimento com escopo definido.
Configuração do Azure Synapse Analytics
A primeira etapa na implantação do Azure Synapse Analytics é configurar um espaço de trabalho do Azure Synapse que esteja conectado a uma conta do Azure Purview.
Rede do Azure Synapse Analytics
Uma zona de destino de dados cria espaços de trabalho com uma Rede virtual gerenciada do Azure Synapse Analytics. A comunicação com o Azure Synapse ocorre por meio dos três pontos de extremidade que ele expõe: pool de SQL, SQL sob demanda e ponto de extremidade de desenvolvimento.
No nível de rede, a análise de escala de nível usa pontos de extremidade privados gerenciados pelo Synapse. Esses pontos de extremidade garantem que todo o tráfego entre a rede virtual da zona de destino de dados e os espaços de trabalho do Azure Synapse se movimente inteiramente pela rede de backbone da Microsoft.
Controle de acesso de dados do Azure Synapse
Use listas de controle de acesso com a passagem do Microsoft Entra no Azure Synapse Analytics para gerenciar o acesso aos arquivos no data lake.
Para dados em que você precise restringir colunas e linhas retornadas, recomendamos a segurança em nível de linha e de coluna para restringir o acesso a dados nas tabelas no Azure Synapse SQL pool dedicado ou sem servidor. A segurança em nível de linha e a segurança em nível de coluna são implementadas no nível de banco de dados e em acréscimo às funções de banco de dados.
Por exemplo, a segurança em nível de linha garante que os usuários em um aplicativo de dados específico (alinhado à origem) ou produto de dados vejam apenas seus próprios dados. Mesmo que a tabela contenha dados de toda a empresa.
Você pode combinar a segurança em nível de linha com a segurança em nível de coluna para restringir o acesso a colunas com dados confidenciais. Dessa forma, a segurança em nível de linha e a segurança em nível de coluna aplicam a lógica de restrição de acesso na camada do banco de dados, em vez da camada do aplicativo. A permissão é avaliada toda vez que o acesso a dados é tentado em qualquer camada.
Observação
O pool SQL sem servidor do Azure Synapse oferece suporte à segurança em nível de coluna para exibições e não para tabelas externas. No caso de tabelas externas, pode-se criar uma exibição lógica na parte superior da tabela externa e aplicar segurança em nível de coluna. No caso de segurança em nível de linha, os modos de exibição personalizados podem ser usados como uma solução alternativa.
Para saber mais, confira Controle de acesso a dados do Azure Synapse Analytics.
Controle de acesso a dados do Azure Synapse no Azure Data Lake
Ao implantar um espaço de trabalho do Azure Synapse Analytics, você precisa de uma conta de assinatura do Azure Data Lake Storage da assinatura ou de usar a URL da conta de armazenamento manualmente. A conta de armazenamento especificada é definida como primária para o espaço de trabalho do Azure Synapse implantado para armazenar os dados. O Azure Synapse armazena dados em um contêiner que inclui tabelas do Apache Spark e logs de aplicativos do Spark em uma pasta chamada /synapse/{workspaceName}
. Ele também tem um contêiner para gerenciar todas as bibliotecas que você escolher instalar.
Dica
É recomendável usar um contêiner dedicado na conta de camada de desenvolvimento ou data lake três. Esse contêiner é usado como armazenamento primário dos metadados do Spark.
Consulte o Controle de acesso a dados do Azure Synapse Analytics para obter recomendações sobre como configurar o acesso a dados.