Compartilhar via


Qualidade dos dados para bases de dados de atalho do Microsoft Fabric

Os atalhos são objetos no OneLake que apontam para outras localizações de armazenamento. A localização pode ser interna ou externa ao OneLake. A localização para a qual um atalho aponta é conhecida como o caminho de destino do atalho. A localização onde o atalho é apresentado é conhecida como o caminho de atalho. Os atalhos são apresentados como pastas no OneLake e qualquer carga de trabalho ou serviço que tenha acesso ao OneLake pode utilizá-los.

Os atalhos no Microsoft OneLake permitem-lhe unificar os seus dados entre domínios, clouds e contas ao criar um único data lake virtual para toda a sua empresa. Todas as experiências e motores analíticos do Microsoft Fabric podem ligar-se diretamente às suas origens de dados existentes, como o Azure, Amazon Web Services (AWS) e OneLake através de um espaço de nomes unificado. O OneLake gere todas as permissões e credenciais, pelo que não precisa de configurar separadamente cada carga de trabalho dos Recursos de Infraestrutura para ligar a cada origem de dados.

Para obter mais detalhes sobre os atalhos do Microsoft Fabric, veja a Documentação dos Recursos de Infraestrutura.

Configurar a qualidade dos dados para bases de dados de atalho de recursos de infraestrutura

Inicie sessão na área de trabalho do Microsoft Fabric. Selecione o botão de reticências em Tabelas e selecione Novo Atalho. A partir daqui, pode criar:

Captura de ecrã da área de trabalho Recursos de Infraestrutura, com o novo botão de atalho realçado.

Atalho do Azure Data Lake Gen2

  1. Selecione o atalho Azure Data Lake Storage Gen2 a partir da área de trabalho Recursos de Infraestrutura Nova página de atalho.

    Captura de ecrã da nova página de atalho recursos de infraestrutura com o ADLS Gen2 realçado.

  2. Selecione Autenticação SAS do ADLS Gen2.

    Captura de ecrã da nova janela de atalho com a autenticação do token de SAS selecionada.

  3. Gere uma SAS e cadeia de conexão para o recurso do ADLS Gen2 no portal do Azure.

  4. Copie o ponto final do data lake.

    Captura de ecrã a mostrar a cópia do ponto final do data lake no portal do Azure.

  5. Adicione detalhes de armazenamento para o armazenamento de atalhos.

    Captura de ecrã para adicionar detalhes de armazenamento ao atalho Recursos de Infraestrutura na nova janela de atalho.

  6. Navegue para e escolha a pasta delta correta.

    Captura de ecrã para escolher a pasta delta correta na nova janela de atalho.

  7. Pré-visualize a tabela delta de atalho na área de trabalho Recursos de Infraestrutura.

    Captura de ecrã a mostrar a pré-visualização da tabela delta do OneLake.

  8. Inicie uma análise do recurso do Azure Data Lake Gen2 no Mapa de Dados do Microsoft Purview através da autenticação do principal de serviço.

    Captura de ecrã da análise do mapa de dados do ADLS Gen2.

  9. Quando a análise estiver concluída, o recurso de dados deverá aparecer no Catálogo unificado como uma tabela lakehouse.

  10. Associe o elemento a um produto de dados para a curadoria e a avaliação da qualidade dos dados.

    Captura de ecrã do recurso de dados de atalho no catálogo.

  11. Abra a solução Qualidade de Dados do Microsoft Purview e execute uma análise de qualidade de dados ou crie o perfil dos seus dados como habitualmente.

Atalho do Amazon S3

  1. Selecione Novo atalho na área de trabalho do Microsoft Fabric.

  2. Selecione AWS S3 e adicione o URL, o ID da chave de acesso e o atalho da tecla de acesso.

    Captura de ecrã da nova página de atalho do Amazon S3 com detalhes adicionados.

  3. Adicione o URL de ligação e os detalhes de armazenamento.

    Captura de ecrã da nova página de atalho do Amazon S3 com o URL de ligação e detalhes de armazenamento adicionados.

  4. Pré-visualize o atalho na área de trabalho Recursos de Infraestrutura.

  5. Inicie uma análise do recurso do Amazon S3 no Mapa de Dados do Microsoft Purview através da autenticação do principal de serviço.

  6. Assim que a análise estiver concluída, o recurso de dados deverá aparecer no Catálogo unificado.

  7. Associe o elemento a um produto de dados para a curadoria e a avaliação da qualidade dos dados.

  8. Abra a solução Qualidade de Dados do Microsoft Purview e execute uma análise de qualidade de dados ou crie o perfil dos seus dados como habitualmente.

Atalho do Google Cloud Storage (GCS)

  1. Selecione Novo atalho na área de trabalho do Microsoft Fabric.

  2. Selecione Google Cloud Storage e adicione o URL, o ID da chave de acesso e o atalho da chave de acesso.

    Captura de ecrã a mostrar a tecla HMAC de atalho do GCS.

  3. Adicione o URL da ligação e os detalhes de armazenamento,

    Captura de ecrã a mostrar o URL de ligação do GCS.

  4. Pré-visualize o atalho na área de trabalho Recursos de Infraestrutura.

  5. Inicie uma análise do recurso do Amazon S3 no Mapa de Dados do Microsoft Purview através da autenticação do principal de serviço.

  6. Assim que a análise estiver concluída, o recurso de dados deverá aparecer no Catálogo unificado.

  7. Associe o elemento a um produto de dados para a curadoria e a avaliação da qualidade dos dados.

  8. Abra a solução Qualidade de Dados do Microsoft Purview e execute uma análise de qualidade de dados ou crie o perfil dos seus dados como habitualmente.

Importante

  • Utilize um principal de serviço para análises de mapas de dados e identidade gerida para análises de qualidade de dados.
  • Todos os dados obtidos através de um atalho serão processados na mesma região.
  • Existe uma dependência da equipa de Recursos de Infraestrutura para diferenciar itens de atalho de itens nativos no SDK do OneLake para subartifacts lakehouse. Por enquanto, todos os itens de atalho (tabelas e ficheiros) serão considerados itens nativos na análise.