Compartilhar via


Solução de problemas de qualidade de dados

Todas as perguntas, sintomas de erros são descritos com possível resolução abaixo:

Por que motivo estou a ver um erro de origem inválido na tarefa de análise.

  • Pode haver duas razões pelas quais vê este erro:
    • A tabela delta não existe na localização
    • Os dados no ficheiro não estão num formato delta válido.

Estou a configurar análises de qualidade de dados para as minhas tabelas delta de Recursos de Infraestrutura. Vejo todos os recursos de dados na vista de qualidade dos dados, selecionei um recurso e apliquei regras para análise da qualidade dos dados, mas a análise está a falhar.

  • Pode haver vários motivos pelos quais a análise da qualidade dos dados está a falhar:

Por que motivo estou a ver esta mensagem de erro: não é possível utilizar nenhuma ligação. Tenta criar a ligação primeiro?

Captura de ecrã da página de descrição geral da qualidade dos dados com o erro de ligação.

  • Para criar perfis de dados ou para executar a análise da qualidade dos dados, primeiro tem de configurar a ligação à origem de dados. Este alerta desaparece depois de criar uma ligação de origem de dados.

Porque é que a contagem total de dados criados com perfis mostra menos do que a contagem total na minha tabela delta Azure Data Lake Storage Gen2?

  • Qualidade de Dados do Microsoft Purview está a utilizar 1 Milhão de tamanhos de amostra para criação de perfis. Este exemplo é recolhido aleatoriamente. Se a sua tabela delta tiver mais de um milhão de registos, a contagem total não corresponderá.

Por que motivo vejo uma ação sobre a classificação de qualidade dos dados em falta para um produto de dados? Vejo a classificação no produto de dados quando naveguei na vista de produto de dados.

  • Quando a ação foi criada, não havia nenhuma classificação de qualidade de dados para esse produto de dados. A análise da qualidade dos dados foi executada após a ação ter sido criada e a classificação publicada para o produto de dados. Recomendamos que feche a ação assim que a remediação for feita para evitar confusões.

A criação de regras de qualidade de dados a partir de "Sugerir regras" gera um erro sobre uma coluna "data" ao tentar adicionar todas as 30 regras sugeridas

  • Isto deve-se ao facto de o tipo de dados de esquema não ser suportado na vista de esquema de qualidade de dados. Pode alterar o tipo de dados para data ao selecionar o botão de alternar gestão de esquemas e guardá-lo. Depois de alterar o tipo de dados, deverá conseguir adicionar a regra.

Ao tentar adicionar todas as regras sugeridas, gera um erro sobre "O ObserverId já existe"

  • Muito provavelmente, a mesma regra/regra idêntica já foi adicionada a uma coluna. Quando tenta adicionar a mesma regra/regra idêntica a uma coluna, a aplicação gera esta mensagem de erro.

Por que motivo a minha tarefa agendada está a ser ignorada em vez de ser executada? Vejo As tarefas de análise de qualidade de dados Ignoradas

  • A Tarefa DQ tem uma funcionalidade para marcar e executar o DQ apenas se ocorrerem alterações desde a última execução, que é efetuada para marcar histórico delta. Ignorado significa apenas que não houve alterações nos dados desde a última execução e que a execução do Spark para DQ não é efetuada. Ignorado!= Falha

Quando seleciono o separador dados do perfil, vejo o número de colunas pré-selecionadas. Posso alterar as colunas selecionadas?

  • Qualidade de Dados do Microsoft Purview está a utilizar uma solução de criação de perfis assistido de IA. As colunas pré-selecionadas são selecionadas com a IA de Criação de Perfis de Dados do Microsoft Purview. Pode desselecionar colunas pré-selecionadas e voltar a selecionar com base na criticidade das colunas e selecionar guardar e executar para executar a criação de perfis.

Por que motivo não consigo selecionar alguns dos recursos de dados da página da lista de recursos de qualidade de dados para perfil e análise?

  • Podem existir algumas razões:
    • Esses recursos de dados são publicados a partir de origens de dados não suportadas
    • O formato de ficheiro desses recursos de dados não é suportado

Por que motivo a minha tarefa de criação de perfis está a falhar para as origens de dados suportadas?

  • Verifique o esquema para se certificar de que não existe nenhum nome de coluna com espaços. A versão atual não suporta o nome da coluna com espaços. Os nossos engenheiros estão a trabalhar para lançar uma correção.

Por que motivo não consigo executar a análise da qualidade dos dados e a criação de perfis de dados para ficheiros de CSV, parquet e texto?

  • Qualidade de Dados do Microsoft Purview atualmente só suporta o formato delta do parquet. A Qualidade de Dados do Purview não suporta CSV, texto e parquet (sem delta).

Por que motivo não vejo a regra de atualização da qualidade dos dados na lista de regras?

  • A atualização da qualidade dos dados não é suportada para tabelas SQL do Azure. Se o recurso de dados for uma tabela de SQL do Azure, a regra de atualização não será listada para selecionar e aplicar ao recurso de dados.

A minha tarefa de análise de DQ falhou. Vejo uma mensagem de erro "Ocorreu um erro de serviço interno, tente novamente ou contacte o suporte da Microsoft.". O que devo fazer para resolver problemas?

  • Pode haver muitas razões pelas quais a análise está a falhar com esta mensagem de erro:
    • O utilizador não está autorizado a executar a operação atual para a área de trabalho à qual o utilizador está a tentar aceder para a análise da qualidade dos dados.
    • Código de erro 403, o que significa que o acesso às origens de dados é proibido temporariamente.
    • O acesso concedido à origem de dados para a identidade gerida (MSI) expirou.
    • A identidade gerida (MSI) do Purview precisa de contribuidor acesso à área de trabalho do Microsoft Fabric. Se o acesso contribuidor para o MSI do Microsoft Purview não tiver sido fornecido à área de trabalho do Microsoft Fabric, a análise da qualidade dos dados falhará.

Por que motivo estou a receber um erro de formato delta, apesar de estar a utilizar o formato delta?

  • Suportamos o Spark 3.4 Delta 2.4. Certifique-se de que está a utilizar a versão 2.4 do Delta Lake.

Por que motivo estou a ver o erro quando selecionei um recurso de dados de referência para configurar a regra de pesquisa de tabelas

  • O motivo é que selecionou um recurso de dados que não faz parte da ligação ou se referiu a um produto de dados no mesmo domínio de governação. Para selecionar o recurso de dados correto:
    • Clique em selecionar tabela de referência (veja a seguinte captura de ecrã)

      Captura de ecrã a mostrar o erro procurar recursos de dados.

    • Cancelar seleção atual (veja a captura de ecrã abaixo)

      Captura de ecrã a mostrar a seleção do recurso de dados correto.

    • Depois de cancelar a seleção atual, selecione outro recurso.

Como posso configurar o acesso à origem de dados para o Microsoft Purview MSI?

Todas as nossas origens de dados estão protegidas pelo ponto final privado (na vNet), o Purview pode aceder aos dados na vNet para análise da qualidade dos dados?

Onde posso encontrar uma boa documentação sobre a função de expressão para criar regras personalizadas?

Por que motivo a análise de DQ da tabela Fabric Lakehouse está a falhar?

  • O suporte do Mapa de dados do Purview para recursos de infraestrutura Lakehouse está em pré-visualização privada. Precisamos de listar o seu inquilino do Purview para o mapa de dados do Purview e o Fabric One Lake para ativar a análise de DQ da tabela Fabric Lakehouse com o DQ do Purview. Contacte a equipa da sua conta Microsoft para permitir a lista de permissões do seu inquilino para obter suporte do Fabric Lakehouse.