Partilhar via


Acessar dados compartilhados com você usando o Delta Sharing (para destinatários)

Este artigo mostra como acessar dados que foram compartilhados com você usando o Delta Sharing.

Compartilhamento Delta e destinatários de dados

O Delta Sharing é um padrão aberto para compartilhamento seguro de dados. Um usuário do Databricks, conhecido como um provedor de dados neste contexto, pode usar o Compartilhamento Delta no Azure Databricks para compartilhar dados com uma pessoa ou grupo fora de sua organização, chamado de destinatário de dados.

Compartilhamento de Databricks para Databricks e compartilhamento aberto

A forma como você acessa os dados depende se você mesmo é um usuário do Databricks e se seu provedor de dados configurou ou não os dados que estão sendo compartilhados com você para compartilhamento de Databricks para Databricks ou compartilhamento aberto.

No modelo Databricks-to-Databricks, você deve ser um usuário em um espaço de trabalho Databricks habilitado para o Unity Catalog. Um membro da sua equipe fornece ao provedor de dados um identificador exclusivo para o metastore do Unity Catalog, e o provedor de dados usa isso para criar uma conexão de compartilhamento segura. Os dados compartilhados ficam disponíveis para acesso em seu espaço de trabalho. Se necessário, um membro da sua equipe configura o controle de acesso granular nesses dados.

No modelo de compartilhamento aberto, você pode usar qualquer ferramenta que desejar (incluindo Databricks) para acessar os dados compartilhados. O fornecedor de dados envia-lhe um URL de ativação através de um canal seguro. Segue-o para transferir um ficheiro de credenciais que lhe permite aceder aos dados partilhados consigo.

Os dados compartilhados não são fornecidos diretamente pelo Databricks, mas por provedores de dados em execução no Azure Databricks.

Nota

A Databricks pode coletar informações sobre o uso e o acesso dos destinatários dos dados aos dados compartilhados (incluindo a identificação de qualquer indivíduo ou empresa que acesse os dados usando o arquivo de credenciais em conexão com essas informações) e pode compartilhá-las com o provedor de dados aplicável.

Tenha acesso aos dados partilhados consigo

A forma como acede aos dados depende se o seu fornecedor de dados partilhou dados consigo utilizando o protocolo de partilha aberto ou o protocolo de partilha Databricks-to-Databricks. Consulte Compartilhamento de Databricks para Databricks e compartilhamento aberto.

Obtenha acesso no modelo Databricks-to-Databricks

No modelo Databricks-to-Databricks:

  1. O provedor de dados envia instruções para localizar um identificador exclusivo para o metastore do Unity Catalog associado ao seu espaço de trabalho Databricks e você o envia para eles.

    O identificador de compartilhamento é uma cadeia de caracteres que consiste na nuvem, região e UUID (o identificador exclusivo do metastore), no formato <cloud>:<region>:<uuid>. Por exemplo, aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    Para obter o identificador de compartilhamento usando o Gerenciador de Catálogos:

    1. No seu espaço de trabalho do Azure Databricks, clique em Ícone do catálogo Catálogo.

    2. Na parte superior do painel Catálogo, clique noÍcone de engrenagem ícone de engrenagem e selecione Compartilhamento Delta.

      Como alternativa, na página Acesso rápido , clique no botão Compartilhamento Delta > .

      1. Na guia Compartilhado comigo, clique no nome da organização de compartilhamento do Databricks no canto superior direito e selecione Copiar identificador de compartilhamento.

    Para obter o identificador de compartilhamento usando um bloco de anotações ou uma consulta SQL do Databricks, use a função CURRENT_METASTORESQL padrão. Se você usar um bloco de anotações, ele deverá ser executado em um cluster de usuário compartilhado ou único no espaço de trabalho que você usará para acessar os dados compartilhados.

    SELECT CURRENT_METASTORE();
    
  2. O provedor de dados cria:

    • Um destinatário em sua conta Databricks para representar você e os usuários em sua organização que acessarão os dados.
    • Um compartilhamento, que é uma representação das tabelas, volumes e exibições a serem compartilhados com você.
  3. Você acessa os dados compartilhados com você. Você ou alguém da sua equipe pode, se necessário, configurar o acesso a dados granulares nesses dados para seus usuários. Consulte Ler dados compartilhados usando o compartilhamento delta de Databricks para Databricks (para destinatários).

Obtenha acesso no modelo de compartilhamento aberto

No modelo de partilha aberta:

  1. O provedor de dados cria:

    • Um destinatário em sua conta Databricks para representar você e os usuários em sua organização que acessarão os dados. Um token e um arquivo de credenciais são gerados como parte dessa configuração.
    • Um compartilhamento, que é uma representação das tabelas e partições a serem compartilhadas com você.
  2. O fornecedor de dados envia-lhe um URL de ativação através de um canal seguro. Segue-o para transferir um ficheiro de credenciais que lhe permite aceder aos dados partilhados consigo.

    Importante

    Não compartilhe o link de ativação com ninguém. Você pode baixar um arquivo de credenciais apenas uma vez. Se você visitar o link de ativação novamente depois que o arquivo de credenciais já tiver sido baixado, o botão Baixar arquivo de credenciais será desativado.

    Se você perder o link de ativação antes de usá-lo, entre em contato com o provedor de dados.

  3. Armazene o arquivo de credenciais em um local seguro.

    Não compartilhe o arquivo de credenciais com ninguém fora do grupo de usuários que deve ter acesso aos dados compartilhados. Se você precisar compartilhá-lo com alguém em sua organização, o Databricks recomenda o uso de um gerenciador de senhas.

Ler os dados partilhados

A forma como você lê os dados que foram compartilhados com segurança com você usando o Compartilhamento Delta depende se você recebeu um arquivo de credenciais (o modelo de compartilhamento aberto) ou se está usando um espaço de trabalho Databricks e forneceu ao provedor de dados seu identificador de compartilhamento (o modelo Databricks para Databricks).

Ler dados compartilhados usando um arquivo de credenciais (compartilhamento aberto)

Se os dados tiverem sido compartilhados com você usando o protocolo de compartilhamento aberto Delta Sharing, use o arquivo de credenciais baixado para autenticar na conta Databricks do provedor de dados e ler os dados compartilhados. O acesso persiste enquanto o token subjacente for válido e o provedor continuar a compartilhar os dados. Os provedores gerenciam a expiração e a rotação do token. As atualizações dos dados estão disponíveis para você quase em tempo real. Você pode ler e fazer cópias dos dados compartilhados, mas não pode modificar os dados de origem.

Para saber como acessar e ler dados compartilhados usando o arquivo de credenciais no Azure Databricks, Apache Spark, pandas e Power BI, consulte Ler dados compartilhados usando o compartilhamento aberto do Delta Sharing (para destinatários).

Ler dados compartilhados usando o compartilhamento de Databricks para Databricks

Se os dados tiverem sido compartilhados com você usando o modelo Databricks-to-Databricks, nenhum arquivo de credencial será necessário para acessar os dados compartilhados. O Databricks cuida da conexão segura e os dados compartilhados são automaticamente detetáveis em seu espaço de trabalho Databricks.

Para saber como localizar, ler e gerenciar esses dados compartilhados em seu espaço de trabalho Databricks, consulte Ler dados compartilhados usando o compartilhamento delta de Databricks para Databricks (para destinatários).

Auditar o uso de dados compartilhados

Se você tiver acesso a um espaço de trabalho do Azure Databricks, poderá usar os logs de auditoria do Azure Databricks para entender quem em sua organização está acessando quais dados usando o Compartilhamento Delta. Consulte Auditar e monitorar o compartilhamento de dados.

Próximos passos