O que é a deteção de Informações de Identificação Pessoal (PII) na Linguagem de IA do Azure?
A deteção de PII é uma das funcionalidades oferecidas pela Azure AI Language, uma coleção de algoritmos de aprendizagem automática e IA na nuvem para desenvolver aplicações inteligentes que envolvem linguagem escrita. O recurso de deteção de PII pode identificar, categorizar e redigir informações confidenciais em texto não estruturado. Por exemplo: números de telefone, endereços de e-mail e formas de identificação. O Azure AI Language suporta a redação geral de PII de texto, bem como a PII de Conversação, um modelo especializado para lidar com transcrições de fala e o tom mais informal e conversacional de transcrições de reuniões e chamadas. O serviço também suporta a edição de PII de documento nativo, onde a entrada e a saída são arquivos de documentos estruturados.
Novidades
A API de visualização de deteção de PII de texto e PII conversacional (versão 2024-11-15-preview
) agora suporta a opção de mascarar entidades confidenciais detetadas com um rótulo além de apenas caracteres de redação. Os clientes têm a opção de especificar se o conteúdo de informações pessoalmente identificáveis, como nomes e números de telefone, ou seja, “John Doe received a call from 424-878-9192”
estão mascarados com um caráter de redação, ou seja “******** received a call from ************”
, ou mascarados com um rótulo de entidade, ou seja “[PERSON_1] received a call from [PHONENUMBER_1]”
, . Mais informações sobre como especificar o estilo da política de redação para suas saídas podem ser encontradas em nossos guias de instruções.
Os modelos de deteção de PII conversacional (versão 2024-11-01-preview
e GA
) foram atualizados para fornecer qualidade e precisão de IA aprimoradas. O tipo de entidade identificador numérico agora também inclui a Carteira de Motorista e o Identificador de Beneficiário do Medicare.
A partir de junho de 2024, agora fornecemos suporte de disponibilidade geral para o serviço de PII conversacional (somente em inglês). Os clientes agora podem redigir transcrições, bate-papos e outros textos escritos em um estilo de conversação (ou seja, texto com "um"s, "ah"s, vários alto-falantes e a ortografia das palavras para maior clareza) com melhor confiança na qualidade da IA, suporte ao SLA do Azure e suporte ao ambiente de produção e segurança de nível empresarial em mente.
Gorjeta
Experimente a deteção de PII no portal do Azure AI Foundry, onde pode utilizar um recurso do Language Studio atualmente existente ou criar um novo recurso do Azure AI Foundry
- Os guias de início rápido são instruções de introdução para guiá-lo ao fazer solicitações ao serviço.
- Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.
- Os artigos conceituais fornecem explicações detalhadas sobre a funcionalidade e os recursos do serviço.
Fluxo de trabalho típico
Para usar esse recurso, envie dados para análise e manipule a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem personalização adicional ao modelo usado em seus dados.
Crie um recurso de Linguagem de IA do Azure, que concede acesso aos recursos oferecidos pela Linguagem de IA do Azure. Ele gera uma senha (chamada de chave) e uma URL de ponto de extremidade que você usa para autenticar solicitações de API.
Crie uma solicitação usando a API REST ou a biblioteca de cliente para C#, Java, JavaScript e Python. Você também pode enviar chamadas assíncronas com uma solicitação em lote para combinar solicitações de API para vários recursos em uma única chamada.
Envie o pedido contendo os seus dados de texto. Sua chave e ponto de extremidade são usados para autenticação.
Transmita a resposta em fluxo ou armazene-a localmente.
Suporte nativo a documentos
Um documento nativo refere-se ao formato de arquivo usado para criar o documento original, como o Microsoft Word (docx) ou um arquivo de documento portátil (pdf). O suporte nativo a documentos elimina a necessidade de pré-processamento de texto antes de usar os recursos da Linguagem de IA do Azure. Atualmente, o suporte nativo a documentos está disponível para o recurso PiiEntityRecognition.
Atualmente , a PII suporta os seguintes formatos de documentos nativos:
Tipo de ficheiro | Extensão de nome de ficheiro | Description |
---|---|---|
Texto | .txt |
Um documento de texto não formatado. |
Adobe PDF | .pdf |
Um documento formatado em arquivo de documento portátil. |
Microsoft Word | .docx |
Um arquivo de documento do Microsoft Word. |
Para obter mais informações, consulte Usar documentos nativos para processamento de idiomas
Introdução à deteção de PII
Para usar a deteção de PII, envie texto para análise e manipule a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem personalização para o modelo usado em seus dados. Há duas maneiras de usar a deteção de PII:
Opção de desenvolvimento | Description |
---|---|
Estúdio de linguagem | O Language Studio é uma plataforma baseada na Web que permite que você tente vincular entidades com exemplos de texto sem uma conta do Azure e seus próprios dados quando você se inscreve. Para obter mais informações, consulte o site do Language Studio ou o início rápido do language studio. |
API REST ou biblioteca de cliente (SDK do Azure) | Integre a deteção de PII em seus aplicativos usando a API REST ou a biblioteca de cliente disponível em vários idiomas. Para obter mais informações, consulte o Guia de início rápido de deteção de PII. |
Documentação de referência e exemplos de código
À medida que você usa esse recurso em seus aplicativos, consulte a seguinte documentação de referência e exemplos para o Azure AI Language:
Opção de desenvolvimento / linguagem | Documentação de referência | Exemplos |
---|---|---|
API REST | Documentação da API REST | |
C# | Documentação em C# | Exemplos de C# |
Java | Documentação Java | Amostras Java |
JavaScript | Documentação do JavaScript | Exemplos de JavaScript |
Python | Documentação Python | Amostras de Python |
IA responsável
Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota de transparência para PII para saber mais sobre o uso e a implantação responsáveis de IA em seus sistemas. Para obter mais informações, consulte os seguintes artigos:
- Nota de transparência para a linguagem de IA do Azure
- Integração e utilização responsável
- Dados, privacidade e segurança
Cenários de exemplo
- Aplicar rótulos de sensibilidade - Por exemplo, com base nos resultados do serviço de PII, um rótulo de sensibilidade pública pode ser aplicado a documentos em que nenhuma entidade de PII é detetada. Para documentos em que endereços e números de telefone dos EUA são reconhecidos, uma etiqueta confidencial pode ser aplicada. Uma etiqueta altamente confidencial pode ser usada para documentos em que os números de roteamento bancário são reconhecidos.
- Redigir algumas categorias de informações pessoais de documentos que obtêm maior circulação - Por exemplo, se os registros de contato do cliente estiverem acessíveis aos representantes de suporte da linha de frente, a empresa pode redigir as informações pessoais do cliente além de seu nome da versão do histórico do cliente para preservar a privacidade do cliente.
- Redigir informações pessoais para reduzir o preconceito inconsciente - Por exemplo, durante o processo de revisão de currículo de uma empresa, eles podem bloquear nome, endereço e número de telefone para ajudar a reduzir o gênero inconsciente ou outros preconceitos.
- Substitua informações pessoais em dados de origem por aprendizado de máquina para reduzir injustiças – Por exemplo, se você quiser remover nomes que possam revelar gênero ao treinar um modelo de aprendizado de máquina, poderá usar o serviço para identificá-los e substituí-los por espaços reservados genéricos para treinamento de modelo.
- Remova informações pessoais da transcrição do call center – Por exemplo, se você quiser remover nomes ou outros dados de PII que acontecem entre o agente e o cliente em um cenário de call center. Você pode usar o serviço para identificá-los e removê-los.
- Limpeza de dados para ciência de dados - PII pode ser usada para preparar os dados para que cientistas e engenheiros de dados possam usar esses dados para treinar seus modelos de aprendizado de máquina. Redigir os dados para garantir que os dados do cliente não sejam expostos.
Próximos passos
Há duas maneiras de começar a usar o recurso de vinculação de entidade:
- Language Studio, que é uma plataforma baseada na Web que permite que você experimente vários recursos do serviço de linguagem sem precisar escrever código.
- O artigo de início rápido para obter instruções sobre como fazer solicitações ao serviço usando a API REST e o SDK da biblioteca de cliente.