Aumentar a precisão do classificador

Artigo
10/05/2024

Os classificadores, como tipos de informações confidenciais (SIT) e classificadores treináveis, são utilizados em vários tipos de políticas para identificar informações confidenciais. Como a maioria desses modelos, por vezes identificam um item como sendo sensível e não é. Em alternativa, podem não identificar um item como sendo sensível quando realmente é. Estes são denominados falsos positivos e falsos negativos.

Este artigo mostra-lhe como confirmar se os itens correspondidos por um classificador são verdadeiros positivos (uma Correspondência) ou falsos positivos (Não é uma correspondência) e fornecer feedback Match/Not a match . Pode utilizar esse feedback para otimizar os classificadores para aumentar a precisão. Também pode enviar versões redigidas do documento, bem como o feedback Corresponder, Não Corresponder à Microsoft se quiser ajudar a aumentar a precisão dos classificadores fornecidos pela Microsoft.

As experiências Corresponder, Não corresponder e Resumo Contextual estão disponíveis em:

Conteúdo Explorer - para sites do SharePoint, sites do OneDrive
Página Itens Correspondentes do Tipo de Informação Confidencial – para sites do SharePoint, sites do OneDrive
Página Itens Correspondentes do Classificador Treinável - para sites do SharePoint, sites do OneDrive
Prevenção Contra Perda de Dados do Microsoft Purview página alertas (DLP) – para sites do SharePoint, OneDrive e e-mails no Exchange
Página alertas do Microsoft Threat Protection (MTP) – para sites do SharePoint, sites do OneDrive e e-mails no Exchange

A experiência resumo contextual está disponível em:

Proteção de Informações do Microsoft Purview (MIP) Itens correspondentes à simulação de etiquetagem automática – para sites do SharePoint, sites do OneDrive

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de testes do portal de conformidade do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Aplicável a

Classificador	Resumo contextual	Painel de pré-visualização redigido	Corresponder e Não Corresponder
SIT	Sim	Sim	Sim
SIT Personalizado	Sim	Não	Sim
SIT com Impressão Digital	Não	Não	Sim
Correspondência exata de dados SIT	Não*	Não	Não
Entidades nomeadas	Não*	Não	Não
Análise de credenciais	Não	Não	Não
Classificadores Trainable incorporados	Sim**	Sim	Sim
Classificador treinável personalizado	Não	Não	Sim

* Estes classificadores são suportados em itens correspondentes de simulação de etiquetagem automática do MIP para sites do SharePoint e sites do OneDrive.

** Lista de classificadores Trainable Incorporados e que suportam resumo contextual.

Importante

A correspondência/não corresponde a comentários e à experiência de resumo contextual suporta itens em: sites do SharePoint & sites do OneDrive – para Explorer de Conteúdo, Tipo de Informação Confidencial e Itens Com Correspondência do Classificador Treinável, Alertas DLP e Alertas MTP. E-mails no Exchange – para Alertas DLP e Alertas MTP. A experiência de resumo contextual suporta itens em: sites do SharePoint e sites do OneDrive – para itens com correspondência de simulação MIP

Licenciamento e Subscrições

Para obter informações sobre o licenciamento e as subscrições relevantes, veja os requisitos de licenciamento para a Análise de classificação de dados: Descrição Geral & Atividade Explorer.

Limitações conhecidas

O resumo contextual mostra apenas um número limitado de correspondências em qualquer item, não em todas as correspondências.
O resumo contextual e a experiência de feedback só estão disponíveis para itens criados ou atualizados após a experiência de feedback ter sido ativada para o inquilino. Os itens que foram classificados antes da funcionalidade ter sido ativada podem não ter o resumo contextual e a experiência de feedback disponível.

Como avaliar a precisão da correspondência e fornecer comentários

A experiência de resumo contextual, onde indica se um item correspondente é um verdadeiro positivo (Correspondência) ou um falso positivo (Não é uma correspondência), é semelhante em todos os locais onde aparece.

Importante

Já tem de implementar políticas DLP que utilizem SITs ou classificadores treináveis em sites do OneDrive, sites do SharePoint ou caixas de correio do Exchange. Também tem de ter itens correspondentes antes de quaisquer itens aparecerem na página Resumo contextual .

Utilizar Explorer de Conteúdo

Este exemplo mostra-lhe como utilizar o separador Resumo Contextual para dar feedback.

Abra a página portal de conformidade do Microsoft Purview Data classificationContent explorer (Explorador de conteúdos da classificação > de dados>).
Escreva o nome do classificador SIT ou treinável para o qual pretende marcar correspondências em Filtrar em etiquetas, tipos de informações ou categorias.
Selecione o sit.
Selecione a localização e certifique-se de que existe um valor diferente de zero na coluna Ficheiros . (As únicas localizações suportadas são o SharePoint e o OneDrive.)
Abra a pasta e, em seguida, selecione um documento.
Selecione a ligação na coluna Tipo de informações confidenciais do documento para ver que SITs correspondem ao item e o nível de confiança.
Selecione Fechar
Abra um documento e selecione o separador Resumo Contextual .
Reveja o item e confirme se é ou não uma correspondência.
Se for uma correspondência, selecione Fechar. Terminou.
Se não for uma correspondência, selecione Não é uma correspondência.
Se cometer um erro e escolher a opção errada, selecione Retirar feedback junto a Fechar. Esta ação volta a colocar o item no estado Não corresponde/ aCorrespondência.
Reveja o item e redigir ou anular a redacção de qualquer texto.
Escolha Fechar.

Página Utilizar Itens Correspondentes do Tipo de Informação Confidencial

Pode aceder aos mesmos mecanismos de feedback na página tipos de Informações Confidenciais .

Abra o portal de conformidade do Microsoft Purview e navegue para Classificação> de dadosClassificação de>dados Tipos de informações confidenciais.
No campo Procurar, introduza o nome do SIT cuja precisão pretende marcar.
Abra o SIT. Esta ação apresenta o separador Descrição geral . Aqui, pode ver a contagem do número de itens correspondentes, uma contagem do número de itens que não correspondem e o número de itens com comentários.
Selecione o separador Itens correspondentes .
Abra a pasta e selecione um documento. Apenas o SharePoint, o OneDrive são localizações suportadas aqui. Certifique-se de que existe um valor diferente de zero na coluna Ficheiros .
Selecione a ligação na coluna Tipo de informações confidenciais para um item para ver que SITs correspondem ao item e o nível de confiança.
Escolha Fechar.
Abra um documento e, em seguida, selecione o separador Resumo Contextual .
Reveja o item e confirme se é uma correspondência.
Se for uma correspondência, selecione Corresponder e, em seguida , Fechar.
Se não for uma correspondência, selecione **Não é uma Correspondência ****
Se cometer um erro e selecionar a opção errada, selecione Retirar feedback junto a Fechar. Esta ação volta a colocar o item no estado Não corresponde/ aCorrespondência.
Escolha Fechar.

Utilizar a página Itens Correspondentes do Classificador Treinável

Abra o portal de conformidade do Microsoft Purview e navegue para Classificadores de classificação> de dadosClassificadores>Treináveis.
Selecione o classificador treinável cuja precisão pretende marcar.
Abra o classificador treinável. Esta ação apresenta o separador Descrição geral . Aqui, pode ver a contagem do número de itens correspondentes, uma contagem do número de itens que não correspondem e o número de itens com comentários.
Selecione o separador Itens correspondentes .
Abra a pasta e abra um documento. Apenas o SharePoint, o OneDrive são localizações suportadas aqui. Certifique-se de que existe um valor diferente de zero na coluna Ficheiros .
Abra um documento e, em seguida, selecione o separador Resumo Contextual .
Reveja o item e confirme se é uma correspondência.
Se for uma correspondência, selecione Corresponder e, em seguida, selecione Fechar.
Se não for uma correspondência, selecione **Não é uma Correspondência ****
Se cometer um erro e selecionar a opção errada, selecione Retirar feedback junto a Fechar. Esta ação volta a colocar o item no estado Não corresponde/ aCorrespondência.
Escolha Fechar.

Página Utilizar Alertas de Prevenção de Perda de Dados

Abra o portal de conformidade do Microsoft Purview e navegue para a páginaAlertas de prevenção> de perda de dados.
Escolha um alerta.
Selecione Ver detalhes.
Selecione o separador Eventos .
Maximize o separador Detalhes .
Reveja o item e confirme se é uma correspondência.
Selecione Ações.
Se for uma correspondência, feche a janela. Terminou.
Se não for uma correspondência, selecione Ações e, em seguida , Não corresponde.
Reveja o item e redigir ou anular a redacção de qualquer texto.
Feche a janela.

Utilizar os comentários para otimizar os classificadores

Se os seus SITs ou classificadores treináveis estiverem a devolver demasiados falsos positivos com base no feedback, experimente algumas destas opções para os refinar e aumentar a precisão.

Classificadores de treinamento

A nova preparação de classificadores personalizados já não é suportada. Se precisar de melhorar a precisão dos classificadores treináveis que criou, remova o classificador e comece de novo com conjuntos de exemplo maiores. Para obter mais informações, consulte Introdução aos classificadores treináveis.

Tipos de informações confidenciais

Aumente os limiares dos tipos de informações confidenciais encontrados para determinar a gravidade. Não há problema em utilizar limiares diferentes para classificadores individuais.
Compreenda os níveis de confiança e como são definidos. Experimente utilizar uma confiança baixa com uma contagem de instâncias elevada ou um nível de confiança superior com uma contagem de instâncias baixa.
Clone e modifique os SITs incorporados para incluir outras condições, tais como as presenças de palavras-chave, correspondência de valores mais rigorosa ou requisitos de formatação mais fortes.
Modifique um SIT personalizado para excluir prefixos, sufixos ou padrões conhecidos. Por exemplo, um SIT personalizado para detetar números de telefone pode ser acionado para cada e-mail se as suas assinaturas de e-mail ou cabeçalhos de documento incluírem números de telefone. Excluir as sequências de números de telefone da sua organização do SIT personalizado pode impedir que a regra seja acionada para cada e-mail ou documento.
Inclua mais SITs baseados no dicionário como condições para restringir as correspondências aos itens que falam sobre os artigos relevantes. Por exemplo, uma regra para corresponder a diagnóstico do paciente pode ser melhorada ao exigir a presença de palavras como diagnóstico, diagnóstico, condição, sintoma e paciente.
Para SITs de entidade nomeada, como Todos os Nomes Completos, é melhor definir um limiar de contagem de instâncias mais elevado, como 10 ou 50. Se os nomes das pessoas e os Números de Segurança Social (SSNs) forem detetados em conjunto, é mais provável que os SSNs sejam realmente SSNs e reduzamos o risco de a política não ser acionada porque são detetados poucos SSNs.

Compartilhar via