Categorias personalizadas (versão prévia)

Artigo
10/30/2024

A Segurança de Conteúdo de IA do Azure permite que você crie e gerencie suas próprias categorias de moderação de conteúdo para moderação e filtragem aprimoradas que correspondam às suas políticas ou casos de uso específicos.

Tipos de personalização

Há várias maneiras de definir e usar categorias personalizadas, que são detalhadas e comparadas nesta seção.

API	Funcionalidade
API de categorias personalizadas (padrão)	Use um modelo de aprendizado de máquina personalizável para criar, obter, consultar e excluir uma categoria personalizada. Ou liste todas as suas categorias personalizadas para outras tarefas de anotação.
API de categorias personalizadas (rápidas)	Use um LLM (modelo de linguagem grande) para aprender rapidamente padrões de conteúdo específicos em incidentes de conteúdo emergentes.

API de categorias personalizadas (padrão)

A API de categorias personalizadas (padrão) permite que os clientes definam categorias específicas para suas necessidades, forneçam dados de amostra, treinem um modelo de aprendizado de máquina personalizado e o usem para classificar novos conteúdos de acordo com as categorias aprendidas.

Esse é o fluxo de trabalho padrão para personalização com modelos de aprendizado de máquina. Dependendo da qualidade dos dados de treinamento, ele pode atingir níveis de desempenho muito bons, mas pode levar várias horas para treinar o modelo.

Essa implementação funciona no conteúdo de texto, não no conteúdo de imagem.

API de categorias personalizadas (rápida)

A API de categorias personalizadas (rápidas) foi projetada para ser mais rápida e flexível do que o método padrão. Destina-se a ser usado para identificar, analisar, conter, erradicar e recuperar de incidentes cibernéticos que envolvem conteúdo impróprio ou prejudicial em plataformas online.

Um incidente pode envolver um conjunto de padrões de conteúdo emergentes (texto, imagem ou outras modalidades) que violam as diretrizes da comunidade da Microsoft ou as próprias políticas e expectativas dos clientes. Esses incidentes precisam ser mitigados de forma rápida e precisa para evitar possíveis problemas ao vivo ou danos a usuários e comunidades.

Essa implementação funciona em conteúdo de texto e conteúdo de imagem.

Dica

Uma maneira de lidar com incidentes de conteúdo emergente é usar listas de bloqueio, mas isso só permite correspondência exata de texto e nenhuma correspondência de imagem. A API de categorias personalizadas (rápidas) oferece os seguintes recursos avançados:

correspondência de texto semântico usando a pesquisa de inserção com um classificador leve
correspondência de imagem com um modelo leve de acompanhamento de objetos e pesquisa de inserção.

Como ele funciona

API de categorias personalizadas (padrão)
API de categorias personalizadas (rápidas)

O recurso de categoria personalizada da Segurança de Conteúdo de IA do Azure usa um processo de várias etapas para criar, treinar e usar modelos de classificação de conteúdo personalizados. Aqui está uma olhada no fluxo de trabalho:

Etapa 1: Definição e configuração

Ao definir uma categoria personalizada, você precisa ensinar à IA que tipo de conteúdo deseja identificar. Isso envolve fornecer um nome de categoria claro e uma definição detalhada que encapsule as características do conteúdo.

Em seguida, você coleta um conjunto de dados equilibrado com exemplos positivos e (opcionalmente) negativos para ajudar a IA a aprender as nuances de sua categoria. Esses dados devem ser representativos da variedade de conteúdo que o modelo encontrará em um cenário do mundo real.

Etapa 2: Treinamento do modelo

Depois de preparar seu conjunto de dados e definir categorias, o serviço de Segurança de Conteúdo de IA do Azure treina um novo modelo de aprendizado de máquina. Esse modelo usa suas definições e o conjunto de dados carregado para executar o aumento de dados usando um modelo de linguagem grande. Como resultado, o conjunto de dados de treinamento é maior e de maior qualidade. Durante o treinamento, o modelo de IA analisa os dados e aprende a diferenciar entre o conteúdo que se alinha com a categoria especificada e o conteúdo que não se alinha.

Etapa 3: Inferência de modelo

Após o treinamento, você precisa avaliar o modelo para garantir que ele atenda aos seus requisitos de precisão. Teste o modelo com novo conteúdo que ele não recebeu antes. A fase de avaliação ajuda a identificar possíveis ajustes necessários para implantar o modelo em um ambiente de produção.

Etapa 4: Uso do modelo

Use a API analyzeCustomCategory para analisar o conteúdo do texto e determinar se ele corresponde à categoria personalizada que você definiu. O serviço retornará um booliano indicando se o conteúdo está alinhado com a categoria especificada

Limitações

Disponibilidade do idioma

As APIs de categorias personalizadas são compatíveis com todos os idiomas compatíveis com a moderação de texto da Segurança de conteúdo. Confira Suporte a linguagens.

Limitações de entrada

API de categorias personalizadas (padrão)
API de categorias personalizadas (rápidas)

Consulte a tabela a seguir para obter as limitações de entrada da API de categorias personalizadas (padrão):

Objeto	Limitação
Idiomas com suporte	Somente inglês
Número de categorias por usuário	3
Número de versões por categoria	3
Número de compilações simultâneas (processos) por categoria	1
Operações de inferência por segundo	5
Número de amostras em uma versão de categoria	Amostras positivas (obrigatórias): mínimo 50, máximo 5K No total (amostras negativas e positivas): 10K Não são permitidas amostras duplicadas.
Tamanho do arquivo de amostra	máximo de 128000 bytes
Comprimento de uma amostra de texto	máximo de 125 mil caracteres
Comprimento de uma definição de categoria	máximo de 1000 caracteres
Comprimento de um nome de categoria	máximo de 128 caracteres
Comprimento de uma URL de blob	máximo de 500 caracteres

Consulte a tabela a seguir para obter as limitações de entrada da API de categorias personalizadas (rápida):

Objeto	Limitação
Comprimento máximo de um nome de incidente	100 caracteres
Número máximo de amostras de texto/imagem por incidente	1000
Tamanho máximo de cada amostra	Texto: 500 caracteres Imagem: 4 MB
Número máximo de incidentes de texto ou imagem por recurso	100
Formatos de imagem com suporte	BMP, GIF, JPEG, PNG, TIF, WEBP

Disponibilidade de região

Para usar essas APIs, você deve criar seu recurso de Segurança de Conteúdo de IA do Azure em uma das regiões com suporte. Confira a Disponibilidade de região.

Próximas etapas

Siga um guia de instruções para usar as APIs de segurança de conteúdo de IA do Azure para criar categorias personalizadas.

Compartilhar via