Deteção de rosto, atributos e dados de entrada

Artigo
10/21/2024

Atenção

O acesso ao serviço presencial é limitado com base em critérios de elegibilidade e uso, a fim de apoiar nossos princípios de IA responsável. O serviço Face só está disponível para clientes e parceiros geridos pela Microsoft. Use o formulário de admissão de Reconhecimento Facial para solicitar acesso. Para obter mais informações, consulte a página Acesso limitado Face.

Importante

Os atributos faciais são previstos através do uso de algoritmos estatísticos. Podem nem sempre ser precisas. Tenha cuidado ao tomar decisões com base em dados de atributos. Por favor, evite usar esses atributos para anti-falsificação. Em vez disso, recomendamos o uso da deteção de vivacidade facial. Para obter mais informações, consulte Tutorial : Detetar vivacidade em rostos.

Este artigo explica os conceitos de deteção de rosto e dados de atributos faciais. A deteção de rosto é o processo de localizar rostos humanos em uma imagem e, opcionalmente, retornar diferentes tipos de dados relacionados ao rosto.

Use a API de deteção para detetar rostos em uma imagem. Para começar a usar a API REST ou um SDK de cliente, siga um início rápido do serviço Face. Ou, para obter um guia mais detalhado, consulte Chamar a API de deteção.

Retângulo facial

Cada face detetada corresponde a um campo faceRectangle na resposta. Este é um conjunto de coordenadas de pixel para a esquerda, topo, largura e altura da face detetada. Usando essas coordenadas, você pode obter a localização e o tamanho do rosto. Na resposta da API, os rostos são listados em ordem de tamanho, do maior para o menor.

Experimente os recursos de deteção de rosto de forma rápida e fácil usando o Azure AI Vision Studio.

Experimente o Vision Studio

ID do rosto

O ID do rosto é uma cadeia de caracteres de identificador exclusivo para cada face detetada em uma imagem. O Face ID requer aprovação de acesso limitado, que você pode solicitar preenchendo o formulário de admissão. Para obter mais informações, consulte a página Acesso limitado da API do Face. Você pode solicitar um ID de rosto em sua chamada de API de deteção .

Pontos de referência do rosto

Pontos de referência faciais são um conjunto de pontos fáceis de encontrar em um rosto, como as pupilas ou a ponta do nariz. Por predefinição, existem 27 pontos de referência predefinidos. A figura a seguir mostra todos os 27 pontos:

Diagrama de um rosto com todos os 27 pontos de referência marcados.

As coordenadas dos pontos são retornadas em unidades de pixels.

O modelo Detection_03 atualmente tem a deteção de marco mais precisa. Os pontos de referência do olho e da pupila que ele retorna são precisos o suficiente para permitir o rastreamento do olhar do rosto.

Atributos

Atenção

A Microsoft aposentou ou limitou os recursos de reconhecimento facial que podem ser usados para tentar inferir estados emocionais e atributos de identidade que, se usados indevidamente, podem sujeitar as pessoas a estereótipos, discriminação ou negação injusta de serviços. As capacidades aposentadas são a emoção e o género. As capacidades limitadas são idade, sorriso, pelos faciais, cabelo e maquilhagem. Envie um e-mail para a API do Azure Face se você tiver um caso de uso responsável que se beneficiaria do uso de qualquer um dos recursos limitados. Leia mais sobre esta decisão aqui.

Os atributos são um conjunto de recursos que podem ser detetados opcionalmente pela API de deteção . Os seguintes atributos podem ser detetados:

Acessórios: Indica se o rosto dado tem acessórios. Este atributo devolve possíveis acessórios, incluindo chapéus, óculos e máscara, com uma pontuação de confiança entre zero e um para cada acessório.
Desfoque: indica a desfocagem do rosto na imagem. Esse atributo retorna um valor entre zero e um e uma classificação informal de baixo, médio ou alto.
Exposição: Indica a exposição do rosto na imagem. Esse atributo retorna um valor entre zero e um e uma classificação informal de underExposure, goodExposure ou overExposure.
Óculos: Indica se o rosto dado tem óculos. Os valores possíveis são NoGlasses, ReadingGlasses, Sunglasses e Swimming Goggles.
Pose da cabeça: Indica a orientação do rosto no espaço 3D. Este atributo é descrito pelos ângulos de rolagem, bocejo e passo em graus, que são definidos de acordo com a regra da mão direita. A ordem dos três ângulos é roll-yaw-pitch, e o intervalo de valores de cada ângulo é de -180 graus a +180 graus. A orientação 3D da face é estimada pelos ângulos de rolo, bocejo e passo em ordem. Consulte o diagrama a seguir para mapeamentos angulares:

Para obter mais informações sobre como usar esses valores, consulte Usar o atributo HeadPose.
Máscara: Indica se o rosto está usando máscara. Esse atributo retorna um possível tipo de máscara e um valor booleano para indicar se o nariz e a boca estão cobertos.
Ruído: Indica o ruído visual detetado na imagem do rosto. Esse atributo retorna um valor entre zero e um e uma classificação informal de baixo, médio ou alto.
Oclusão: Indica se há objetos bloqueando partes do rosto. Este atributo retorna um valor booleano para eyeOccluded, foreheadOcclud, e mouthOccluded.
QualityForRecognition: Indica a qualidade geral da imagem para determinar se a imagem que está sendo usada na deteção é de qualidade suficiente para tentar o reconhecimento facial. O valor é uma classificação informal de baixo, médio ou alto. Apenas imagens de alta qualidade são recomendadas para inscrição de pessoas, e a qualidade igual ou melhor do que a média é recomendada para cenários de identificação.

Nota

A disponibilidade de cada atributo depende do modelo de deteção especificado. O atributo QualityForRecognition também depende do modelo de reconhecimento, pois atualmente só está disponível quando se usa uma combinação de detection_01 ou detection_03 do modelo de deteção e recognition_03 ou recognition_04 do modelo de reconhecimento.

Requisitos de entrada

Use as seguintes dicas para garantir que suas imagens de entrada forneçam os resultados de deteção mais precisos:

Os formatos de imagem de entrada suportados são JPEG, PNG, GIF (o primeiro quadro), BMP.
O tamanho do arquivo de imagem não deve ser maior que 6 MB.

O tamanho mínimo detetável da face é de 36 x 36 pixels em uma imagem que não é maior do que 1920 x 1080 pixels. Imagens com mais de 1920 x 1080 pixels têm um tamanho mínimo de rosto proporcionalmente maior. Reduzir o tamanho do rosto pode fazer com que alguns rostos não sejam detetados, mesmo que sejam maiores do que o tamanho mínimo detetável do rosto.
O tamanho máximo detetável do rosto é de 4096 x 4096 pixels.
Rostos fora da faixa de tamanho de 36 x 36 a 4096 x 4096 pixels não serão detetados.

Dados de entrada com informações de orientação

Algumas imagens de entrada com formato JPEG podem conter informações de orientação em metadados EXIF (formato de arquivo de imagem intercambiável). Se a orientação EXIF estiver disponível, as imagens são automaticamente giradas para a orientação correta antes de serem enviadas para deteção facial. O retângulo facial, os pontos de referência e a pose da cabeça para cada rosto detetado são estimados com base na imagem girada.

Para exibir corretamente o retângulo facial e os pontos de referência, você precisa se certificar de que a imagem está girada corretamente. A maioria das ferramentas de visualização de imagem gira automaticamente a imagem de acordo com sua orientação EXIF por padrão. Para outras ferramentas, talvez seja necessário aplicar a rotação usando seu próprio código. Os exemplos a seguir mostram um retângulo facial em uma imagem girada (esquerda) e uma imagem não girada (direita).

Captura de tela de duas imagens de rosto com e sem rotação.

Entrada de vídeo

Se estiver a detetar rostos a partir de um feed de vídeo, poderá melhorar o desempenho ajustando determinadas definições na câmara de vídeo:

Suavização: Muitas câmeras de vídeo aplicam um efeito de suavização. Você deve desativar isso se puder, porque cria um desfoque entre quadros e reduz a clareza.
Velocidade do obturador: Uma velocidade do obturador mais rápida reduz a quantidade de movimento entre quadros e torna cada quadro mais claro. Recomendamos velocidades do obturador de 1/60 segundo ou mais rápidas.
Ângulo do obturador: algumas câmaras especificam o ângulo do obturador em vez da velocidade do obturador. Você deve usar um ângulo do obturador mais baixo, se possível, o que resulta em quadros de vídeo mais claros.

Nota

Um sensor de câmara com um ângulo do obturador mais baixo recebe menos luz em cada fotograma, pelo que a imagem é mais escura. Você precisa determinar o nível certo para usar.

Próximo passo

Agora que você está familiarizado com os conceitos de deteção de rosto, aprenda a escrever um script que deteta rostos em uma determinada imagem.

Chamar a API de deteção

Partilhar via