Partilhar via


Legendas de imagens (versão 4.0)

As legendas de imagem no Image Analysis 4.0 estão disponíveis através das funcionalidades Caption e Dense Captions .

O recurso Legenda gera uma descrição de uma frase de todo o conteúdo da imagem. As legendas densas fornecem mais detalhes, gerando descrições de uma frase de até 10 regiões diferentes da imagem, além de descrever a imagem inteira. As legendas densas também retornam as coordenadas da caixa delimitadora das regiões de imagem descritas. Ambos os recursos usam os mais recentes modelos de IA baseados em Florença.

As legendas das imagens estão disponíveis apenas em inglês.

Importante

A legenda de imagem no Image Analysis 4.0 só está disponível em determinadas regiões do data center do Azure: consulte Disponibilidade de região. Você deve usar um recurso do Azure AI Vision localizado em uma dessas regiões para obter resultados dos recursos Legenda e Legendas Densas.

Se você precisar usar um recurso de Visão fora dessas regiões para gerar legendas de imagem, use a Análise de Imagem 3.2 , que está disponível em todas as regiões do Azure AI Vision.

Experimente os recursos de legendagem de imagens de forma rápida e fácil em seu navegador usando o Vision Studio.

Legendas neutras em termos de género

Por padrão, as legendas contêm termos de gênero ("homem", "mulher", "menino" e "menina"). Você tem a opção de substituir esses termos por "pessoa" em seus resultados e receber legendas neutras em termos de gênero. Você pode fazer isso definindo o parâmetro gender-neutral-caption de solicitação de API opcional como true na URL da solicitação.

Exemplos de legendas e legendas densas

A resposta JSON a seguir ilustra o que a API do Image Analysis 4.0 retorna ao descrever a imagem de exemplo com base em seus recursos visuais.

Foto de um homem apontando para uma tela

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Utilizar a API

O recurso de legendagem de imagem faz parte da API Analyze Image . Inclua Caption no parâmetro de consulta de recursos . Em seguida, quando você obtiver a resposta JSON completa, analise a cadeia de caracteres para o conteúdo da "captionResult" seção.

Próximos passos