Compreensão de conteúdo de soluções de áudio (visualização)

Artigo
11/23/2024

Importante

O Entendimento de Conteúdo do Azure AI está disponível na visualização. As versões de visualização pública fornecem acesso antecipado a recursos que estão em desenvolvimento ativo.
Recursos, abordagens e processos podem mudar ou ter recursos restritos, antes da Disponibilidade Geral (GA).
Para obter mais informações, consulte Termos de uso suplementares para visualizações do Microsoft Azure.

Os analisadores de áudio de Compreensão de Conteúdo permitem a transcrição e diarização de áudio conversacional, extraindo campos estruturados, como resumos, sentimentos e tópicos-chave. Personalize um modelo de analisador de áudio de acordo com as necessidades da sua empresa usando o portal do Azure AI Foundry para começar a gerar resultados.

Aqui estão cenários comuns para usar o Entendimento de Conteúdo com dados de áudio conversacionais:

Obtenha insights do cliente por meio de sumarização e análise de sentimento.
Avaliar e verificar a qualidade e conformidade das chamadas em call centers.
Crie resumos e metadados automatizados para publicação de podcasts.

Recursos do analisador de áudio

O Entendimento de Conteúdo serve como uma pedra angular para as soluções de Gerenciamento de Ativos de Mídia, permitindo os seguintes recursos para arquivos de áudio:

Extração de conteúdo

Transcrição. Converte áudio conversacional em transcrições baseadas em texto pesquisáveis e analisáveis no formato WebVTT. Campos personalizáveis podem ser gerados a partir de dados de transcrição. Carimbos de data/hora no nível da frase e da palavra estão disponíveis mediante solicitação.
Diarization. Distingue entre oradores numa conversa, atribuindo partes da transcrição a oradores específicos.
Deteção de função de alto-falante. Identifica as funções do agente e do cliente nos dados de chamada do contact center.
Deteção de idioma. Deteta automaticamente o idioma no áudio ou usa dicas de idioma/localidade especificadas.

Extração de campo

A extração de campo permite extrair dados estruturados de arquivos de áudio, como resumos, sentimentos e entidades mencionadas de registros de chamadas. Você pode começar personalizando um modelo de analisador sugerido ou criando um do zero.

Principais Vantagens

O Content Understanding oferece recursos avançados de áudio, incluindo:

Extração de dados personalizável. Adapte a saída às suas necessidades específicas, modificando o esquema de campo, permitindo a geração e extração de dados precisas.
Modelos generativos. Utilize modelos de IA generativa para especificar em linguagem natural o conteúdo que você deseja extrair e o serviço gera a saída desejada.
Pré-processamento integrado. Beneficie-se das etapas de pré-processamento integradas, como transcrição, diarização e deteção de funções, fornecendo contexto rico para modelos generativos.
Adaptabilidade de cenários. Adapte o serviço às suas necessidades, gerando campos personalizados e extraindo dados relevantes.

Noções básicas de conteúdo: modelos de analisador de áudio

O Content Understanding oferece modelos personalizáveis de analisador de áudio:

Análise pós-chamada. Analise gravações de chamadas para gerar transcrições de conversas, resumos de chamadas, avaliações de sentimento e muito mais.
Análise de conversação. Gere transcrições, resumos e avaliações de sentimento a partir de gravações de áudio de conversas.

Comece com um modelo ou crie um analisador personalizado para atender às suas necessidades específicas de negócios.

Requisitos de entrada

Para obter uma lista detalhada dos formatos de áudio suportados, consulte a nossa página Limites de serviço e codecs .

Idiomas e regiões suportados

Para obter uma lista completa das regiões, idiomas e localidades suportados, consulte a nossa página Suporte a idiomas e regiões.

Privacidade e segurança dos dados

Os programadores que utilizam a Compreensão de Conteúdos devem rever as políticas da Microsoft sobre os dados dos clientes. Para mais informações, visite a nossa página Dados, proteção e privacidade .

Próximos passos

Tente processar seu conteúdo de áudio usando o Entendimento de Conteúdo no portal do Azure AI Foundry.
Saiba mais sobre modelos de analisadores de áudio.

Partilhar via