Documentação de conversão de fala em texto
A Conversão de fala em texto do Serviço de Fala, também conhecida como reconhecimento de fala, permite a transcrição em tempo real e em lote de fluxos de áudio em texto. Com a entrada adicional de textos de referência, ela também permite a avaliação da pronúncia em tempo real e fornece comentários aos falantes sobre a precisão e a fluência do áudio falado.
Sobre a conversão de fala em texto
Visão geral
- O que é a conversão de fala em texto em tempo real?
- O que é a conversão de fala em texto em lote?
- O que é a Fala Personalizada?
- Usar a CLI de Fala para a conversão de fala em texto sem codificar
Início Rápido
Desenvolver com a conversão de fala em texto
Guia de Instruções
- Usar a API de transcrição rápida
- Criar um projeto de fala personalizada
- Treinar um modelo para Fala Personalizada
- Usar formatos de entrada de áudio compactados