Como usar o editor de transcrição on-line

Artigo
10/16/2024

O editor de transcrição on-line permite que você crie ou edite transcrições de áudio + rotuladas por humanos para fala personalizada. Os principais casos de uso do editor são os seguintes:

Você só tem dados de áudio, mas deseja criar conjuntos de dados precisos de áudio + rotulados por humanos do zero para usar no treinamento de modelos.
Você já tem conjuntos de dados de áudio + etiquetados por humanos, mas há erros ou defeitos na transcrição. O editor permite que você modifique rapidamente as transcrições para obter a melhor precisão de treinamento.

O único requisito para usar o editor de transcrição é ter dados de áudio carregados, com ou sem transcrições correspondentes.

Você pode encontrar a guia Editor ao lado da guia Conjunto de dados de treinamento e teste na página principal Conjuntos de dados de fala.

Captura de ecrã da página Conjuntos de dados de voz que mostra o separador Editor.

Os conjuntos de dados na guia Conjunto de dados de treinamento e teste não podem ser atualizados. Você pode importar uma cópia de um conjunto de dados de treinamento ou teste para a guia Editor , adicionar ou editar transcrições rotuladas por humanos para corresponder ao áudio e, em seguida, exportar o conjunto de dados editado para a guia Conjunto de dados de treinamento e teste. Observe também que não é possível usar um conjunto de dados que esteja no Editor para treinar ou testar um modelo.

Importar conjuntos de dados para o Editor

Para importar um conjunto de dados para o Editor, siga estas etapas:

Inicie sessão no Speech Studio.
Selecione Fala> personalizada Seu nome> de projeto Editor de conjuntos de>dados de fala.
Selecione Importar dados
Selecione conjuntos de dados. Você pode selecionar apenas dados de áudio, áudio + dados rotulados por humanos, ou ambos. Para dados somente de áudio, você pode usar os modelos padrão para gerar automaticamente a transcrição da máquina após a importação para o editor.
Insira um nome e uma descrição para o novo conjunto de dados e selecione Avançar.
Reveja as suas definições e, em seguida, selecione Importar e fechar para iniciar o processo de importação. Depois que os dados forem importados com êxito, você poderá selecionar conjuntos de dados e começar a editar.

Nota

Você também pode selecionar um conjunto de dados na página principal Conjuntos de dados de fala e exportá-los para o Editor. Selecione um conjunto de dados e, em seguida, selecione Exportar para o Editor.

Editar transcrição para corresponder ao áudio

Depois que um conjunto de dados é importado para o Editor, você pode começar a editá-lo. Você pode adicionar ou editar transcrições rotuladas por humanos para corresponder ao áudio à medida que o ouve. Você não edita nenhum dado de áudio.

Para editar a transcrição de um conjunto de dados no Editor, siga estas etapas:

Inicie sessão no Speech Studio.
Selecione Fala> personalizada Seu nome> de projeto Editor de conjuntos de>dados de fala.
Selecione o link para um conjunto de dados por nome.
Na tabela Áudio + arquivos de texto, selecione o link para um arquivo de áudio pelo nome.
Depois de fazer edições, selecione Salvar.

Se houver vários arquivos no conjunto de dados, você poderá selecionar Anterior e Avançar para mover de arquivo para arquivo. Edite e guarde as alterações em cada ficheiro à medida que avança.

A página de detalhes lista todos os segmentos em cada arquivo de áudio, e você pode selecionar o enunciado desejado. Para cada enunciado, você pode reproduzir e comparar o áudio com a transcrição correspondente. Edite as transcrições se encontrar erros de inserção, exclusão ou substituição. Para obter mais informações sobre tipos de erro de palavras, consulte Modelo de teste quantitativamente.

Exportar conjuntos de dados do Editor

Os conjuntos de dados no Editor podem ser exportados para a guia Conjunto de dados de treinamento e teste, onde podem ser usados para treinar ou testar um modelo.

Para exportar conjuntos de dados do Editor, siga estas etapas:

Inicie sessão no Speech Studio.
Selecione Fala> personalizada Seu nome> de projeto Editor de conjuntos de>dados de fala.
Selecione o link para um conjunto de dados por nome.
Selecione uma ou mais linhas na tabela Áudio + arquivos de texto.
Selecione Exportar para exportar todos os arquivos selecionados como um novo conjunto de dados.

Os arquivos são exportados como um novo conjunto de dados e não afetam nem substituem outros conjuntos de dados de treinamento ou teste.

Partilhar via

Como usar o editor de transcrição on-line

Importar conjuntos de dados para o Editor

Editar transcrição para corresponder ao áudio

Exportar conjuntos de dados do Editor

Próximos passos

Comentários

Recursos adicionais