Rotular imagens e documentos de texto

Artigo
10/16/2024

Depois que o administrador do projeto cria um projeto de rotulagem de dados de imagem do Aprendizado de Máquina do Azure ou um projeto de rotulagem de dados de texto do Aprendizado de Máquina do Azure, você pode usar a ferramenta de rotulagem para preparar dados rapidamente para um projeto do Aprendizado de Máquina. Este artigo descreve:

Como aceder aos seus projetos de etiquetagem
As ferramentas de rotulagem
Como usar as ferramentas para tarefas específicas de rotulagem

Pré-requisitos

Uma conta da Microsoft, ou uma conta do Microsoft Entra, para a organização e o projeto.
Acesso em nível de colaborador ao espaço de trabalho que contém o projeto de rotulagem.

Entrar no estúdio do Azure Machine Learning
Selecione a assinatura e o espaço de trabalho que contém o projeto de rotulagem. O administrador do projeto tem essas informações
Você pode notar várias seções à esquerda, dependendo do seu nível de acesso. Se o fizer, selecione Etiquetagem de dados no lado esquerdo para encontrar o projeto

Compreender a tarefa de etiquetagem

Na tabela do projeto de rotulagem de dados, selecione o link Rotular dados para seu projeto.

Tem à sua disposição instruções específicas para o seu projeto. Estas instruções explicam o tipo de dados envolvidos, como deve tomar as suas decisões e outras informações relevantes. Leia as informações e selecione Tarefas na parte superior da página. Você também pode selecionar Iniciar rotulagem na parte inferior da página.

Seleção de um rótulo

Em todas as tarefas de rotulagem de dados, você escolhe uma tag ou tags apropriadas de um conjunto especificado pelo administrador do projeto. Você pode usar as teclas numéricas do teclado para selecionar as primeiras nove tags.

Aprendizagem automática assistida

O processo de rotulagem pode acionar algoritmos de aprendizado de máquina. Se o seu projeto tiver esses algoritmos habilitados, você poderá ver:

Imagens
- Depois que alguns dos dados forem rotulados, você poderá notar Tarefas agrupadas na parte superior da tela, ao lado do nome do projeto. As imagens são agrupadas para apresentar imagens semelhantes na mesma página. Nesse caso, alterne para uma das várias visualizações de imagem para aproveitar o agrupamento.
- Mais tarde, você pode notar Tarefas pré-rotuladas ao lado do nome do projeto. Os itens aparecem com um rótulo sugerido produzido por um modelo de classificação de aprendizado de máquina. Nenhum modelo de aprendizado de máquina tem 100% de precisão. Embora utilizemos apenas dados para os quais o modelo tem confiança, esses valores de dados ainda podem ter pré-rótulos incorretos. Quando notar etiquetas, corrija quaisquer etiquetas incorretas antes de enviar a página.
- Para modelos de identificação de objetos, você pode notar caixas delimitadoras e rótulos já presentes. Corrija todos os erros com eles antes de enviar a página.
- Para modelos de segmentação, você pode notar polígonos e rótulos já presentes. Corrija todos os erros com eles antes de enviar a página.
Texto
- Mais tarde, você pode notar Tarefas pré-rotuladas ao lado do nome do projeto. Os itens aparecem com um rótulo sugerido produzido por um modelo de classificação de aprendizado de máquina. Nenhum modelo de aprendizado de máquina tem 100% de precisão. Embora utilizemos apenas dados para os quais o modelo tem confiança, esses valores de dados ainda podem ter pré-rótulos incorretos. Quando notar etiquetas, corrija as etiquetas erradas antes de submeter a página.

No início de um projeto de rotulagem, o modelo de aprendizado de máquina pode ter precisão suficiente apenas para pré-rotular um pequeno subconjunto de imagem. Assim que essas imagens forem rotuladas, o projeto de rotulagem retornará à rotulagem manual para coletar mais dados para a próxima rodada de treinamento do modelo. Com o tempo, o modelo se tornará mais confiante sobre uma proporção maior de imagens. Mais tarde no projeto, sua confiança resulta em mais tarefas de pré-rotulagem.

Quando não há mais tarefas pré-marcadas, o processo de confirmação ou correção de rótulos é interrompido e retorna à marcação manual de itens.

Tarefas de imagem

Para tarefas de classificação de imagens, você pode optar por visualizar várias imagens simultaneamente. Para selecionar o layout, use os ícones acima da área da imagem.

Para selecionar todas as imagens exibidas simultaneamente, use Selecionar todas. Para selecionar imagens individuais, use o botão de seleção circular no canto superior direito da imagem. Você deve selecionar pelo menos uma imagem para aplicar uma tag. Se você selecionar várias imagens, qualquer tag selecionada será aplicada a todas as imagens selecionadas.

Por exemplo, podemos escolher um layout dois por dois e aplicar a tag "Mamífero" às imagens de urso e orca, como mostrado nesta captura de tela:

Isso mostra vários layouts de imagem e seleção. A imagem do tubarão já estava marcada como "peixe cartilaginoso", e a iguana ainda não tem uma etiqueta.

Importante

Alterne layouts somente quando tiver uma nova página de dados sem rótulo. A alternância de layouts limpa o trabalho de marcação em andamento da página.

Depois de marcar todas as imagens na página, o Azure habilita o botão Enviar . Selecione Enviar para salvar seu trabalho.

Depois de enviar marcas para os dados em mãos, o Azure atualiza a página com um novo conjunto de imagens da fila de trabalhos.

Tarefas de imagem médica

Importante

A capacidade de rotular DICOM ou tipos de imagem semelhantes não se destina ou é disponibilizada para uso como dispositivo médico, suporte clínico, ferramenta de diagnóstico ou outra tecnologia destinada a ser usada no diagnóstico, cura, mitigação, tratamento ou prevenção de doenças ou outras condições, e nenhuma licença ou direito é concedido pela Microsoft para usar esse recurso para tais fins. Esta capacidade não foi concebida nem se destina a ser implementada ou implementada como um substituto do aconselhamento médico profissional ou da opinião sobre cuidados de saúde, diagnóstico, tratamento ou julgamento clínico de um profissional de saúde, e não deve ser utilizada como tal. O cliente é o único responsável por qualquer uso de Etiquetagem de Dados para DICOM ou tipos de imagem semelhantes.

Projetos de imagem suportam o formato de imagem DICOM para imagens de arquivo de raios-X, como mostrado nesta captura de tela:

Enquanto você rotula as imagens médicas com as mesmas ferramentas que quaisquer outras imagens, você pode usar uma ferramenta diferente para imagens DICOM, como mostrado nesta captura de tela:

Selecione a ferramenta Janela e nível para alterar a intensidade da imagem. Esta ferramenta está disponível apenas para imagens DICOM.

Etiquetar imagens para classificação de várias classes

Atribua uma única tag à imagem inteira para um tipo de projeto "Image Classification Multi-Class". Para rever as instruções em qualquer altura, aceda à página Instruções e selecione Ver instruções detalhadas.

Se perceber que cometeu um erro depois de atribuir uma etiqueta a uma imagem, pode corrigi-lo. Selecione o "X" na etiqueta exibida abaixo da imagem para limpar a etiqueta. Você também pode selecionar a imagem e escolher outra classe. O valor recém-selecionado substitui a tag aplicada anteriormente.

Etiquetar imagens para classificação de várias etiquetas

Se o seu projeto for do tipo "Image Classification Multi-Label", você aplica uma ou mais tags a uma imagem. Para ver as instruções específicas do projeto, selecione Instruções e vá para Exibir instruções detalhadas.

Selecione a imagem que pretende etiquetar e, em seguida, selecione a etiqueta. A tag é aplicada a todas as imagens selecionadas e, em seguida, as imagens são desmarcadas. Para aplicar mais tags, você deve selecionar novamente as imagens. Esta animação mostra a marcação de vários rótulos:

A animação mostra que

Selecionar tudo é usado para aplicar a tag "Ocean"
Uma única imagem é selecionada e marcada com "Closeup"
Três imagens são selecionadas e marcadas como "Grande angular"

Para corrigir um erro, selecione o "X" para limpar uma tag individual, ou selecione as imagens e, em seguida, selecione a tag para limpar a tag de todas as imagens selecionadas. Este cenário é mostrado aqui. Selecionar "Terra" limpa essa tag das duas imagens selecionadas. Esta captura de tela mostra o cenário:

O Azure só habilitará o botão Enviar depois que você aplicar pelo menos uma marca a cada imagem. Selecione Enviar para salvar seu trabalho.

Etiquetar imagens e especificar caixas delimitadoras para deteção de objetos

Se o seu projeto for do tipo "Identificação de objeto (caixas delimitadoras)", especifique uma ou mais caixas delimitadoras na imagem e aplique uma tag a cada caixa. As imagens podem ter várias caixas delimitadoras, cada uma com uma única etiqueta. Use Exibir instruções detalhadas para determinar se seu projeto usa várias caixas delimitadoras.

Selecione uma tag para a caixa delimitadora que você planeja criar
Selecione "R.", ou selecione a ferramenta Caixa retangular, como mostrado nesta captura de tela:
Para criar uma caixa delimitadora aproximada, selecione e arraste diagonalmente pelo alvo. Arraste as bordas ou cantos para ajustar a caixa delimitadora, conforme mostrado nesta captura de tela:

Para excluir uma caixa delimitadora, selecione o destino em forma de X que aparece ao lado da caixa delimitadora após a criação.

Não é possível alterar a marca de uma caixa delimitadora existente. Para corrigir um erro de atribuição de tag, você deve excluir a caixa delimitadora e criar uma nova com a tag correta.

Por padrão, você pode editar caixas delimitadoras existentes. A ferramenta "L" ou Bloquear/desbloquear regiões alterna esse comportamento, conforme mostrado nesta captura de tela:

Se as regiões estiverem bloqueadas, você só poderá alterar a forma ou o local de uma nova caixa delimitadora.

A ferramenta de manipulação Regiões tem quatro setas que começam no centro e apontam para fora, para baixo, para a direita e para a esquerda, conforme mostrado nesta captura de tela:

Use a ferramenta de manipulação Regiões, ou "M", para ajustar uma caixa delimitadora existente. Arraste as bordas ou cantos para ajustar a forma. Selecione no interior se quiser arrastar toda a caixa delimitadora. Se não conseguir editar uma região, provavelmente alterou a ferramenta Bloquear/desbloquear regiões .

A ferramenta Caixa baseada em modelo cria várias caixas delimitadoras do mesmo tamanho, conforme mostrado nesta captura de tela:

Use a ferramenta Caixa baseada em modelo, ou "T", para criar várias caixas delimitadoras do mesmo tamanho. Se a imagem não tiver caixas delimitadoras e você ativar caixas baseadas em modelo, a ferramenta produzirá caixas de 50 por 50 pixels. Se você criar uma caixa delimitadora e, em seguida, ativar caixas baseadas em modelo, o tamanho de quaisquer novas caixas delimitadoras corresponderá ao tamanho da última caixa que você criou. Você pode redimensionar caixas baseadas em modelo após o posicionamento. O redimensionamento de uma caixa baseada em modelo apenas redimensiona essa caixa específica.

Para excluir todas as caixas delimitadoras na imagem atual, selecione a ferramenta Excluir todas as regiões , conforme mostrado nesta captura de tela:

Depois de criar as caixas delimitadoras de uma imagem, selecione Enviar para salvar seu trabalho, ou o trabalho em andamento não será salvo.

Marcar imagens e especificar polígonos para segmentação de imagens

Se o seu projeto for do tipo "Segmentação de instância (polígono)", especifique um ou mais polígonos na imagem e aplique uma tag a cada polígono. As imagens podem ter vários polígonos delimitadores, cada um com uma única tag. Use Exibir instruções detalhadas para determinar se seu projeto usa vários polígonos delimitadores.

Selecione uma tag para o polígono que você planeja criar
Selecione "P" ou selecione a ferramenta Desenhar região do polígono, conforme mostrado nesta captura de tela:

Selecione para cada ponto no polígono. Ao completar a forma, selecione duas vezes para terminar, conforme mostrado nesta animação:

Para excluir um polígono, selecione o destino em forma de X que aparece ao lado do polígono após a criação.

Para alterar a tag de um polígono, selecione a ferramenta Mover região , selecione o polígono e selecione a tag correta.

Você pode editar polígonos existentes. A ferramenta Bloquear/desbloquear regiões , ou "L", alterna esse comportamento, conforme mostrado nesta captura de tela:

Se as regiões estiverem bloqueadas, você só poderá alterar a forma ou o local de um novo polígono.

Use a ferramenta Adicionar ou remover pontos de polígono, ou "U", para ajustar um polígono existente, conforme mostrado nesta captura de tela:

Selecione o polígono para adicionar ou remover um ponto. Se não conseguir editar uma região, provavelmente alterou a ferramenta Bloquear/desbloquear regiões .

Para excluir todas as caixas delimitadoras na imagem atual, selecione a ferramenta Excluir todas as regiões , conforme mostrado nesta captura de tela:

Depois de criar os polígonos para uma imagem, selecione Enviar para salvar seu trabalho, ou seu trabalho em andamento não será salvo.

Marcar imagens e desenhar máscaras para segmentação semântica

Se o seu projeto for do tipo "Segmentação semântica (Pré-visualização)", utilize o pincel para pintar uma máscara sobre a área que pretende etiquetar.

Selecione uma etiqueta para a área sobre a qual pretende pintar
Selecione a ferramenta pincel , conforme mostrado nesta captura de tela:
Selecione a ferramenta de tamanho para escolher um tamanho para o pincel, conforme mostrado nesta captura de tela:
Pinte sobre a área que deseja marcar. A cor correspondente à sua etiqueta é aplicada à área pintada

Para excluir partes da área, selecione Ferramenta Borracha .

Para alterar a tag de uma área, selecione a nova tag e repinte a área.

Você também pode usar a ferramenta Polígono para especificar uma região.

Depois de criar as áreas para uma imagem, selecione Enviar para salvar seu trabalho, ou seu trabalho em andamento não será salvo. Se você usou a ferramenta Polígono, todos os polígonos serão convertidos em uma máscara quando você enviar.

Texto do rótulo

Ao marcar texto, use a barra de ferramentas para:

Aumentar ou diminuir o tamanho do texto
Alterar o tipo de letra
Ignorar a rotulagem deste item e passar para o próximo item

Se notar que cometeu um erro depois de atribuir uma etiqueta, pode corrigi-lo. Selecione o "X" no rótulo exibido abaixo do texto para limpar a tag.

Existem três tipos de projeto de texto:

Tipo de projeto	Description
Classificação Multi-Classe	Atribua uma única tag a toda a entrada de texto. Você só pode selecionar uma tag para cada item de texto. Selecione uma etiqueta e, em seguida, selecione Enviar para passar para a próxima entrada.
Classificação Multi-Label	Atribua uma ou mais tags a cada entrada de texto. Você pode selecionar várias tags para cada item de texto. Selecione todas as tags que se aplicam e, em seguida, selecione Enviar para passar para a próxima entrada.
Reconhecimento de entidades nomeadas	Marque palavras ou frases diferentes em cada entrada de texto. Veja as instruções na próxima seção.

Para ver as instruções específicas do projeto, selecione Instruções e vá para Exibir instruções detalhadas.

Marcar palavras e frases

Se o seu projeto estiver configurado para reconhecimento de entidade nomeada, marque palavras ou frases diferentes em cada item de texto. Para rotular o texto:

Selecione o rótulo ou digite o número correspondente ao rótulo apropriado
Clique duas vezes em uma palavra ou use o mouse para selecionar várias palavras.

Para alterar um rótulo, você pode:

Elimine a etiqueta e comece de novo.
Altere o valor de alguns ou de todos os rótulos específicos no item atual:
- Selecione o rótulo em si, que seleciona todas as instâncias desse rótulo.
- Para desmarcar quaisquer instâncias que você deseja manter, selecione as instâncias desse rótulo mais uma vez.
- Por fim, selecione um novo rótulo para alterar todos os rótulos que ainda estão selecionados.

Depois de marcar todos os itens em uma entrada, selecione Enviar para passar para a próxima entrada.

Conclusão

Quando você envia uma página de dados marcados, o Azure atribui novos dados não rotulados a você a partir de uma fila de trabalhos. Se não houver mais dados sem rótulo disponíveis, uma nova mensagem diz isso, juntamente com um link para a página inicial do portal.

Quando terminar de rotular, selecione a imagem dentro de um círculo no canto superior direito do estúdio e, em seguida, selecione sair. Se você não sair, o Azure expira o tempo limite e atribui seus dados a outro rotulador.

Próximos passos

Aprenda a treinar modelos de classificação de imagem no Azure

Partilhar via

Rotular imagens e documentos de texto

Pré-requisitos

Compreender a tarefa de etiquetagem

Seleção de um rótulo

Aprendizagem automática assistida

Tarefas de imagem

Tarefas de imagem médica

Etiquetar imagens para classificação de várias classes

Etiquetar imagens para classificação de várias etiquetas

Etiquetar imagens e especificar caixas delimitadoras para deteção de objetos

Marcar imagens e especificar polígonos para segmentação de imagens

Marcar imagens e desenhar máscaras para segmentação semântica

Texto do rótulo

Marcar palavras e frases

Conclusão

Próximos passos

Comentários

Recursos adicionais

Partilhar via

Rotular imagens e documentos de texto

Pré-requisitos

Iniciar sessão no estúdio

Compreender a tarefa de etiquetagem

Seleção de um rótulo

Aprendizagem automática assistida

Tarefas de imagem

Tarefas de imagem médica

Etiquetar imagens para classificação de várias classes

Etiquetar imagens para classificação de várias etiquetas

Etiquetar imagens e especificar caixas delimitadoras para deteção de objetos

Marcar imagens e especificar polígonos para segmentação de imagens

Marcar imagens e desenhar máscaras para segmentação semântica

Texto do rótulo

Marcar palavras e frases

Conclusão

Próximos passos

Comentários

Recursos adicionais