Partilhar via


Deteção de material protegido

A API de texto de material protegido sinaliza conteúdo de texto conhecido (por exemplo, letras de músicas, artigos, receitas e conteúdo da Web selecionado) que pode ser gerado por modelos de linguagem grandes.

A API de código de material protegido sinaliza conteúdo de código protegido (de repositórios conhecidos do GitHub, incluindo bibliotecas de software, código-fonte, algoritmos e outros conteúdos de programação proprietários) que pode ser gerado por modelos de linguagem grandes.

Atenção

O scanner/indexador de código do serviço de segurança de conteúdo só está atualizado até 6 de novembro de 2021. O código que foi adicionado ao GitHub após essa data não será detetado. Use seu próprio critério ao usar o Material Protegido para Código para detetar corpos de código recentes.

Ao detetar e impedir a exibição de material protegido, as organizações podem garantir a conformidade com as leis de propriedade intelectual, manter a originalidade do conteúdo e proteger suas reputações.

Este guia fornece detalhes sobre os tipos de conteúdo que a API de material protegido deteta.

Cenários do usuário

Plataformas de geração de conteúdo para escrita criativa

  • Cenário: uma plataforma de geração de conteúdo que usa IA generativa para escrita criativa (por exemplo, postagens de blog, histórias, cópia de marketing) integra o recurso Material protegido para texto para impedir a geração de conteúdo que se aproxima de material protegido por direitos autorais conhecido.
  • Usuário: Administradores da plataforma e criadores de conteúdo.
  • Ação: A plataforma usa a Segurança de Conteúdo de IA do Azure para verificar o conteúdo gerado por IA antes que ele seja fornecido aos usuários. Se o texto gerado corresponder ao material protegido, o conteúdo é sinalizado e bloqueado ou revisado.
  • Resultado: a plataforma evita potenciais violações de direitos autorais e garante que todo o conteúdo gerado seja original e esteja em conformidade com as leis de propriedade intelectual.

Criação automatizada de conteúdo de mídia social

  • Cenário: Uma agência de marketing digital usa IA generativa para automatizar a criação de conteúdo de mídia social. A agência integra o recurso Material Protegido para Texto para evitar a publicação de conteúdo gerado por IA que inclua texto protegido por direitos autorais, como letras de músicas ou trechos de livros.
  • Usuário: Profissionais de marketing digital e gerentes de mídia social.
  • Ação: A agência emprega o Azure AI Content Safety para verificar todo o conteúdo de mídia social gerado por IA em busca de correspondências com um banco de dados de material protegido. O conteúdo correspondente é sinalizado para revisão ou impedido de publicação.
  • Resultado: a agência mantém a conformidade com as leis de direitos autorais e evita riscos de reputação associados à publicação de conteúdo não autorizado.

Redação de notícias assistida por IA

  • Cenário: Um veículo de notícias usa IA generativa para ajudar jornalistas na elaboração de artigos e reportagens. Para garantir que o conteúdo não reproduza involuntariamente artigos de notícias protegidos ou outro material protegido por direitos autorais, o veículo usa o recurso Material protegido para texto.
  • Usuário: Jornalistas, editores e oficiais de conformidade.
  • Ação: A agência de notícias integra o Azure AI Content Safety em seu fluxo de trabalho de criação de conteúdo. Os rascunhos gerados por IA são automaticamente verificados em busca de conteúdo protegido antes do envio para revisão editorial.
  • Resultado: A agência de notícias evita violações acidentais de direitos autorais e mantém a integridade e originalidade de suas reportagens.

Plataformas de e-learning que utilizam IA para geração de conteúdos

  • Cenário: Uma plataforma de e-learning emprega IA generativa para gerar conteúdo educacional, como resumos, questionários e texto explicativo. A plataforma usa o recurso Material protegido para texto para garantir que o conteúdo gerado não inclua material protegido de livros didáticos, artigos ou trabalhos acadêmicos.
  • Usuário: criadores de conteúdo educacional e responsáveis pela conformidade.
  • Ação: A plataforma integra o recurso para escanear materiais educacionais gerados por IA. Se algum conteúdo corresponder a material académico protegido conhecido, é sinalizado para revisão ou removido automaticamente.
  • Resultado: a plataforma mantém a qualidade do conteúdo educacional e cumpre as leis de direitos autorais, evitando o uso de material protegido em recursos de aprendizagem gerados por IA.

Geradores de receitas alimentados por IA

  • Cenário: Um site de alimentos e receitas usa IA generativa para gerar novas receitas com base nas preferências do usuário. Para evitar gerar conteúdo que corresponda a receitas protegidas de livros de receitas ou sites famosos, o site integra o recurso Material protegido para texto.
  • Usuário: gerentes de conteúdo e administradores de plataforma.
  • Ação: O site usa o Azure AI Content Safety para verificar receitas geradas por IA em relação a um banco de dados de conteúdo protegido conhecido. Se uma receita gerada corresponder a uma receita protegida, ela será sinalizada e revisada ou bloqueada.
  • Resultado: o site garante que todas as receitas geradas por IA sejam originais, reduzindo o risco de violação de direitos autorais.

Exemplos de texto de material protegido

Consulte esta tabela para obter detalhes das principais categorias de deteção de texto de material protegido. Todas as quatro categorias são aplicadas quando você chama a API.

Categoria Âmbito Considerado aceitável Considerado prejudicial
Receitas Conteúdo protegido por direitos autorais relacionado a receitas.

Outro texto prejudicial ou sensível está fora do escopo para esta tarefa, a menos que se cruze com Recipes IP copyright harm.
  • Links para páginas da Web que contêm informações sobre receitas
  • Qualquer conteúdo de receitas que não tenham ou tenham baixas proteções de IP/Direitos de Autor:
    • Listas de ingredientes
    • Instruções básicas para combinar e cozinhar ingredientes
  • Rejeição ou recusa em fornecer conteúdo protegido por direitos autorais:
    • Alterar um tópico para evitar a partilha de conteúdo protegido por direitos de autor
    • Recusa de partilha de conteúdos protegidos por direitos de autor
    • Fornecimento de informações não responsivas
  • Outro conteúdo literário numa receita
    • Correspondência de anedotas, histórias ou comentários pessoais sobre a receita (40 caracteres ou mais)
    • Nomes criativos para a receita que não se limitam ao nome bem conhecido do prato, ou um resumo descritivo simples do prato indicando qual é o ingrediente principal (40 caracteres ou mais)
    • Descrições criativas dos ingredientes ou etapas para combinar ou cozinhar ingredientes, incluindo descrições que contenham mais informações do que o necessário para criar o prato, se baseiem em palavras imprecisas ou contenham palavrões (40 caracteres ou mais)
  • Métodos para aceder a conteúdos protegidos por direitos de autor:
    • Maneiras de contornar paywalls para acessar receitas
Conteúdo Web Todos os sites que têm webmd.com como nome de domínio URL. Concentra-se apenas em questões de conteúdo protegido por direitos autorais em torno de Conteúdo da Web Selecionado.

Outro texto prejudicial ou sensível está fora do escopo desta tarefa, a menos que cruze os danos ao Conteúdo da Web Selecionado.
  • Links para páginas web
  • Pequenos excertos ou excertos de Conteúdo Web Selecionado, desde que:
    • Eles são relevantes para a consulta do usuário
    • São menos de 200 caracteres
  • Conteúdo substancial de conteúdo da Web selecionado
    • Seções de resposta com mais de 200 caracteres que apresentam semelhança substancial com um bloco de texto do Conteúdo da Web Selecionado
    • Trechos de conteúdo da Web selecionado com mais de 200 caracteres
    • Citações de conteúdo da Web selecionado com mais de 200 caracteres
  • Métodos para aceder a conteúdos protegidos por direitos de autor:
    • Maneiras de contornar paywalls ou proteções DRM para acessar conteúdo da Web selecionado protegido por direitos autorais
Novidades Concentre-se apenas em questões de conteúdo protegido por direitos autorais em torno de Notícias.

Outro texto prejudicial ou sensível está fora do escopo desta tarefa, a menos que cruze os danos aos direitos autorais de IP de notícias.
  • Links para páginas da Web que hospedam notícias ou informações sobre notícias, revistas ou artigos de blog, desde que:
    • Eles têm permissões legítimas
    • Eles licenciaram a cobertura jornalística
    • São plataformas autorizadas
  • Links para páginas da Web autorizadas que contenham players de áudio/vídeo incorporados, desde que:
    • Eles têm permissões legítimas
    • Eles licenciaram a cobertura jornalística
    • São plataformas de streaming autorizadas
    • São canais oficiais do YouTube
  • Trechos/trechos curtos, como manchetes ou legendas de artigos de notícias, desde que:
    • Eles são relevantes para a consulta do usuário
    • Não constituem uma parte substancial do artigo
    • Não são o artigo inteiro
  • Resumo de artigos noticiosos, desde que:
    • É relevante para a consulta do utilizador
    • É breve e factual
    • Não copia/parafraseia uma parte substancial do artigo
    • É clara e visivelmente citado como um resumo
  • Análise/Crítica/Revisão de artigos noticiosos desde que:
    • É relevante para a consulta do utilizador
    • É breve e factual
    • Não copia/parafraseia uma parte substancial do artigo
    • É clara e visivelmente citado como uma análise/crítica/revisão
  • Qualquer conteúdo noticioso que não tenha proteções de IP/Direitos de Autor:
    • Notícias/Revistas/Blogs que são de domínio público
    • Notícias/Revistas/Blogues para os quais a proteção de direitos de autor expirou, foi cedida ou nunca existiu
  • Rejeição ou recusa em fornecer conteúdo protegido por direitos autorais:
    • Alterar o tópico para evitar a partilha de conteúdo protegido por direitos de autor
    • Recusa de partilha de conteúdos protegidos por direitos de autor
    • Fornecimento de informações não responsivas
  • Links para pdf ou qualquer outro arquivo contendo texto completo de artigos de notícias/revistas/blogs, a menos que:
    • Eles são provenientes de plataformas autorizadas com permissões e licenças legítimas
  • Conteúdo noticioso
    • Mais de 200 caracteres retirados literalmente de qualquer notícia
    • Mais de 200 caracteres substancialmente semelhantes a um bloco de texto de qualquer notícia
    • Acesso direto a notícias/revistas/artigos de blog que estão por trás de paywalls
  • Métodos para aceder a conteúdos protegidos por direitos de autor:
    • Etapas para baixar notícias de um site não autorizado
    • Maneiras de contornar paywalls ou proteções DRM para acessar notícias ou vídeos protegidos por direitos autorais
Letras Concentra-se apenas em questões de conteúdo protegido por direitos autorais em torno de Músicas.

Outro texto prejudicial ou sensível está fora do escopo para esta tarefa, a menos que cruze os danos causados pelos direitos autorais do IP das músicas.
  • Links para páginas da Web que contêm informações sobre músicas, tais como:
    • Letra das músicas
    • Acordes ou abas da música associada
    • Análise ou recensões da música/música
  • Links para páginas da Web autorizadas que contenham players de áudio/vídeo incorporados, desde que:
    • Eles têm permissões legítimas
    • Eles têm música licenciada
    • São plataformas de streaming autorizadas
    • São canais oficiais do YouTube
  • Trechos curtos ou trechos das letras das músicas, desde que:
    • Eles são relevantes para a consulta do usuário
    • Eles não são uma parte substancial das letras
    • Não são as letras inteiras
    • Não têm mais de 11 palavras
  • Trechos curtos ou trechos de acordes/abas das músicas, desde que:
    • Eles são relevantes para a consulta do usuário
    • Eles não são uma parte substancial dos acordes/abas
    • Eles não são os acordes/abas inteiros
  • Qualquer conteúdo de músicas que não tenham proteções de IP/Direitos de Autor:
    • Músicas/Letras/Acordes/Separadores que são do domínio público
    • Músicas/Letras/Acordes/Separadores para os quais a proteção de direitos de autor expirou, foi entregue ou nunca existiu
  • Rejeição ou recusa em fornecer conteúdo protegido por direitos autorais:
    • Alterar o tópico para evitar a partilha de conteúdo protegido por direitos de autor
    • Recusa de partilha de conteúdos protegidos por direitos de autor
    • Fornecimento de informações não responsivas
  • Letra de uma música
    • Letras inteiras
    • Parte substancial das letras
    • Parte das letras que contêm mais de 11 palavras
  • Acordes ou abas de uma música
    • Acordes/separadores inteiros
    • Parte substancial dos acordes/abas
  • Links para páginas da Web que contêm players de áudio/vídeo incorporados que:
    • Não tem permissões legítimas
    • Não tem música licenciada
    • Não são autorizadas as plataformas de streaming
    • Não são canais oficiais do YouTube
  • Métodos para aceder a conteúdos protegidos por direitos de autor:
    • Etapas para baixar músicas de um site não autorizado
    • Maneiras de contornar paywalls ou proteções DRM para acessar músicas ou vídeos protegidos por direitos autorais

Próximos passos

Siga o início rápido para começar a usar o Azure AI Content Safety para detetar material protegido.