Condividi tramite


Rilevamento di materiale protetto

L'API per il testo del materiale protetto descrive contenuti testuali noti (ad esempio testi di canzoni, articoli, ricette e contenuto Web selezionato) che potrebbero essere restituiti da modelli linguistici di grandi dimensioni.

L'API Codice materiale protetto contrassegna il contenuto del codice protetto (da repository GitHub noti, tra cui librerie software, codice sorgente, algoritmi e altri contenuti di programmazione proprietari) che potrebbe essere restituito da modelli di linguaggio di grandi dimensioni.

Attenzione

Lo scanner/indicizzatore del servizio di sicurezza del contenuto è aggiornato solo al 6 novembre 2021. Il codice aggiunto a GitHub dopo questa data non verrà rilevato. Usare la propria discrezione quando si usa Materiale protetto per il codice per rilevare i corpi di codice recenti.

Rilevando e impedendo la visualizzazione di materiale protetto, le organizzazioni possono garantire la conformità alle leggi sulla proprietà intellettuale, mantenere l'originalità dei contenuti e proteggere la loro reputazione.

Questa guida fornisce informazioni dettagliate sui tipi di contenuti rilevati dall'API per il materiale protetto.

Scenari utente

Piattaforme di generazione di contenuti per la scrittura creativa

  • Scenario: una piattaforma di generazione di contenuti che usa l'intelligenza artificiale generativa per la scrittura creativa (ad esempio, post di blog, storie, copia di marketing) integra la funzionalità Materiale protetto per il testo per impedire la generazione di contenuti che corrispondono strettamente a materiale protetto da copyright noto.
  • Utente: amministratori della piattaforma e creatori di contenuti.
  • Azione: la piattaforma usa Sicurezza dei contenuti di Azure AI per analizzare i contenuti generati dall'intelligenza artificiale prima che siano forniti agli utenti. Se il testo generato corrisponde a materiale protetto, i contenuti vengono contrassegnati e bloccati o rivisti.
  • Risultato: la piattaforma evita potenziali violazioni del copyright e garantisce che tutti i contenuti generati siano originali e conformi alle leggi sulla proprietà intellettuale.

Creazione automatica di contenuti di social media

  • Scenario: un'agenzia di marketing digitale usa l'intelligenza artificiale generativa per automatizzare la creazione di contenuti di social media. L'agenzia integra la funzionalità Materiale protetto per il testo per evitare di pubblicare contenuti generati dall'IA che includono testo protetto da copyright, ad esempio testi di canzoni o estratti da libri.
  • Utente: marketer digitali e social media manager.
  • Azione: l'agenzia usa Sicurezza dei contenuti di Azure AI per verificare tutti i contenuti dei social media generati dall'IA e individuare eventuali corrispondenze con un database di materiale protetto. I contenuti corrispondenti vengono contrassegnati per la revisione o la loro pubblicazione è bloccata.
  • Risultato: l'agenzia mantiene la conformità alle leggi sul copyright ed evita rischi di reputazione associati alla pubblicazione di contenuti non autorizzati.

Stesura di notizie assistita dall'intelligenza artificiale

  • Scenario: un news outlet usa l'intelligenza artificiale generativa per assistere i giornalisti nella stesura di articoli e report. Per garantire che il contenuto non replichi involontariamente articoli di notizie protetti o altro materiale soggetto a copyright, l'outlet utilizza la funzionalità Materiale protetto per il testo.
  • Utente: giornalisti, redattori e responsabili della conformità.
  • Azione: il news outlet integra Sicurezza dei contenuti di Azure AI nel flusso di lavoro di creazione dei contenuti. Le bozze generate dall'intelligenza artificiale vengono analizzate automaticamente per rilevare eventuali contenuti protetti prima dell'invio per la revisione editoriale.
  • Risultato: il news outlet impedisce violazioni accidentali del copyright e mantiene l'integrità e l'originalità delle sue pubblicazioni.

Piattaforme di E-Learning che usano l'intelligenza artificiale per la generazione di contenuti

  • Scenario: una piattaforma di e-learning usa l'intelligenza artificiale generativa per generare contenuti didattici, ad esempio riepiloghi, quiz e testi esplicativi. La piattaforma usa la funzionalità Materiale protetto per il testo per garantire che i contenuti generati non includano materiale protetto di libri di testo, articoli o documenti accademici.
  • Utente: creatori di contenuti didattici e responsabili della conformità.
  • Azione: la piattaforma integra la funzionalità per analizzare i materiali didattici generati dall'intelligenza artificiale. Se un contenuto corrisponde a materiale accademico protetto noto, viene contrassegnato per la revisione o rimosso automaticamente.
  • Risultato: la piattaforma mantiene la qualità dei contenuti didattici ed è conforme alle leggi sul copyright, evitando l'uso di materiale protetto nelle risorse di apprendimento generate dall'IA.

Generatori di ricette basate sull'intelligenza artificiale

  • Scenario: un sito Web di cibo e ricette usa l'intelligenza artificiale generativa per generare nuove ricette in base alle preferenze dell'utente. Per evitare di generare contenuti che corrispondano a ricette protette da famosi libri di cucina o siti Web, il sito web integra la funzionalità Materiale protetto per il testo.
  • Utente: gestori di contenuti e amministratori della piattaforma.
  • Azione: il sito Web usa Sicurezza dei contenuti di Azure AI per controllare le ricette generate dall'intelligenza artificiale rispetto a un database di contenuti protetti noti. Se una ricetta generata corrisponde a una protetta, viene contrassegnata e modificata o bloccata.
  • Risultato: il sito Web garantisce che tutte le ricette generate dall'IA siano originali, riducendo il rischio di violazione del copyright.

Esempi di testo di materiale protetto

Fare riferimento a questa tabella per informazioni dettagliate sulle principali categorie di rilevamento del testo del materiale protetto. Tutte e quattro le categorie vengono applicate quando si chiama l'API.

Categoria Ambito Considerato accettabile Considerato dannoso
Ricette Contenuto protetto da copyright relativo a Ricette.

Altri testi dannosi o sensibili non rientrano nell'ambito di questa attività, a meno che non si intersechino con il danno da copyright o proprietà intellettuale di Ricette.
  • Collegamenti a pagine Web contenenti informazioni sulle ricette
  • Qualsiasi contenuto proveniente da ricette che non abbia o abbia una scarsa protezione IP/Copyright:
    • Elenchi di ingredienti
    • Istruzioni di base per combinare e cucinare gli ingredienti
  • Negazione o rifiuto di fornire contenuto protetto da copyright:
    • Modifica di un argomento per evitare la condivisione di contenuti protetti da copyright
    • Rifiuto di condividere contenuti protetti da copyright
    • Informazioni non rispondenti
  • Altri contenuti letterari in una ricetta
    • Corrispondenza di aneddoti, storie o commenti personali sulla ricetta (40 caratteri o più)
    • Nomi creativi per la ricetta che non sono limitati al nome noto del piatto, o un semplice riepilogo descrittivo del piatto che indica qual è l'ingrediente principale (40 caratteri o più)
    • Descrizioni creative degli ingredienti o dei passaggi per combinare o cucinare gli ingredienti, incluse descrizioni che contengono più informazioni di quanto necessario per creare il piatto, affidarsi a parole imprecise o contenere contenuto volgare (40 caratteri o più)
  • Metodi per accedere al contenuto protetto da copyright:
    • Modi per ignorare i paywall per accedere alle ricette
Contenuto Web Tutti i siti Web con webmd.com come nome di dominio URL. Si basa solo sui problemi del contenuto protetto da copyright relativi a Contenuto Web selezionato.

Altri testi dannosi o sensibili non rientrano nell'ambito di questa attività, a meno che non si intersechino con il danno da Contenuto Web selezionato.
  • Collegamenti a pagine Web
  • Brevi estratti o frammenti di Contenuto Web selezionato, purché:
    • Siano pertinenti alla query dell'utente
    • Siano composti da un numero inferiore a 200 caratteri
  • Elementi sostanziali di Contenuto Web selezionato
    • Sezioni di risposta più lunghe di 200 caratteri che presentano una notevole somiglianza con un blocco di testo di Contenuto Web selezionato
    • Estratti da Contenuto Web selezionato con lunghezza superiore a 200 caratteri
    • Citazioni da Contenuto Web selezionato con lunghezza superiore a 200 caratteri
  • Metodi per accedere al contenuto protetto da copyright:
    • Modi per ignorare paywall o protezioni DRM per accedere a Contenuto Web selezionato protetto da copyright
Novità Si basa solo sui problemi del contenuto protetto da copyright relativi a Notizie.

Altri testi dannosi o sensibili non rientrano nell'ambito di questa attività, a meno che non si intersechino con il danno da copyright o proprietà intellettuale di Notizie.
  • Collegamenti a pagine Web che ospitano notizie o informazioni su notizie, riviste o articoli di blog, purché:
    • Abbiano autorizzazioni legittime
    • Abbiano una copertura delle notizie concessa in licenza
    • Siano piattaforme autorizzate
  • Collegamenti a pagine Web autorizzate che contengono lettori audio/video incorporati, purché:
    • Abbiano autorizzazioni legittime
    • Abbiano una copertura delle notizie concessa in licenza
    • Siano piattaforme di streaming autorizzate
    • Siano canali YouTube ufficiali
  • Brevi estratti/frammenti di codice, ad esempio titoli o didascalie di articoli di notizie, purché:
    • Siano pertinenti alla query dell'utente
    • Non siano una parte sostanziale dell'articolo
    • Non siano l'intero articolo
  • Riepilogo degli articoli di notizie purché:
    • Siano pertinenti alla query dell'utente
    • Siano brevi ed efficaci
    • Non copino/parafrasino una parte sostanziale dell'articolo
    • Siano chiaramente e visibilmente citati come riepilogo
  • Analisi/Critica/Revisione di articoli di notizie purché:
    • Siano pertinenti alla query dell'utente
    • Siano brevi ed efficaci
    • Non copino/parafrasino una parte sostanziale dell'articolo
    • Siano chiaramente e visibilmente citati come analisi/critica/recensione
  • Qualsiasi contenuto di notizie che non disponga di protezioni IP/Copyright:
    • Notizie/Riviste/Blog che si trovano nel dominio pubblico
    • Notizie/Riviste/Blog per cui è trascorsa la protezione del copyright, è stato ceduto, o mai esistito
  • Negazione o rifiuto di fornire contenuto protetto da copyright:
    • Modifica di un argomento per evitare la condivisione di contenuti protetti da copyright
    • Rifiuto di condividere contenuti protetti da copyright
    • Informazioni non rispondenti
  • Collegamenti a file pdf o a qualsiasi altro file contenente testo completo di notizie/riviste/articoli di blog, a meno che:
    • Abbiano origine da piattaforme autorizzate con autorizzazioni e licenze legittime
  • Contenuto di Notizie
    • Più di 200 caratteri presi verbatim da qualsiasi articolo di notizie
    • Più di 200 caratteri sostanzialmente simili a un blocco di testo di qualsiasi articolo di notizie
    • Accesso diretto a notizie/riviste/articoli di blog che si trovano dietro i paywall
  • Metodi per accedere al contenuto protetto da copyright:
    • Procedura per scaricare notizie da un sito Web non autorizzato
    • Modi per ignorare paywall o protezioni DRM per accedere a notizie o video protetti da copyright
Lyrics Si basa solo sui problemi del contenuto protetto da copyright relativi a Canzoni.

Altri testi dannosi o sensibili non rientrano nell'ambito di questa attività, a meno che non si intersechino con il danno da copyright o proprietà intellettuale di Canzoni.
  • Collegamenti a pagine Web contenenti informazioni sulle canzoni, ad esempio:
    • Testi delle canzoni
    • Accordi o schede della musica associata
    • Analisi o recensioni della canzone/musica
  • Collegamenti a pagine Web autorizzate che contengono lettori audio/video incorporati, purché:
    • Abbiano autorizzazioni legittime
    • Abbiano la licenza per la musica
    • Siano piattaforme di streaming autorizzate
    • Siano canali YouTube ufficiali
  • Brevi estratti o frammenti di testi delle canzoni, purché:
    • Siano pertinenti alla query dell'utente
    • Non siano una parte sostanziale dei testi
    • Non siano l'intero testo
    • Non siano più lunghi di 11 parole
  • Brevi estratti o frammenti di accordi/schede delle canzoni, purché:
    • Siano pertinenti alla query dell'utente
    • Non siano una parte sostanziale degli accordi/schede
    • Non siano l'intero accordo/scheda
  • Qualsiasi contenuto proveniente da canzoni che non abbia o abbia una scarsa protezione IP/Copyright:
    • Canzoni/Testi/Accordi/Schede che si trovano nel dominio pubblico
    • Canzoni/Testi/Accordi/Schede per cui è trascorsa la protezione del copyright, è stato ceduto, o mai esistito
  • Negazione o rifiuto di fornire contenuto protetto da copyright:
    • Modifica di un argomento per evitare la condivisione di contenuti protetti da copyright
    • Rifiuto di condividere contenuti protetti da copyright
    • Informazioni non rispondenti
  • Testi di una canzone
    • Testi interi
    • Parte sostanziale dei testi
    • Parte dei testi che contengono più di 11 parole
  • Accordi o schede di una canzone
    • Interi accordi/schede
    • Parte sostanziale degli accordi/schede
  • Collegamenti a pagine Web che contengono lettori audio/video incorporati, che:
    • Non abbiano autorizzazioni legittime
    • Non abbiano la licenza per la musica
    • Non siano piattaforme di streaming autorizzate
    • Non siano canali YouTube ufficiali
  • Metodi per accedere al contenuto protetto da copyright:
    • Procedura per scaricare canzoni da un sito Web non autorizzato
    • Modi per ignorare paywall o protezioni DRM per accedere a canzoni o video protetti da copyright

Passaggi successivi

Seguire la guida introduttiva per iniziare a usare Sicurezza dei contenuti di Azure AI per rilevare il materiale protetto.