Rilevamento del grounding

Articolo
10/17/2024

L’API di Rilevamento della fondatezza rileva se le risposte testuali dei modelli linguistici di grandi dimensioni (LLM) sono fondate sui materiali di origine forniti dagli utenti. L’espressione “non fondatezza” si riferisce a istanze in cui i modelli linguistici di grandi dimensioni producono informazioni non concrete o imprecise rispetto a ciò che era presente nei materiali di origine.

Termini importanti

Generazione aumentata di recupero (RAG): la RAG è una tecnica per aumentare le conoscenze degli LLM con altri dati. Gli LLM possono ragionare su argomenti di ampia portata, ma la loro conoscenza è limitata ai dati pubblici disponibili al momento in cui sono stati sottoposti a training. Se si vogliono creare applicazioni di intelligenza artificiale che possono ragionare su dati privati o introdotti dopo la data di cutoff di un modello, è necessario fornire al modello tali informazioni specifiche. Il processo di inserimento delle informazioni appropriate nella richiesta del modello è noto come Generazione aumentata di recupero (RAG). Per altre informazioni, vedere Generazione aumentata di recupero (RAG).
Fondatezza o mancanza di fondatezza negli LLM: si riferisce alla misura in cui gli output del modello sono basati su informazioni fornite o riflettono in modo accurato origini affidabili. Una risposta fondata è strettamente conforme alle informazioni fornite, evitando speculazioni o invenzioni. Nelle misurazioni di fondatezza, le informazioni di origine sono fondamentali.

Opzioni di rilevamento della fondatezza

Le opzioni seguenti sono disponibili per il rilevamento della terra in Sicurezza dei contenuti di Intelligenza artificiale di Azure:

Selezione dominio: gli utenti possono scegliere un dominio stabilito per garantire un rilevamento più personalizzato in linea con le esigenze specifiche del campo. I domini disponibili correnti sono MEDICAL e GENERIC.
Specifica attività: questa funzionalità consente di selezionare l'attività che si sta eseguendo, ad esempio QnA (domande e risposte) e Riepilogo, con impostazioni regolabili in base al tipo di attività.
Velocità e interpretabilità: esistono due modalità che controbilanciano la velocità con l'interpretazione dei risultati.
- Modalità non di ragionamento: offre funzionalità di rilevamento rapido; facile da incorporare in applicazioni online.
- Modalità di ragionamento: offre spiegazioni dettagliate per i segmenti non in primo piano rilevati; migliore per la comprensione e la mitigazione.

Casi d'uso

Il rilevamento della fondatezza supporta attività di riepilogo e QnA basate su testo per garantire che i riepiloghi o le risposte generati siano accurati e affidabili. Ecco alcuni esempi di ogni caso d'uso:

Attività di riepilogo:

Riepilogo medico: nel contesto di articoli di notizie mediche, il rilevamento della fondatezza può essere usato per garantire che il riepilogo non contenga informazioni inventate o fuorvianti, garantendo che i lettori ottengano informazioni mediche accurate e affidabili.
Riepilogo di documenti accademici: quando il modello genera riepiloghi di articoli accademici o di ricerca, la funzione può contribuire a garantire che il contenuto riepilogato rappresenti accuratamente i risultati e i contributi chiave senza introdurre false attestazioni.

Attività QnA:

Chatbot di supporto clienti: nel supporto clienti, la funzione può essere usata per convalidare le risposte fornite dai chatbot di intelligenza artificiale, assicurandosi che i clienti ricevano informazioni accurate e affidabili quando fanno domande su prodotti o servizi.
Domande e risposte mediche: per le domande e risposte mediche, la funzione aiuta a verificare l'accuratezza delle risposte mediche e dei consigli forniti dai sistemi di IA ai professionisti sanitari e ai pazienti, riducendo il rischio di errori medici.
Domande e risposte didattiche: nelle impostazioni didattiche, la funzione può essere applicata alle attività di domande e risposte per verificare che le risposte alle domande accademiche o alle query di preparazione dei test siano effettivamente accurate, supportando il processo di apprendimento.

Correzione della fondatezza

L'API di rilevamento della fondatezza include una funzionalità di correzione che corregge automaticamente eventuali mancanze di fondatezza rilevate nel testo in base alle origini di fondatezza fornite. Quando la funzionalità di correzione è abilitata, la risposta include un campo corrected Text che presenta il testo corretto allineato alle origini di fondatezza.

Casi d'uso

Di seguito sono riportati diversi scenari comuni che illustrano come e quando applicare queste funzionalità per ottenere i risultati migliori.

Riepilogo nei contesti medici

Si stanno riepilogando i documenti medici ed è fondamentale che i nomi dei pazienti nei riepiloghi siano accurati e coerenti con le fonti di fondatezza fornite.

Richiesta API di esempio:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Risultato previsto:

La funzionalità di correzione rileva che Kevin è privo di fondatezza perché è in conflitto con l'origine di fondatezza Jane. L'API restituisce il testo corretto: "The patient name is Jane."

Attività di Domande e risposte (QnA) con i dati del servizio clienti

Si sta implementando un sistema di Domande e risposte (QnA) per un chatbot del servizio clienti. È essenziale che le risposte fornite dall'IA siano allineate alle informazioni più recenti e accurate disponibili.

Richiesta API di esempio:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Risultato previsto:

L'API rileva che 5% è privo di fondatezza perché non corrisponde all'origine di fondatezza fornita 4.5%. La risposta include il testo della correzione: "The interest rate is 4.5%."

Creazione di contenuto con dati storici

Stai creando contenuti che coinvolgono dati o eventi cronologici, in cui l'accuratezza è fondamentale per mantenere la credibilità ed evitare disinformazioni.

Richiesta API di esempio:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Risultato previsto:

L'API rileva la data 1065 non in primo piano e la corregge in base all'origine 1066 di terra. La risposta include il testo corretto: "The Battle of Hastings occurred in 1066."

Riepilogo della documentazione interna

Si stanno riepilogando documenti interni in cui i nomi dei prodotti, i numeri di versione o altri punti dati specifici devono rimanere coerenti.

Richiesta API di esempio:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Risultato previsto:

La funzionalità di correzione identifica SuperWidget v2.1 come non in primo piano e la SuperWidget v2.2 aggiorna nella risposta. La risposta restituisce il testo corretto: "Our latest product is SuperWidget v2.2."

Procedure consigliate

Attenersi alle procedure consigliate seguenti quando si configurano i sistemi RAG per ottenere prestazioni ottimali dall'API di rilevamento della fondatezza:

Quando si gestiscono nomi dei prodotti o numeri di versione, usare le origini di fondatezza direttamente dalle note sulla versione interne o dalla documentazione ufficiale del prodotto per garantire l'accuratezza.
Per il contenuto storico, confrontare le origini di fondatezza con database accademici o storici attendibili per garantire il massimo livello di accuratezza.
In un ambiente dinamico come finanza usare sempre le origini di fondatezza più recenti e affidabili per garantire che il sistema di intelligenza artificiale fornisca informazioni accurate e tempestive.
Assicurarsi sempre che le origini di fondatezza siano accurate e aggiornate, in particolare in campi sensibili come il settore sanitario. Ciò riduce al minimo il rischio di errori nel processo di riepilogo.

Limiti

Disponibilità nelle lingue

Attualmente, l'API di rilevamento della fondatezza supporta il contenuto in lingua inglese. Sebbene l’API non limiti l'invio di contenuti non in lingua inglese, non è possibile garantire lo stesso livello di qualità e accuratezza nell'analisi di tali contenuti in altre lingue. Si consiglia agli utenti di inviare principalmente contenuto in inglese per garantire i risultati più affidabili e accurati dell'API.

Limitazioni relative alla lunghezza del testo

Vedere Requisiti di input per le limitazioni massime della lunghezza del testo.

Aree di disponibilità

Per usare questa API, è necessario creare la risorsa Sicurezza dei contenuti di Azure AI nelle aree supportate. Vedere Disponibilità a livello di area.

Limitazioni della velocità

Vedere Frequenza delle query.

Se si necessita di frequenze più alte, mettersi in contatto per richiederle.

Passaggi successivi

Seguire l’avvio rapido per iniziare a usare Sicurezza dei contenuti di Azure AI per rilevare la fondatezza.

Guida introduttiva: Rilevamento della fondatezza

Condividi tramite

Rilevamento del grounding

Termini importanti

Opzioni di rilevamento della fondatezza

Casi d'uso

Correzione della fondatezza

Casi d'uso

Riepilogo nei contesti medici

Attività di Domande e risposte (QnA) con i dati del servizio clienti

Creazione di contenuto con dati storici

Riepilogo della documentazione interna

Procedure consigliate

Limiti

Disponibilità nelle lingue

Limitazioni relative alla lunghezza del testo

Aree di disponibilità

Limitazioni della velocità

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive