Condividi tramite


Vedi la sezione Curare uno spazio Genie efficace

L’obiettivo di curare uno spazio Genie è creare un ambiente in cui gli utenti aziendali possono porre domande in linguaggio naturale e ricevere risposte accurate e coerenti in base ai dati. Gli spazi genie utilizzano modelli avanzati che generano query sofisticate e comprendono le conoscenze generali del mondo.

La maggior parte delle domande aziendali è specifica del dominio, quindi il ruolo di un curatore spaziale consiste nel colmare il divario tra la conoscenza generale del mondo e il linguaggio specializzato usato in un dominio specifico o da una particolare azienda. I curatori utilizzano metadati e istruzioni per aiutare Genie a interpretare e rispondere accuratamente alle domande degli utenti aziendali. Questo articolo illustra le procedure consigliate e i principi che consentono di sviluppare uno spazio efficace.

Procedure consigliate per la definizione di un nuovo spazio

Le sezioni seguenti illustrano le procedure consigliate per la creazione di uno spazio efficace.

Iniziare in piccolo

La cura di uno spazio Genie è un processo iterativo. Quando si crea un nuovo spazio, iniziare il più piccolo possibile, con istruzioni minime e un set limitato di domande a cui rispondere. È quindi possibile aggiungere durante l’iterazione in base al feedback e al monitoraggio. Questo approccio semplifica la creazione e la gestione dello spazio e consente di curarlo in modo efficace in risposta alle esigenze degli utenti reali.

Utilizzare le linee guida seguenti per creare un piccolo spazio Genie:

  • Rimanere concentrati: includere solo le tabelle necessarie per rispondere alle domande da gestire. Mirare a cinque o meno tabelle. Maggiore è il livello di concentrazione della selezione, meglio è. Mantenere lo spazio limitato su una piccola quantità di dati è ideale, quindi limitare il numero di colonne nelle tabelle incluse.
  • Pianificare l'iterazione: iniziare con una configurazione minima per lo spazio, concentrandosi su tabelle essenziali e istruzioni di base. Aggiungere linee guida ed esempi più dettagliati durante il perfezionamento dello spazio nel tempo, invece di puntare inizialmente alla perfezione.
  • Compilazione su tabelle ben annotate: Genie usa i nomi delle colonne del Catalogo Unity e le descrizioni per generare risposte. Cancellare i nomi e le descrizioni delle colonne consentono di produrre risposte di alta qualità. Le descrizioni delle colonne devono offrire informazioni contestuali precise. Evitare dettagli ambigui o non necessari. Esaminare le descrizioni generate dall’intelligenza artificiale per ottenere precisione e chiarezza e usarle solo se sono allineate a ciò che si desidera fornire manualmente.

Chiedere a un esperto di dominio di definire lo spazio

Un creatore di spazio efficace deve comprendere i dati e le informazioni dettagliate che possono essere ottenute da esso. Gli analisti dei dati esperti di SQL hanno in genere le conoscenze e le competenze necessarie per curare lo spazio.

Definire lo scopo dello spazio

L’identificazione del pubblico e dello scopo specifici dello spazio consente di decidere quali dati, istruzioni e domande testare da utilizzare. Uno spazio deve rispondere a domande relative a un argomento e a un pubblico specifico, non a domande generali in vari domini.

Testare e regolare

Dovresti essere il primo utente dello spazio. Dopo aver creato un nuovo spazio, iniziare a porre domande. Esaminare attentamente il codice SQL generato in risposta alle domande. Se Genie interpreta erroneamente i dati, le domande o il gergo aziendale, è possibile intervenire modificando il codice SQL generato o fornendo altre istruzioni specifiche. Continuare a testare e modificare finché non si ottengono risposte affidabili.

Dopo aver esaminato una domanda, è possibile aggiungerla come domanda di benchmark che è possibile utilizzare per testare sistematicamente e assegnare punteggi allo spazio per l’accuratezza complessiva. È possibile utilizzare varianti e formulazioni diverse per testare le risposte di Genie. Vedere Usare i benchmark in uno spazio Genie.

Vedere Risoluzione dei problemi per idee sulla correzione di risposte errate.

Condurre i test dell’utente

Dopo aver verificato la qualità della risposta tramite test, reclutare un utente aziendale per provare lo spazio Genie. Utilizzare le linee guida seguenti per fornire un percorso utente semplice e raccogliere feedback per un miglioramento continuo:

  • Impostare le aspettative che il loro lavoro è quello di aiutare a perfezionare la stanza.
  • Chiedere loro di concentrare il test sull’argomento specifico e le domande che lo spazio è progettato per rispondere.
  • Se ricevono una risposta errata, invita gli utenti ad aggiungere istruzioni aggiuntive e chiarimenti nella chat per perfezionare la risposta. Quando viene fornita una risposta corretta, è necessario richiamare la query finale per ridurre al minimo gli errori simili nelle interazioni future.
  • Indicare agli utenti di richiamare o disattivare le risposte usando il meccanismo di feedback predefinito.
  • Invitare gli utenti a condividere commenti e suggerimenti aggiuntivi e domande non risolte direttamente con gli autori dello spazio. Gli autori e gli editor possono utilizzare il feedback per perfezionare istruzioni, esempi e asset attendibili.

Valutare la possibilità di fornire materiali di formazione o un documento scritto con linee guida per testare la sala e fornire feedback. Man mano che gli utenti aziendali testano lo spazio, verranno visualizzate le domande poste nella scheda Cronologia. Continuare ad aggiungere istruzioni per consentire a Genie di interpretare correttamente le domande e i dati per fornire risposte accurate. Per altre informazioni su come monitorare gli spazi Genie, vedere Rivedere la cronologia e il feedback.

Nota

Gli utenti aziendali devono essere membri dell’area di lavoro di origine per accedere allo spazio. Vedere Autorizzazioni necessarie per informazioni su come fornire le autorizzazioni appropriate per interagire con lo spazio.

Risoluzione dei problemi

Le sezioni seguenti illustrano come risolvere i problemi comuni.

Gergo commerciale frainteso

La maggior parte delle aziende o dei domini ha una sintassi abbreviata specifica usata per comunicare eventi specifici dell’azienda. Ad esempio, quando si fa riferimento a un anno, potrebbe sempre significare l’anno fiscale e l’anno fiscale potrebbe iniziare a febbraio o marzo anziché a gennaio. Per consentire a Genie di rispondere a queste domande in modo naturale e accurato, includere istruzioni che eseguono il mapping esplicito del gergo aziendale a parole e concetti che Genie può comprendere. Vedere Fornire istruzioni.

Utilizzo errato della tabella o della colonna

Se Genie tenta di eseguire il pull dei dati da una tabella non corretta o di eseguire analisi su colonne non corrette, è possibile modificare i dati in uno dei modi seguenti:

  • Fornire descrizioni chiare e precise: controllare le tabelle e i metadati associati per verificare che la terminologia usata corrisponda alla terminologia degli utenti nelle domande inviate. In caso contrario, perfezionare la descrizione o aggiungere un’istruzione che esegue il mapping della terminologia usata nella tabella alla terminologia usata nella domanda.
  • Aggiungere query di esempio: fornire query SQL di esempio che Genie può utilizzare per informazioni su come rispondere a determinate domande. Vedere Fornire istruzioni.
  • Rimuovere tabelle o colonne dallo spazio: alcune tabelle possono includere colonne o concetti sovrapposti che rendono difficile per Genie conoscere i dati da utilizzare in una risposta. Se possibile, rimuovere tabelle o colonne non necessarie o sovrapposte. Potrebbe essere necessario creare una vista che includa solo le colonne necessarie.

Errori di filtro

Le query generate spesso includono una WHERE clausola per filtrare i risultati in base a un valore specifico. Poiché Genie non ha visibilità sui dati effettivi, potrebbe impostare la WHERE clausola per filtrare il valore errato. Ad esempio, potrebbe provare a trovare la corrispondenza con il nome "California" quando la tabella usa abbreviazioni come "CA".

Per situazioni come questa, provare una delle strategie seguenti:

  • Se il set di valori di colonna è ragionevolmente piccolo, enumerare le stringhe valide per ogni descrizione della colonna. Inserire le virgolette intorno ai valori stringa, soprattutto se hanno spazi o numeri. In alcuni casi, per le enumerazioni comuni, è sufficiente dire “Utilizzare il codice ISO paese di tre lettere" invece di elencare ogni valore di stato.

Join non corretti

Se i riferimenti a chiavi esterne non sono definiti nel catalogo unity, lo spazio potrebbe non sapere come unire tabelle diverse.

Provare almeno una fra le seguenti soluzioni:

  • Definire i riferimenti di chiave esterna nel catalogo unity quando possibile. Vedere Clausole dei vincoli di arco.
  • Fornire query di esempio in cui unire le tabelle in modo standard.
  • Se le relazioni di chiave esterna delle tabelle non vengono specificate nel catalogo unity, documentarle nelle istruzioni.

Se nessuno di questi consente di risolvere il problema, creare un pre-join della tabella in una vista e usarlo come input per lo spazio. Questa strategia è utile per scenari di join più complessi, ad esempio self-join.

Problemi di calcolo delle metriche

Il modo in cui vengono calcolate le metriche e il rollup può essere arbitrariamente complicato e includere molti dettagli aziendali che lo spazio non riconosce. Ciò può causare una segnalazione errata.

Provare almeno una fra le seguenti soluzioni:

  • Se le metriche vengono aggregate dalle tabelle di base, fornire query SQL di esempio che calcolano ogni valore di rollup.
  • Se le metriche sono state pre-calcolate e si trovano in tabelle aggregate, spiegarne le informazioni nei commenti delle tabelle. Specificare aggregazioni valide per ogni metrica se è possibile eseguire il rollup delle metriche in tale tabella.
  • Se sql che si sta tentando di generare è molto complicato, provare a creare visualizzazioni che hanno già aggregato le metriche per lo spazio.

Ignorare le istruzioni

Anche se sono state illustrate le tabelle e le colonne nei commenti e sono state fornite istruzioni generali, lo spazio potrebbe non usarle correttamente.

Provare almeno una fra le seguenti operazioni:

  • Fornire query di esempio che usano correttamente le tabelle. Le query di esempio sono particolarmente efficaci per insegnare allo spazio come utilizzare i dati.
  • Creare viste dalle tabelle che offrono una visualizzazione più semplificata dei dati.
  • Esaminare le istruzioni e provare a concentrare lo spazio rimuovendo tabelle o istruzioni irrilevanti.
  • Provare ad avviare una nuova chat. Le interazioni precedenti potrebbero influenzare le risposte di Genie in una determinata chat, ma l’avvio di una nuova chat offre un punto di partenza vuoto per testare nuove istruzioni.

Problemi di prestazioni

Quando Genie deve generare query o risposte di testo estremamente lunghe, può richiedere molto tempo per rispondere o persino timeout durante la fase di pensiero.

Provare una o più delle azioni seguenti per migliorare le prestazioni:

  • Utilizzare asset o viste attendibili per incapsulare query complesse. Vedere Utilizzare asset attendibili in spazi di IA/BI Genie.
  • Ridurre la lunghezza delle query SQL di esempio quando possibile.
  • Avviare una nuova chat se Genie inizia a generare risposte lente o non riuscite.

Risposte inaffidabili alle domande cruciali

Utilizzare gli asset attendibili per fornire risposte verificate a domande specifiche che si prevede vengano poste dagli utenti. Vedere Utilizzare asset attendibili in spazi di IA/BI Genie.

Avviso relativo al limite di token

I token sono le unità di base del testo usate da Genie per elaborare e comprendere la lingua. Il testo incluso come istruzioni o metadati in uno spazio Genie viene convertito in token. Se il numero di token nello spazio sta per avvicinare il limite, il prodotto invia una notifica con avvisi. Genie applica il filtro del contesto intelligente per selezionare i token che rappresentano i metadati e alcuni tipi di istruzioni inclusi nello spazio Genie. Anche se si supera il limite, lo spazio deve continuare a generare risposte alle domande.

Se lo spazio Genie si avvicina al limite di token, Genie potrebbe classificare in ordine di priorità solo le parti dello schema di tabella e le istruzioni più rilevanti per la domanda. Ciò può ridurre la qualità della risposta se il contesto importante viene filtrato. Considerare le procedure seguenti per ridurre il numero di token:

  • Rimuovere le colonne non necessarie: le colonne non necessarie nelle tabelle possono contribuire in modo significativo all’utilizzo dei token. Creare viste per escludere campi ridondanti o non essenziali dalle tabelle non elaborate.
  • Semplificare le descrizioni delle colonne: mentre le descrizioni delle colonne sono importanti, evitare di duplicare le informazioni già trasmesse dai nomi delle colonne. Ad esempio, se una colonna è denominata account_name, una descrizione come “il nome dell'account” potrebbe essere ridondante e può essere omessa.
  • Semplificare le istruzioni: verificare che le istruzioni siano chiare e concise. Evitare parole non necessarie.
  • Eliminare le istruzioni SQL di esempio: includere un intervallo diversificato di istruzioni SQL di esempio per coprire vari tipi di domande, ma rimuovere esempi sovrapposti o ridondanti.

L'account non è abilitato per l'elaborazione tra aree geografiche

Genie è un servizio designato gestito da Azure Databricks. I servizi designati usano Databricks Geos per gestire la residenza dei dati. Per alcune aree, i dati non possono essere elaborati nella stessa area geografica dell'area di lavoro. Se l'area di lavoro si trova in una di queste aree, l'elaborazione tra aree deve essere abilitata dall'amministratore dell'account.