Sessioni di debug in Azure AI Search

Articolo
10/16/2024

Sessioni di debug è un editor visivo che funziona con set di competenze esistenti nel portale di Azure, esponendo la struttura e il contenuto di un unico documento arricchito, come generato da un indicizzatore e un set di competenze, per la durata della sessione. Poiché si usa un documento live, la sessione è interattiva; è possibile identificare gli errori, modificare e richiamare l'esecuzione delle competenze e convalidare i risultati in tempo reale. Se le modifiche risolvono il problema, è possibile eseguirne il commit in un set di competenze pubblicato per applicare le correzioni a livello globale.

Questo articolo illustra gli scenari supportati e la modalità di organizzazione dell'editor. Schede e sezioni dell'editor decomprimono livelli diversi del set di competenze in modo da poter esaminare la struttura, il flusso del set di competenze e il contenuto generato in fase di esecuzione.

Scenari supportati

Usare sessioni di debug per analizzare e risolvere i problemi relativi a:

Competenze predefinite usate per l’arricchimento tramite intelligenza artificiale, ad esempio OCR, analisi delle immagini, riconoscimento delle entità ed estrazione di parole chiave.
Competenze predefinite usate per la vettorizzazione integrata, con suddivisione dei dati tramite suddivisione del testo e vettorizzazione tramite una competenza di incorporamento.
Competenze personalizzate usate per integrare l'elaborazione esterna che si fornisce.

Confrontare le immagini di sessione di debug seguenti per i primi due scenari. Per entrambi gli scenari, l'area di attacco mostra la progressione delle competenze che generano o trasformano il contenuto durante l’instradamento dal documento di origine all'indice di ricerca. Il flusso include opzioni di mapping degli indici ed è possibile tracciare le frecce per seguire il percorso di elaborazione. Il riquadro dei dettagli a destra è sensibile al contesto. Mostra una rappresentazione del documento arricchito o i dettagli di una competenza o di un mapping.

La prima immagine mostra un modello per l'arricchimento tramite intelligenza artificiale applicato. Le competenze possono essere eseguite in sequenza o in parallelo se non sono presenti delle dipendenze. I mapping dei campi di output inviano contenuto arricchito o generato da strutture di dati in memoria ai campi in un indice.

La seconda immagine mostra un modello tipico per la vettorializzazione integrata. Le competenze per la vettorializzazione integrata in genere includono suddivisione del testo e una competenza di incorporamento. Una competenza Divisione testo suddivide un documento in pagine. Le competenze di incorporamento forniscono la vettorizzazione. I mapping di proiezione controllano la modalità di indicizzazione dei blocchi di contenuto. Questo set di competenze specifico ignora l'indice padre e crea un indice di soli contenuti in blocchi, usando i metadati per identificare l'origine del blocco.

Limiti

Le sessioni di debug funzionano con tutte le origini dati indicizzatore disponibili a livello generale e la maggior parte delle origini dati di anteprima, con le eccezioni seguenti:

Indicizzatore di SharePoint online.
Indicizzatore di Azure Cosmos DB per MongoDB.
Per Azure Cosmos DB per NoSQL: se si verifica un errore in una riga durante l'indicizzazione e non sono presenti metadati corrispondenti, la sessione di debug potrebbe non selezionare la riga corretta.
Per l'API SQL di Azure Cosmos DB: se una raccolta partizionata in precedenza non è stata partizionata, la sessione di debug non troverà il documento.
Per le competenze personalizzate: non è possibile usare un'identità gestita assegnata dall'utente per connettere una sessione di debug ad Archiviazione di Azure. Come indicato nei prerequisiti, è possibile usare un'identità gestita dal sistema o specificare una stringa di connessione di accesso completo che include una chiave. Per altre informazioni, vedere Connettere un servizio di ricerca ad altre risorse di Azure tramite un'identità gestita.
Attualmente, la possibilità di selezionare il documento di cui eseguire il debug non è disponibile. Questa limitazione non è permanente e verrà rimossa presto. Al momento, le sessioni di debug selezionano il primo documento nel contenitore o nella cartella dati di origine.

Funzionamento di una sessione di debug

Quando si avvia una sessione, il servizio di ricerca crea una copia del set di competenze, dell'indicizzatore e di un'origine dati contenente un singolo documento usato per testare il set di competenze. Tutto lo stato sessione viene salvato in un nuovo contenitore BLOB creato dal servizio Azure AI Search in un account di archiviazione di Azure fornito. Il nome del contenitore generato ha un prefisso ms-az-cognitive-search-debugsession. Il prefisso è obbligatorio perché riduce la possibilità di esportare accidentalmente i dati della sessione in un altro contenitore nell'account.

Una copia memorizzata nella cache del documento arricchito e del set di competenze viene caricata nell'editor visivo in modo da poter esaminare il contenuto e i metadati del documento arricchito, con la possibilità di controllare ogni nodo documento e modificare qualsiasi aspetto della definizione del set di competenze. Tutte le modifiche apportate all'interno della sessione vengono memorizzate nella cache. Queste modifiche non influiscono sul set di competenze pubblicato, a meno che non sia eseguito il commit. Il commit delle modifiche comporterà la sovrascrittura del set di competenze di produzione.

Se la pipeline di arricchimento non contiene errori, è possibile usare una sessione di debug per arricchire in modo incrementale un documento, testare e convalidare ogni modifica prima di eseguire il commit delle modifiche.

Eseguire il debug del layout della sessione

L'editor visivo è organizzato in un'area di superficie che mostra una progressione delle operazioni, a partire dal cracking del documento, seguito da competenze, mapping e indice.

Selezionare qualsiasi competenza o mapping e viene aperto un riquadro che mostra le informazioni pertinenti.

Seguire i collegamenti per approfondire l'elaborazione delle competenze. Ad esempio, lo screenshot seguente mostra l'output della prima iterazione della competenza Divisione testo.

Riquadro dei dettagli competenza

Il riquadro Dettagli competenza include le sezioni seguenti:

Iterazioni: mostra quante volte viene eseguita una competenza. È possibile controllare gli input e gli output di ognuno di essi.
impostazioni della competenza: visualizzare o modificare la definizione del set di competenze JSON.
Errori e avvisi: mostra gli errori o gli avvisi specifici di questa competenza.

Riquadro Struttura dei dati arricchita

Il riquadro struttura dei dati arricchita scorre verso il lato quando si seleziona il simbolo di freccia blu o nascosto. È una rappresentazione leggibile di ciò che contiene il documento arricchito. Gli screenshot precedenti in questo articolo mostrano esempi della struttura dei dati arricchita.

Passaggi successivi

Dopo aver compreso gli elementi delle sessioni di debug, avviare la prima sessione di debug in un set di competenze esistente.

Come eseguire il debug di un set di competenze

Condividi tramite