Condividi tramite


Avvio rapido: Creare un archivio conoscenze nel portale di Azure

In questa guida di avvio rapido, si crea un archivio conoscenze che funge da repository per l'output generato da una pipeline di arricchimento tramite intelligenza artificiale in Azure AI Search. Un archivio conoscenze rende disponibile il contenuto generato da Archiviazione di Azure per carichi di lavoro diversi dalla ricerca.

Prima di tutto, si configurano alcuni dati di esempio in Archiviazione di Azure. Quindi, si esegue la procedura guidata Importa dati per creare una pipeline di arricchimento che genera anche un archivio conoscenze. L'archivio conoscenze contiene contenuti originali estratti dall'origine dati, ad esempio recensioni dei clienti di un hotel, oltre a contenuti generati dall'intelligenza artificiale che includono un'etichetta del sentiment, l'estrazione di frasi chiave e la traduzione del testo dei commenti dei clienti non in inglese.

Prerequisiti

Prima di iniziare, è necessario che siano soddisfatti i prerequisiti seguenti:

Questa guida di avvio rapido usa inoltre Servizi di Azure AI di intelligenza artificiale per l'arricchimento tramite intelligenza artificiale. Poiché il carico di lavoro è molto ridotto, Servizi di Azure AI lavora dietro le quinte per offrire un'elaborazione gratuita per un massimo di 20 transazioni. Ciò significa che è possibile completare questo esercizio senza dover creare una risorsa multiservizio di Azure per intelligenza artificiale aggiuntiva.

Avviare la procedura guidata

  1. Accedere al portale di Azure con il proprio account Azure.

  2. Trovare il servizio di ricerca e quindi, nella pagina Panoramica, selezionare Importa dati sulla barra dei comandi per creare un archivio conoscenze in quattro passaggi.

    Screenshot del comando Importa dati

Passaggio 1: Creare un'origine dati

Poiché i dati si compongono di più righe in un singolo file CSV, impostare la modalità di analisi per ottenere un documento di ricerca per ogni riga.

  1. In Connetti ai dati, scegliere Archiviazione BLOB di Azure.

  2. In Nome, immettere "hotel-reviews-ds".

  3. In Dati da estrarre, scegliere Contenuto e metadati.

  4. In Modalità di analisi selezionare Testo delimitato e quindi selezionare la casella di controllo La prima riga contiene l'intestazione. Verificare che in Carattere di delimitazione sia impostata la virgola (,).

  5. In Stringa di connessione, scegliere una connessione esistente se l'account di archiviazione si trova nella stessa sottoscrizione. In caso contrario, incollare una stringa di connessione all'account di archiviazione di Azure.

    La stringa di connessione può essere ad accesso completo e presentare il formato seguente: DefaultEndpointsProtocol=https;AccountName=<YOUR-ACCOUNT-NAME>;AccountKey=<YOUR-ACCOUNT-KEY>;EndpointSuffix=core.windows.net

    In alternativa, una stringa di connessione può fare riferimento a un'identità gestita, presupponendo che sia configurata e assegnata a un ruolo in Archiviazione di Azure: ResourceId=/subscriptions/<YOUR-SUBSCRIPTION-ID>/resourceGroups/<YOUR-RESOURCE-GROUP-NAME>/providers/Microsoft.Storage/storageAccounts/<YOUR-ACCOUNT-NAME>;

  6. In Contenitori immettere il nome del contenitore BLOB in cui si trovano i dati, ovvero "hotel-reviews".

    La pagina sarà simile alla schermata seguente.

    Screenshot della definizione dell'origine dati

  7. Passare alla pagina successiva.

Passaggio 2: Aggiungere competenze

In questo passaggio della procedura guidata, aggiungere competenze per l'arricchimento tramite intelligenza artificiale. I dati di origine sono costituiti da recensioni dei clienti in inglese e francese. Le competenze pertinenti per questo set di dati includono l'estrazione di frasi chiave, il rilevamento del sentiment e la traduzione del testo. In un passaggio successivo questi arricchimenti vengono "proiettati" in un archivio conoscenze come tabelle di Azure.

  1. Espandere Collega Servizi di Azure AI. Gratuito (miglioramenti limitati) è l'impostazione predefinita. È possibile usare questa risorsa perché il numero di record in HotelReviews-Free.csv è 19 e questa risorsa gratuita consente fino a 20 transazioni al giorno.

  2. Espandere Aggiungi arricchimenti.

  3. In Nome set di competenze, immettere "hotel-reviews-ss".

  4. In Campo dei dati di origine selezionare reviews_text.

  5. In Livello di granularità arricchimento, selezionare Pagine (blocchi di 5000 caratteri).

  6. In Competenze cognitive testo, selezionare le competenze seguenti:

    • Estrarre le espressioni chiave
    • Tradurre un testo
    • Rilevamento lingua
    • Rileva sentiment

    La pagina dovrebbe avere un aspetto simile a quello dello screenshot seguente:

    Screenshot della definizione del set di competenze

  7. Scorrere verso il basso ed espandere Salva arricchimenti nell'archivio conoscenze.

  8. Selezionare Scegliere una connessione esistente e quindi selezionare un account di Archiviazione di Azure. Viene visualizzata la pagina Contenitori in modo da poter creare un contenitore per le proiezioni. È consigliabile adottare una convenzione di denominazione dei prefissi, ad esempio "kstore-hotel-reviews" per distinguere tra contenuto di origine e contenuto dell'archivio conoscenze.

  9. Tornando alla procedura guidata Importa dati, selezionare le proiezioni delle tabella di Azure seguenti. La procedura guidata offre sempre la proiezione Documenti. Sono disponibili altre proiezioni a seconda delle competenze selezionate (ad esempio Frasi chiave), o della granularità di arricchimento ( Pagine):

    • Documenti
    • Pagine
    • Frasi chiave

    Lo screenshot seguente mostra le selezioni delle proiezioni della tabella nella procedura guidata.

    Screenshot della definizione dell’archivio conoscenze

  10. Passare alla pagina successiva.

Passaggio 3: Configurare l'indice

In questo passaggio della procedura guidata si configura un indice per query di ricerca full-text facoltative. Non è necessario un indice di ricerca per l’archivio conoscenze, ma l'indicizzatore ne richiede uno per l'esecuzione.

In questo passaggio, la procedura guidata campiona l'origine dati per dedurre campi e tipi di dati. Non occorre fare altro che selezionare gli attributi per il comportamento desiderato. Ad esempio, l'attributo Recuperabile consente al servizio di ricerca di restituire un valore di campo, mentre l'attributo Ricercabile abilita la ricerca full-text nel campo.

  1. In Nome, immettere "hotel-reviews-idx".

  2. Per gli attributi, accettare le selezioni predefinite: Recuperabile e Ricercabile per i nuovi campi creati dalla pipeline.

    L'indice dovrebbe essere simile all'immagine seguente. Poiché l'elenco è lungo, non tutti i campi sono visibili nell'immagine.

    Screenshot della definizione dell'indice

  3. Passare alla pagina successiva.

Passaggio 4: Configurare ed eseguire l'indicizzatore

In questo passaggio della procedura guidata, configurare un indicizzatore che riunisce l'origine dati, il set di competenze e l'indice definiti nei passaggi precedenti.

  1. In Nome, immettere "hotel-reviews-idxr".

  2. In Pianificazione mantenere l'impostazione predefinita Una sola volta.

  3. Selezionare Invia per eseguire l'indicizzatore. Le operazioni di estrazione dei dati, indicizzazione e applicazione delle competenze cognitive vengono eseguite tutte in questo passaggio.

Passaggio 5: Controllare lo stato

Nella pagina Panoramica, aprire la scheda Indicizzatori al centro della pagina e quindi selezionare hotels-reviews-idxr. Entro un minuto o due, lo stato dovrebbe passare da "In corso" a "Operazione completata" con zero errori e avvisi.

Controllare le tabelle nel portale di Azure

  1. Nel portale di Azure, aprire l'account di archiviazione usato per creare l'archivio conoscenze.

  2. Nel riquadro di spostamento a sinistra dell'account di archiviazione, selezionare Browser archiviazione per visualizzare le nuove tabelle.

    Verranno visualizzate tre tabelle, una per ogni proiezione offerta nella sezione "Salva arricchimenti" della pagina "Aggiungi arricchimenti".

    • "hotelReviewssDocuments" contiene tutti i nodi di primo livello dell'albero di arricchimento di un documento che non sono raccolte.

    • "hotelReviewssKeyPhrases" contiene un lungo elenco di frasi chiave estratte da tutte le recensioni. Le competenze che generano raccolte (matrici), ad esempio frasi chiave ed entità, inviano l'output a una tabella autonoma.

    • "hotelReviewssPages" contiene campi arricchiti creati in ogni pagina che è stata separata dal documento. In questo set di competenze e origine dati, gli arricchimenti a livello di pagina sono costituiti da etichette del sentiment e testo tradotto. Quando si sceglie la granularità "pagine" nella definizione del set di competenze, viene creata una tabella di pagine, oppure una tabella di frasi, se si specifica quel particolare livello di granularità.

Tutte queste tabelle contengono colonne ID per supportare le relazioni tra tabelle in altri strumenti e app. Quando si apre una tabella, scorrere oltre questi campi per visualizzare i campi di contenuto aggiunti dalla pipeline.

In questa guida di avvio rapido, la tabella di "hotelReviewssPages" dovrebbe essere simile allo screenshot seguente:

Screenshot delle tabelle generate in Browser archiviazione

Eseguire la pulizia

Quando si lavora nella propria sottoscrizione, al termine di un progetto è buona norma determinare se le risorse create sono ancora necessarie. Le risorse che rimangono in esecuzione hanno un costo. È possibile eliminare risorse singole oppure gruppi di risorse per eliminare l'intero set di risorse.

Per trovare e gestire le risorse nel portale, usare il collegamento Tutte le risorse o Gruppi di risorse nel riquadro di spostamento a sinistra.

Se si usa un servizio gratuito, tenere presente che il numero di indicizzatori e origini dati è limitato a tre. Per non superare il limite, è possibile eliminare i singoli elementi nel portale.

Suggerimento

Se si vuole ripetere questo esercizio o provare una procedura dettagliata per l'arricchimento tramite intelligenza artificiale diversa, eliminare l'indicizzatore hotel-reviews-idxr e gli oggetti correlati per ricrearli. Eliminando l'indicizzatore, il contatore delle transazioni giornaliere gratuite viene azzerato.

Passaggi successivi

Ora che è stato introdotto un archivio conoscenze, esaminare in modo più approfondito ogni passaggio passando alla procedura dettagliata dell'API REST. Le attività gestite internamente dalla procedura guidata sono illustrate nella procedura dettagliata REST.