Condividi tramite


Passaggio 7. Distribuire e monitorare

Questo articolo fornisce indicazioni generali su come distribuire e monitorare l'applicazione RAG di modello di verifica.

Distribuire e monitorare

Dopo aver creato il modello di verifica RAG, valutarlo e migliorarne la qualità, è il momento di distribuire l'applicazione RAG nell'ambiente di produzione. È importante notare che questo non significa che è stato eseguito il monitoraggio delle prestazioni e la raccolta di commenti e suggerimenti. L'iterazione sulla qualità rimane estremamente importante, anche dopo la distribuzione, poiché i modelli di dati e di utilizzo possono cambiare nel tempo.

Con Databricks, la catena è pronta per la distribuzione così come è l'uso di Mosaic AI Agent Serving. Per istruzioni, vedere Distribuire un agente per l'applicazione di intelligenza artificiale generativa.

Distribuzione

La distribuzione corretta è fondamentale per garantire il corretto funzionamento e il successo della soluzione RAG. Quando si distribuisce l'applicazione RAG, tenere presente quanto segue:

  1. Identificare i punti di integrazione chiave
    • Analizzare i sistemi e i flussi di lavoro esistenti per determinare dove e come integrare la soluzione RAG.
    • Valutare se alcune integrazioni sono più critiche o complesse di altre e assegnare la priorità di conseguenza.
  2. Implementare il controllo delle versioni e la scalabilità
    • Configurare un sistema di controllo delle versioni per i modelli per facilitare il rilevamento e il rollback.
    • Progettare l'architettura di distribuzione per gestire in modo efficiente carichi e scalabilità crescenti, sfruttando strumenti come Databricks Model Serving.
  3. Verificare la sicurezza e il controllo di accesso
    • Seguire le procedure consigliate per la sicurezza durante la distribuzione della soluzione RAG, ad esempio la protezione degli endpoint e la protezione dei dati sensibili.
    • Implementare meccanismi di controllo di accesso appropriati per garantire che solo gli utenti autorizzati possano interagire con la soluzione RAG.

Monitoraggio

Dopo aver distribuito l'applicazione RAG, è essenziale monitorarne le prestazioni. L'utilizzo reale può rivelare problemi che potrebbero non essere stati evidenti durante i test e la valutazione precedenti. Inoltre, la modifica dei dati e dei requisiti può influire sulle prestazioni dell'applicazione nel tempo. Di seguito sono riportate importanti procedure di monitoraggio da seguire:

  1. Stabilire metriche di monitoraggio e registrazione
    • Definire le metriche delle prestazioni chiave per monitorare l'integrità e l'efficacia della soluzione RAG, ad esempio accuratezza, tempi di risposta e utilizzo delle risorse.
    • Implementare la registrazione completa per acquisire eventi, errori e interazioni utente importanti a scopo di debug e miglioramento.
  2. Configurare avvisi e canali di feedback
    • Configurare gli avvisi per notificare anomalie o problemi critici, consentendo la risoluzione proattiva dei problemi.
    • Fornire agli utenti canali per inviare commenti e suggerimenti sulla soluzione RAG e rivedere e rispondere regolarmente a questo feedback.
  3. Monitorare e migliorare continuamente
    • Analizzare continuamente le prestazioni della soluzione RAG usando le metriche di monitoraggio stabilite.
    • Usare le informazioni dettagliate ottenute dal monitoraggio per favorire miglioramenti iterativi e ottimizzazioni per la soluzione RAG.
  4. Eseguire controlli di integrità regolari
    • Pianificare controlli di integrità regolari per identificare e risolvere in modo proattivo eventuali problemi prima di influire sugli utenti.
    • Valutare se alcuni componenti o integrazioni sono più soggetti a problemi e richiedono un monitoraggio più approfondito.

< Precedente: Passaggio 6.1. Correggere la pipeline di dati

Tornare alla pagina di spostamento