Freigeben über


Schritt 1. Klonen des Coderepositorys und Erstellen von Compute

Auswertungsgesteuerter Entwicklungsworkflow

Den Beispielcode aus diesem Abschnitt finden Sie in diesem GitHub-Repository. Sie können den Repositorycode auch als Vorlage verwenden, mit der Sie eigene KI-Anwendungen erstellen können.

Führen Sie die folgenden Schritte aus, um den Beispielcode in Ihren Databricks-Arbeitsbereich zu laden und die globalen Einstellungen für die Anwendung zu konfigurieren.

Anforderungen

  • Azure Databricks-Arbeitsbereich mit aktiviertem serverlosen Compute und aktivierter Unity Catalog-Instanz.
  • Vorhandener Endpunkt für die Mosaic AI-Vektorsuche oder Berechtigungen zum Erstellen eines neuen Endpunkts für die Vektorsuche (das Setup-Notebook erstellt in diesem Fall einen für Sie).
  • Schreibzugriff auf ein vorhandenes Unity Catalog-Schema, in dem die Delta-Ausgabetabellen, die die geparsten und unterteilten Dokumente sowie die Vektorsuchindizes enthalten, gespeichert werden, oder Berechtigungen zum Erstellen eines neuen Katalogs und Schemas (das Setup-Notebook erstellt in diesem Fall eins für Sie).
  • Ein einzelner Benutzercluster mit DBR 14.3 oder höher, der Zugriff auf das Internet hat. Internetzugriff ist erforderlich, um die erforderlichen Python- und Systempakete herunterzuladen. Verwenden Sie keinen Cluster mit Databricks Runtime für Machine Learning, da bei diesen Tutorials Python-Paketkonflikte mit Databricks Runtime ML auftreten.

Lernprogrammflussdiagramm

Das Diagramm zeigt den Ablauf der in diesem Lernprogramm verwendeten Schritte.

Ablauf von Notizbüchern, die im Lernprogramm verwendet werden

Anweisungen

  1. Klonen Sie dieses Repository mit Git-Ordnern in Ihrem Arbeitsbereich.

    Video zum Erstellen eines Git-Ordners

  2. Öffnen Sie das Notebook „rag_app_sample_code/00_global_config“, und passen Sie die Einstellungen dort an.

    # The name of the RAG application.  This is used to name the chain's model in Unity Catalog and prepended to the output Delta tables and vector indexes
    RAG_APP_NAME = 'my_agent_app'
    
    # Unity Catalog catalog and schema where outputs tables and indexes are saved
    # If this catalog/schema does not exist, you need create catalog/schema permissions.
    UC_CATALOG = f'{user_name}_catalog'
    UC_SCHEMA = f'rag_{user_name}'
    
    ## Name of model in Unity Catalog where the POC chain is logged
    UC_MODEL_NAME = f"{UC_CATALOG}.{UC_SCHEMA}.{RAG_APP_NAME}"
    
    # Vector Search endpoint where index is loaded
    # If this does not exist, it will be created
    VECTOR_SEARCH_ENDPOINT = f'{user_name}_vector_search'
    
    # Source location for documents
    # You need to create this location and add files
    SOURCE_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/source_docs"
    
  3. Öffnen Sie das Notebook „01_validate_config_and_create_resources“, und führen Sie es aus.

Nächster Schritt

Fahren Sie mit Bereitstellen des Proof of Concept fort.

< Vorherige: Voraussetzungen

Weiter: Schritt 2. Bereitstellen von POC und Sammeln von Feedback >