LlamaIndex를 사용하여 RAG로 서버리스 AI 채팅 시작
아키텍처 개요
애플리케이션 흐름에는 다음이 포함됩니다.
- 채팅 인터페이스를 사용하여 프롬프트를 입력합니다.
- HTTP 호출을 통해 서버리스 API에 사용자의 프롬프트를 보냅니다.
- 사용자의 프롬프트를 받은 다음, LlamaIndex 프레임워크를 사용하여 응답을 처리하고 스트리밍합니다. 서버리스 API는 엔진을 사용하여 Azure OpenAI LLM(대규모 언어 모델) 및 LlamaIndex의 벡터 인덱스에 대한 연결을 만듭니다.
채팅 앱의 간단한 아키텍처는 다음 다이어그램에 나와 있습니다.
이 샘플에서는 LlamaIndex를 사용하여 embeddings를 생성하고 자체 벡터 저장소에 저장합니다. 또한 LlamaIndex는
이 아키텍처의 Azure는 어디에 있나요?
애플리케이션의 아키텍처는 다음 서비스 및 구성 요소를 사용합니다.
- Azure OpenAI 사용자의 쿼리를 보내는 AI 공급자를 나타냅니다.
- LlamaIndex는 콘텐츠(PDF 파일)를 수집, 변환 및 벡터화하고 데이터에서 검색 인덱스를 만드는 데 도움이 되는 프레임워크입니다.
- Azure Container Apps 애플리케이션이 호스트되는 컨테이너 환경입니다.
- Azure 관리 ID
클래스 보안을 최대한 보장하고 개발자가 자격 증명 및 API 키를 처리하기 위한 요구 사항을 제거하는 데 도움이 됩니다.
LlamaIndex는 수집에서 검색까지의 데이터를 관리합니다.
LlamaIndex를 사용하여 RAG(Retrieval-Augmented 세대) 시스템을 구현하기 위해 다음 주요 단계는 LlamaIndex 기능과 일치합니다.
프로세스 | 묘사 | LlamaIndex |
---|---|---|
데이터 수집 | PDF, API 또는 데이터베이스와 같은 원본에서 데이터를 가져옵니다. | SimpleDirectoryReader |
청크 문서 | 큰 문서를 더 작은 청크로 나눕니다. | 문장 분리기 |
벡터 인덱스 만들기 | 효율적인 유사성 검색을 위한 벡터 인덱스 만들기 | VectorStoreIndex |
인덱스에서 재귀 검색(선택 사항) | 계층적 검색을 사용하여 복잡한 데이터 세트를 관리합니다. | |
쿼리 엔진으로 변환 | 벡터 인덱스 쿼리 엔진으로 변환합니다. | asQueryEngine |
고급 쿼리 설정(선택 사항) | 다중 에이전트 시스템에 에이전트를 사용합니다. | |
RAG 파이프라인 구현 | 사용자 쿼리를 사용하고 관련 문서 청크를 검색하는 목표 함수를 정의합니다. | |
데이터 검색 수행 | 쿼리를 처리하고 문서를 재정렬합니다. | 리트리버쿼리엔진 (RetrieverQueryEngine), 코히어리랭크 (CohereRerank) |
필수 구성 요소
모든 종속성을 포함하여 이 문서를 완료하는 데 필요한 개발 컨테이너 환경을 사용할 수 있습니다. GitHub Codespaces(브라우저)에서 또는 Visual Studio Code를 사용하여 로컬로 개발 컨테이너를 실행할 수 있습니다.
이 문서를 사용하려면 다음 필수 구성 요소가 필요합니다.
- Azure 구독 - 무료로 만들기
- Azure 계정 권한 - Azure 계정에는 Microsoft.Authorization/roleAssignments/쓰기 권한이 있어야 하며, 예를 들어 사용자 액세스 관리자 또는 소유자가 해당합니다.
- GitHub 계정.
개발 환경 열기
다음 지침을 사용하여 이 문서를 완료하는 데 필요한 모든 종속성을 포함하는 미리 구성된 개발 환경을 배포합니다.
중요하다
모든 GitHub 계정은 2개의 핵심 인스턴스를 사용하여 매월 최대 60시간 동안 Codespaces를 무료로 사용할 수 있습니다. 자세한 내용은 GitHub Codespaces 월별 포함된 스토리지 및 코어 시간참조하세요.
배포 및 실행
샘플 리포지토리에는 서버리스 채팅 앱을 Azure에 배포하는 데 필요한 모든 코드 및 구성 파일이 포함되어 있습니다. 다음 단계에서는 Azure에 샘플을 배포하는 프로세스를 안내합니다.
Azure에 채팅 앱 배포
중요하다
이 섹션에서 생성된 Azure 리소스는 주로 Azure AI Search 리소스에서 비용이 즉시 발생합니다. 이러한 리소스는 명령이 완전히 실행되기 전에 중단하더라도 비용이 발생할 수 있습니다.
Azure 리소스를 프로비전하고 소스 코드를 배포하려면 다음 Azure Developer CLI 명령을 실행합니다.
azd up
다음 표를 사용하여 프롬프트에 응답합니다.
프롬프트 대답 환경 이름 짧게 하고 소문자로 유지하세요. 이름 또는 별칭을 추가합니다. 예를 들어 john-chat
. 리소스 그룹 이름의 일부로 사용됩니다.구독 구독을 선택하여 리소스를 생성합니다. 위치(호스팅용) 목록에서 가까운 위치를 선택합니다. OpenAI 모델의 위치 목록에서 가까운 위치를 선택합니다. 첫 번째 위치와 동일한 위치를 사용할 수 있는 경우 선택합니다. 앱이 배포될 때까지 기다립니다. 배포를 완료하는 데 5~10분이 걸릴 수 있습니다.
애플리케이션을 성공적으로 배포한 후 터미널에 두 개의 URL이 표시됩니다.
Deploying service webapp
레이블이 지정된 URL을 선택하여 브라우저에서 채팅 애플리케이션을 엽니다.
채팅 앱을 사용하여 PDF 파일에서 답변 가져오기
채팅 앱은 국내 우편물의 물리적 표준에 대한 정보를 담고 있는 PDF 파일 카탈로그로 미리 로드됩니다. 채팅 앱을 사용하여 우편 편지 및 패키지에 대한 질문을 할 수 있습니다. 다음 단계에서는 채팅 앱을 사용하는 과정을 안내합니다.
브라우저에서 프랑스로 대형 소포를 보내는 비용이 얼마인지 알아보세요..
LlamaIndex는 PDF 파일을 사용하여 답변을 도출하고 응답을 스트리밍합니다.
답변은 LlamaIndex 벡터 저장소에 수집된 PDF 데이터의 영향을 받은 Azure OpenAI에서 제공됩니다.
리소스 정리
리소스를 정리하기 위해 해결해야 할 두 가지 사항이 있습니다.
- Azure 리소스는 Azure Developer CLI, azd를 사용하여 리소스를 정리할 수 있습니다.
- 당신의 개발자 환경은 Visual Studio Code를 통해 GitHub Codespaces 또는 DevContainers를 사용하는 것입니다.
Azure 리소스 정리
이 문서에서 만든 Azure 리소스는 Azure 구독에 청구됩니다. 나중에 이러한 리소스가 필요하지 않은 경우 더 많은 요금이 발생하지 않도록 해당 리소스를 삭제합니다.
다음 Azure Developer CLI 명령을 실행하여 Azure 리소스를 삭제하고 소스 코드를 제거합니다.
azd down --purge
개발자 환경 정리
GitHub Codespaces 환경을 삭제하면 계정에서 받을 수 있는 코어당 무료 시간 혜택을 최대한 활용할 수 있습니다.
중요하다
GitHub 계정의 자격에 대한 자세한 내용은 GitHub Codespaces 월별 포함 스토리지 및 코어 시간을 참조하세요.
GitHub Codespaces 대시보드(https://github.com/codespaces)에 로그인합니다.
Azure-Samples/llama-index-javascript
GitHub 리포지토리에서 현재 실행 중인 Codespaces를 찾아보세요.코드스페이스에 대한 상황에 맞는 메뉴를 열고
...
, 그런 다음 삭제를 선택합니다.
도움 받기
이 샘플 리포지토리는 문제 해결 정보
문제가 해결되지 않으면 리포지토리의 문제에 문제를 기록하세요.
다음 단계
JavaScript 도우미 및 함수 호출