편집

다음을 통해 공유


Azure의 이미지 분류

Azure Blob Storage
Azure Computer Vision
Azure Cosmos DB
Azure Event Grid
Azure 기능

솔루션 아이디어

이 문서에서는 솔루션 아이디어를 설명합니다. 클라우드 설계자는 이 지침을 사용하여 이 아키텍처의 일반적인 구현을 위한 주요 구성 요소를 시각화할 수 있습니다. 이 문서를 시작점으로 사용하여 워크로드의 특정 요구 사항에 맞는 잘 설계된 솔루션을 디자인할 수 있습니다.

Computer Vision API 및 Azure Functions와 같은 Azure 서비스를 사용하면 회사는 비용을 절감하고 Microsoft가 이미 Azure AI 서비스를 사용하여 이미지를 처리하면서 개발한 전문 지식을 활용하면서 개별 서버를 관리할 필요가 없습니다. 이 솔루션 아이디어는 특히 이미지 처리 사용 사례를 다룹니다. 다른 AI 요구 사항이 있는 경우 Azure AI 서비스의 전체 제품군 을 고려하세요.

아키텍처

이미지 분류 작업에 사용되는 아키텍처의 다이어그램입니다.

이 솔루션 아이디어의 Visio 파일을 다운로드합니다.

데이터 흐름

이 시나리오에서는 웹 또는 모바일 애플리케이션의 백 엔드 구성 요소에 대해 설명합니다. 시나리오를 통한 데이터 흐름은 다음과 같습니다.

  1. Blob Storage에 새 파일(이미지 업로드)을 추가하면 Azure Event Grid에 이벤트가 트리거됩니다. 업로드 프로세스는 웹 또는 모바일 애플리케이션을 통해 오케스트레이션할 수 있습니다. 또는 이미지를 Azure Blob Storage에 별도로 업로드할 수 있습니다.
  2. Event Grid는 Azure 함수를 트리거하는 알림을 보냅니다.
  3. Azure Functions는 Azure AI Vision API를 호출하여 새로 업로드된 이미지를 분석합니다. Azure AI Vision은 Azure Functions에서 구문 분석한 Blob URL을 통해 이미지에 액세스합니다.
  4. Azure Functions는 Azure Cosmos DB에서 AI Vision API 응답을 유지합니다. 이 응답에는 이미지 메타데이터와 함께 분석 결과가 포함됩니다.
  5. 해당 결과를 사용하고 웹 또는 모바일 프런트 엔드에 반영할 수 있습니다. 이러한 접급 방식은 업로드된 이미지가 아닌 분류 결과를 검색합니다.

구성 요소

  • Azure AI Vision 은 Azure AI 서비스 제품군의 일부이며 각 이미지에 대한 정보를 검색하는 데 사용됩니다.
  • Azure Functions는 웹 애플리케이션에 대한 백 엔드 API를 제공합니다. 이 플랫폼은 업로드된 이미지에 대한 이벤트 처리도 제공합니다.
  • Event Grid는 Blob Storage에 새 이미지가 업로드되면 이벤트를 트리거합니다. 그런 다음 Azure Functions를 사용하여 이미지를 처리합니다.
  • Azure Blob Storage는 웹 애플리케이션에 업로드되는 모든 이미지 파일과 웹 애플리케이션에서 사용하는 모든 정적 파일을 저장합니다.
  • Azure Cosmos DB는 Computer Vision API에서 처리한 결과를 포함하여 업로드된 각 이미지에 대한 메타데이터를 저장합니다.

대안

  • Azure OpenAI GPT-4 Turbo with Vision(미리 보기). GPT-4 Turbo with Vision은 이미지를 분석하고 질문에 대답할 수 있는 멀티모달 모델입니다.
  • Custom Vision Service. Computer Vision API는 일단의 분류 기반 범주를 반환합니다. Computer Vision API에서 반환하지 않는 정보를 처리해야 하는 경우 사용자 지정 이미지 분류기를 만들 수 있는 Custom Vision Service를 사용하는 것이 좋습니다.
  • Azure AI Search (이전의 Azure Search). 사용 사례에 메타데이터를 쿼리하여 특정 조건을 충족하는 이미지를 찾는 경우 Azure AI Search를 사용하는 것이 좋습니다. Azure AI 검색 은 이 워크플로를 원활하게 통합합니다.
  • Logic Apps. Blob에 추가된 파일에 대해 실시간으로 반응할 필요가 없는 경우 Logic Apps를 사용하는 것이 좋습니다. 파일이 추가되었는지 확인할 수 있는 논리 앱은 되풀이 트리거 또는 슬라이딩 윈도우 트리거에 의해 시작될 수 있습니다.
  • 문서에 이미지가 포함된 경우 Azure AI 문서 인텔리전스를 사용하여 해당 이미지를 찾습니다. 이 정보를 사용하여 포함된 이미지에서 추가 컴퓨터 비전 작업을 추출하고 수행할 수 있습니다. 문서 인텔리전스를 사용하여 Computer Vision API를 통해 받은 이미지의 다른 메타데이터와 함께 저장할 수 있는 페이지 번호 또는 캡션 텍스트와 같은 포함된 이미지에 대한 데이터를 수집합니다.

시나리오 정보

이 예제 시나리오는 이미지를 처리해야 하는 비즈니스와 관련이 있습니다.

잠재적인 애플리케이션에는 패션 웹 사이트에 대한 이미지 분류, 보험 청구에 대한 텍스트 및 이미지 분석 또는 게임 스크린샷의 원격 분석 데이터 인식이 포함됩니다. 일반적으로 회사에서는 기계 학습 모델에 대한 전문 지식을 개발하고, 모델을 학습하며, 마지막으로 사용자 지정 프로세스를 통해 이미지를 실행하여 이미지에서 데이터를 가져와야 합니다.

잠재적인 사용 사례

이 솔루션은 소매, 게임, 금융 및 보험 산업에 이상적입니다. 관련된 다른 사용 사례는 다음과 같습니다.

  • 패션 웹 사이트에서 이미지 분류 판매용 플랫폼에서 제품 사진을 업로드하는 동안 판매자가 이미지 분류를 사용할 수 있습니다. 그런 다음 관련된 수동 태그 지정을 자동화할 수 있습니다. 고객은 제품의 시각적 인상을 통해 검색할 수도 있습니다.

  • 게임 스크린샷의 원격 분석 데이터 분류 스크린샷에서 비디오 게임의 분류는 컴퓨터 비전과 함께 소셜 미디어의 관련 문제로 진화하고 있습니다. 예를 들어 Twitch 스트리머가 연속해서 다른 게임을 플레이할 때 스트림 정보 수동 업데이트를 건너뛸 수 있습니다. 스트림 정보를 업데이트하지 않으면 사용자 검색에서 스트림이 잘못 분류될 수 있으며 콘텐츠 작성자와 스트리밍 플랫폼 모두에 대한 잠재적인 시청률이 손실될 수 있습니다. 새로운 게임을 소개하는 동안 사용자 지정 모델 경로는 해당 게임에서 새로운 이미지를 감지하는 기능을 도입하는 데 도움이 될 수 있습니다.

  • 보험 청구의 이미지 분류 이미지 분류는 클레임 처리 및 인수의 시간과 비용을 줄이는 데 도움이 될 수 있습니다. 자연 재해 피해, 차량 손상을 분석하고 주거 및 상업용 자산을 식별하는 데 도움이 될 수 있습니다.

다음 단계

제품 설명서

단계별 학습 경로는 다음을 참조하세요.

이미지 및 텍스트 처리와 함께 AI 보강 사용