Azure AI 대상 언어 처리 기술 선택
Azure AI 서비스는 개발자와 조직이 미리 빌드되고 사용자 지정 가능한 API 및 모델 없이 즉시 사용 가능하고 시장 준비가 되어 있고 책임감 있는 최첨단 지능형 애플리케이션을 빠르게 만들 수 있도록 지원합니다.
이 문서에서는 NLP(자연어 처리), 텍스트 분석, 언어 이해, 번역 및 문서 데이터 추출과 같은 대상 언어 처리 기능을 제공하는 Azure AI 서비스에 대해 설명합니다. Azure AI Language는 Azure AI 서비스에서 가장 광범위한 범주 중 하나입니다. 워크로드의 API를 사용하여 명명된 엔터티 인식, 감정 분석, 언어 감지 및 텍스트 요약과 같은 언어 기능을 통합할 수 있습니다.
Services
다음 서비스는 Azure AI 서비스에 대한 대상 언어 처리 기능을 제공합니다.
Azure AI Language 는 텍스트 분석을 위한 자연어 처리를 제공합니다.
- 설명된 다양한 언어 관련 작업에 대해 구조화되거나 구조화되지 않은 문서로 작업해야 하는 경우 Azure AI Language 서비스를 사용합니다 .
- 채팅을 사용하여 문서를 검색하거나, 콘텐츠 보안을 확인하거나, 번역해야 하는 경우 언어 서비스를 사용하지 마세요.
Azure AI Translator 는 기계 번역 서비스입니다. 이는 실시간 텍스트 번역, 일괄 처리 및 단일 파일 문서 번역 및 사용자 지정 번역을 수행하여 특수 용어 또는 업계별 언어를 시나리오에 통합할 수 있습니다. 이는 다양한 언어를 지원합니다.
- 번역을 구체적으로 수행해야 하는 경우 Translator 서비스를 사용합니다 . 다른 범용 기본 언어 모델을 사용하여 번역을 수행할 수 있지만, 번역기를 특수 용도로 사용하면 보다 안정적으로 효과적일 수 있으며 대상 번역 모델을 사용하여 비용 효율적일 수 있습니다.
- 채팅에 참여하거나, 감정에 대한 콘텐츠를 분석하거나, con텐트 모드ration을 위해 Translator 서비스를 사용하지 마세요. 감정 분석의 경우 언어 서비스를 대신 사용합니다. content moderation의 경우 콘텐츠 안전 서비스를 사용합니다.
Azure AI Document Intelligence 는 이미지를 전자 양식으로 직접 변환할 수 있는 서비스입니다. 예상 필드를 지정한 다음 사용자가 제공한 이미지를 검색하여 사람의 개입 없이 해당 필드를 캡처할 수 있습니다. 이 서비스는 미리 빌드된 여러 모델을 호스트하며 사용자 고유의 사용자 지정 양식 모델을 빌드할 수도 있습니다.
- 전자 양식을 적절하게 채우기 위해 스캔한 문서에서 추출해야 하는 필드를 정확히 알고 있는 경우 문서 인텔리전스 서비스를 사용합니다 .
- Document Intelligence를 사용하여 다양한 문서 모음에서 키 구조(머리글, 바닥글, 장 나누기 등)를 식별하여 RAG(검색 보강 세대) 구현과 같이 문서와 프로그래밍 방식으로 상호 작용할 수 있습니다.
- 문서 인텔리전스 서비스를 실시간 검색 API로 사용하지 마세요.
Azure AI 언어
이 Azure AI Language 는 텍스트를 이해하고 분석하기 위한 NLP(자연어 처리) 기능을 제공하는 클라우드 기반 서비스입니다. 이 서비스를 사용하면 웹 기반 Language Studio, REST API 및 클라이언트 라이브러리를 사용하여 지능형 애플리케이션을 빌드할 수 있습니다.
기능
다음 표에서는 Azure AI Language Service에서 사용할 수 있는 기능 목록을 제공합니다.
기능 | 설명 |
---|---|
사용자 지정 질문 답변 | 사용자의 입력에 가장 적합한 답변을 찾으며, 일반적으로 소셜 미디어 애플리케이션, 챗봇 및 음성 지원 데스크톱 애플리케이션과 같은 대화형 클라이언트 애플리케이션을 빌드하는 데 사용됩니다. |
사용자 지정 텍스트 분류 | 사용자 지정 AI 모델을 구축하여 구조화되지 않은 텍스트 문서를 정의한 사용자 지정 클래스로 분류하는 데 사용합니다. |
CLU(대화 언어 이해) | 사용자 지정 자연어 이해 모델을 빌드하여 들어오는 발언에서 전반적인 의도를 예측하고 중요한 정보를 추출합니다. |
엔터티 연결 | 구조화되지 않은 텍스트에서 발견되는 엔터티(단어 또는 구문)의 ID를 명확화하고 Wikipedia에 대한 링크를 반환합니다. |
언어 감지 | 문서가 작성된 언어를 탐지하고 다양한 언어, 변형, 방언 및 일부 지역/문화 언어에 대한 언어 코드를 반환합니다. |
핵심 구문 추출 | 구조화되지 않은 텍스트의 기본 개념을 평가하고 반환하고 목록으로 반환합니다. |
NER(명명된 엔터티 인식) | 미리 정의된 여러 범주 그룹에 걸쳐 구조화되지 않은 텍스트로 엔터티(단어 또는 구)를 분류합니다. 예: 사람, 이벤트, 장소, 날짜, 등 |
오케스트레이션 워크플로 | 이 CLU(Conversational Language Understanding)을 연결하는데 사용합니다. |
개인 식별(PII) 및 건강(PHI) 정보 감지 | 두 구조화되지 않은 텍스트 문서와 대화 기록 모두에서 민감한 정보를 식별, 분류 및 수정합니다. 예: 전화 번호, 이메일 주소, 식별 형식 등. |
감정 분석 및 오피니언 마이닝 | 텍스트를 마이닝하여 긍정적이거나 부정적인 감정에 대한 단서를 찾아 사람들이 브랜드 또는 항목에 대해 어떻게 생각하는지 알아내는 데 도움이 되며 텍스트의 특정 측면과 연관시킬 수 있습니다. |
요약 | 추출 텍스트 요약을 사용하여 문서 및 대화 기록의 요약을 생성합니다. 원본 콘텐츠 내에서 가장 중요하거나 관련성 있는 정보를 집합적으로 나타내는 문장을 추출합니다. |
의료 분야 텍스트 분석 | 의사의 메모, 퇴원 요약, 임상 문서 및 전자 의료 레코드 같은 비정형 텍스트에서 관련 의료 정보를 추출하고 레이블을 지정합니다. 워크로드를 디자인할 때 이 클라우드 호스팅 기능의 처리 위치 및 데이터 상주를 평가하여 규정 준수 기대에 부합하는지 확인합니다. 일부 워크로드는 클라우드 호스팅 플랫폼으로 의료 데이터를 전송하는 용량이 제한될 수 있습니다. 이 API를 Docker 컨테이너로 사용하여 클라우드 또는 온-프레미스에서 자체 컴퓨팅을 호스트할 수 있으며, 이는 PaaS와 관련된 규정 준수 문제를 해결하는 데 도움이 될 수 있습니다. 자세한 내용은 상태 컨테이너에 Text Analytics 사용을 참조하세요 . |
사용 사례
다음 표에서는 Azure AI 언어 서비스에 사용할 수 있는 사용 사례 목록을 제공합니다.
*만약 기능이 사용자 지정 가능이면, 데이터를 구체적으로 맞추는 도구를 사용하여 AI 모델을 학습시킬 수 있습니다. 그렇지 않으면 기능이 미리 구성되어 있으므로 사용하는 AI 모델을 변경할 수 없습니다. 데이터를 보내고 애플리케이션에서 기능의 출력을 사용하기만 하면 됩니다.
Azure AI 번역기
Azure AI Translator 는 Azure AI 서비스 제품군의 일부인 기계 번역 서비스입니다. Translator는 많은 Microsoft 제품 및 서비스를 지원합니다.
기능
다음 표에서는 Azure AI Translator Service에서 사용할 수 있는 기능 목록을 제공합니다.
기능 | 설명 |
---|---|
텍스트 번역 | 실시간으로 지원되는 소스와 대상 언어 간에 텍스트 번역을 실행합니다. 동적 사전을 만들고 Translator API를 사용하여 번역을 방지하는 방법을 알아봅니다. |
문서 번역 | 비동기 배치 번역: 원본 문서의 구조와 형식을 유지하면서 배치 및 복잡한 파일을 번역합니다. 일괄 처리 번역 프로세스에는 원본 및 번역 문서에 대한 컨테이너가 포함된 Azure Blob Storage 계정이 필요합니다. 동기식 단일 파일 변환: 원본 문서의 구조와 형식을 유지하면서 단일 문서 파일을 단독으로 또는 용어집 파일로 번역합니다. 파일 번역 프로세스에는 Azure Blob Storage 계정이 필요하지 않습니다. 최종 응답에는 번역된 문서가 포함되어 있으며 호출 클라이언트에 직접 반환됩니다. |
Custom Translator | 도메인 및 산업별 언어, 용어 및 스타일을 번역하는 사용자 지정 모델을 빌드합니다. 사용자 지정 번역을 위한 사전(구 또는 문장)을 만듭니다. |
사용 사례
다음 표에서는 Azure AI 번역 서비스에 사용할 수 있는 사용 사례 목록을 제공합니다.
사용 사례 | 설명서 |
---|---|
산업별 텍스트를 번역합니다. | AI Services Custom Translator |
업계와 관련이 없는 일반 텍스트를 번역합니다. | Azure 텍스트 번역이란 |
Azure AI 문서 인텔리전스
이 Azure AI Language 는 텍스트를 이해하고 분석하기 위한 NLP(자연어 처리) 기능을 제공하는 클라우드 기반 서비스입니다. 이 서비스를 사용하면 웹 기반 Language Studio, REST API 및 클라이언트 라이브러리를 사용하여 지능형 애플리케이션을 빌드할 수 있습니다.
기능
다음 표에서는 Azure Document Intelligence 서비스에서 사용할 수 있는 몇 가지 기능 목록을 제공합니다.
기능 | 설명 |
---|---|
명함 추출 | 문서 인텔리전스 명함 모델은 OCR(광학 인식) 기능과 딥 러닝 모델을 결합하여 명함 이미지에서 데이터를 분석하고 추출합니다. API는 인쇄된 명함을 분석하고, 이름, 성, 회사 이름, 이메일 주소, 전화번호와 같은 주요 정보를 추출하고, 구조화된 JSON 데이터 표현을 반환합니다. |
계약 모델 추출 | Document Intelligence 계약 모델은 OCR(Optical Character Recognition) 기능을 사용하여 중요한 계약 엔터티의 선택된 그룹에서 주요 필드와 품목을 분석하고 추출합니다. 계약은 휴대폰으로 캡처한 이미지, 스캔한 문서, 디지털 PDF 등의 다양한 형식과 품질이 가능합니다. API는 문서 텍스트를 분석합니다. 당사자, 관할권, 계약 ID, 제목과 같은 주요 정보를 추출합니다. 구조화된 JSON 데이터 표현을 반환합니다. 이 모델은 현재 영어 문서 형식을 지원합니다. |
신용 카드 추출 | Document Intelligence 신용/직불 카드 모델은 OCR(광학 문자 인식) 기능을 사용하여 신용 카드 및 직불 카드에서 주요 필드를 분석하고 추출합니다. 신용 카드와 직불 카드는 휴대폰으로 캡처한 이미지, 스캔한 문서, 디지털 PDF 등 형식과 품질이 다양할 수 있습니다. API는 문서 텍스트를 분석합니다. 카드 번호, 발급 은행 및 만료 날짜와 같은 주요 정보를 추출하고 구조화된 JSON 데이터 표현을 반환합니다. 이 모델은 현재 영어 문서 형식을 지원합니다. |
건강 보험 카드 추출 | Document Intelligence 건강 보험 카드 모델은 광학 문자 인식(OCR) 기능과 딥 러닝 모델을 결합하여 미국 건강 보험 카드에서 주요 정보를 분석하고 추출합니다. 의료 보험 카드는 건강 검진을 위한 핵심 문서이며 환자 교육, 금융 적용 정보, 현금없는 지불 및 보험 청구 처리를 위해 디지털로 분석할 수 있습니다. 의료 보험 카드 모델은 의료 카드 이미지를 분석하고, 보험사, 회원, 처방전 및 그룹 번호와 같은 주요 정보를 추출하고, 구조화된 JSON 표현을 반환합니다. 의료 보험 카드는 휴대폰으로 캡처한 이미지, 스캔한 문서, 디지털 PDF 등 형식과 품질로 제공될 수 있습니다. |
미국 세금 문서 추출 | Document Intelligence 계약 모델은 OCR(Optical Character Recognition) 기능을 사용하여 세금 문서의 선택된 그룹에서 주요 필드와 품목을 분석하고 추출합니다. 세금 문서는 전화로 캡처한 이미지, 스캔한 문서, 디지털 PDF 등 다양한 형식과 품질을 가질 수 있습니다. API는 문서 텍스트를 분석합니다. 고객 이름, 청구서 수신 주소, 만기일, 결제 금액 등 주요 정보를 추출합니다. 구조화된 JSON 데이터 표현을 반환합니다. 이 모델은 현재 특정 영어 세금 문서 형식을 지원합니다. |
더 많은... | Azure AI 문서 인텔리전스는 앱 및 흐름에 지능형 문서 처리를 추가할 수 있는 다양한 모델을 지원합니다. 미리 빌드된 도메인별 모델을 사용하거나 특정 비즈니스 요구 사항과 사용 사례에 맞게 조정된 사용자 지정 모델을 학습시킬 수 있습니다. 문서 인텔리전스는 REST API 또는 Python, C#, Java 및 JavaScript 클라이언트 라이브러리와 함께 사용할 수 있습니다. |
시나리오 에 적합한 모델을 선택하는 방법에 대한 자세한 내용은 어떤 모델을 선택해야 하나요?