NER(명명된 엔터티 인식) 사용 방법
NER 기능은 구조화되지 않은 텍스트를 평가하고 미리 정의된 여러 범주(예: 사람, 위치, 이벤트, 제품 및 조직)의 텍스트에서 명명된 엔터티를 추출할 수 있습니다.
개발 옵션
명명된 엔터티 인식을 사용하려면 분석을 위해 원시 비구조적 텍스트를 제출하고 애플리케이션에서 API 출력을 처리합니다. 분석은 데이터에 사용되는 모델에 대한 추가 사용자 지정 없이 있는 그대로 수행됩니다. 명명된 엔터티 인식을 사용하는 방법에는 두 가지가 있습니다.
개발 옵션 | 설명 |
---|---|
Language Studio | Language Studio는 등록 시 Azure 계정 및 고유한 데이터 없이 텍스트 예제와 엔터티 링크 설정을 시도할 수 있는 웹 기반 플랫폼입니다. 자세한 내용은 Language Studio 웹 사이트 또는 Language Studio 빠른 시작을 참조하세요. |
REST API 또는 클라이언트 라이브러리(Azure SDK) | REST API 또는 다양한 언어로 제공되는 클라이언트 라이브러리를 사용하여 명명된 엔터티 인식을 애플리케이션에 통합합니다. 자세한 내용은 명명된 엔터티 인식 빠른 시작을 참조하세요. |
데이터 처리 방법 결정(선택 사항)
입력 언어
처리할 문서를 제출할 때 문서가 작성된 지원되는 언어를 지정할 수 있습니다. 언어를 지정하지 않으면 핵심 구 추출은 기본적으로 영어로 설정됩니다. API는 다양한 다국어 및 그림 이모티콘 인코딩을 지원하기 위해 응답에 오프셋을 반환할 수 있습니다.
데이터 제출
요청을 받으면 분석이 수행됩니다. NER 기능을 동기적으로 사용하는 것은 상태 비저장입니다. 계정에 데이터가 저장되지 않으며, 결과가 응답에서 즉시 반환됩니다.
이 기능을 비동기적으로 사용하는 경우 요청이 수집된 시간부터 24시간 동안 API 결과를 사용할 수 있으며 응답에 표시됩니다. 이 기간이 지나면 결과가 제거되고 더 이상 검색할 수 없습니다.
API는 지정된 문서 언어에 대해 정의된 항목 범주를 검색하려고 시도합니다.
NER 결과 얻기
NER에서 결과를 얻은 경우 결과를 애플리케이션으로 스트리밍하거나 출력을 로컬 시스템의 파일에 저장할 수 있습니다. API 응답에는 해당 범주 및 하위 범주 및 신뢰도 점수를 포함하여 인식된 엔터티가 포함됩니다.
반환할 엔터티 선택
API는 지정된 문서 언어에 대해 정의된 엔터티 형식 및 태그를 검색하려고 시도합니다 . 엔터티 형식 및 태그는 이전 모델에서 보다 유연하게 엔터티를 정의하기 위해 사용하는 범주 및 하위 범주 구조를 대체합니다. 적절한 엔터티 형식을 통해 선택적 includeList
및 excludeList
매개 변수를 사용하면 검색 및 반환되는 엔터티를 지정할 수도 있습니다. 다음 예에서는 Location
만 검색합니다. 반환할 엔터티 형식을 하나 이상 지정할 수 있습니다. 이 버전에 도입된 형식과 태그 계층 구조로 인해 다음과 같이 다양한 세분성 수준을 유연하게 필터링할 수 있습니다.
입력:
참고 항목
이 예제에서는 "Location" 엔터티 형식만 반환합니다.
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
위의 예제에서는 Location
에 속하는 엔터티인 GPE
, Structural
, Geological
태그가 지정된 엔터티 등을 엔터티 형식 및 태그에 설명된 대로 반환합니다. 또한 GPE
태그 필터링과 같은 Location
엔터티 형식 관련 엔터티 태그 가운데 하나를 설명된 대로만 필터링하여 반환된 엔터티를 추가로 필터링할 수 있습니다.
"parameters":
{
"includeList" :
[
"GPE"
]
}
이 메서드는 GPE
태그에만 속하는 모든 Location
엔터티를 반환하고 Structural
또는 Geological
태그가 지정된 Location
엔터티 같이 다른 엔터티 태그가 지정된 Location
형식에 속하는 나머지 엔터티를 무시합니다. excludeList
매개 변수를 사용하여 결과를 추가로 드릴다운할 수도 있습니다. GPE
태그가 지정된 엔터티는 City
, State
, CountryRegion
, Continent
태그를 지정할 수 있습니다. 예를 들어 예제에 맞게 Continent
태그와 CountryRegion
태그를 제외할 수 있습니다.
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
GPE
엔터티 태그가 includeList
매개 변수에 포함되어 Location
형식에 속하기 대문에 이러한 매개 변수를 사용하면 Location
엔터티 형식만 필터링할 수 있습니다. 그런 다음 지정학적 엔터티만 필터링하고 Continent
또는 CountryRegion
태그가 지정된 엔터티를 제외합니다.
추가 출력 특성
사용자에게 엔터티 형식에 대한 더 많은 인사이트를 제공하고 향상된 유용성을 제공하기 위해 NER는 출력에서 이러한 특성을 지원합니다.
특성의 이름 | Type | 정의 |
---|---|---|
type |
문자열 | 검색된 엔터티의 가장 구체적인 형식입니다. 예를 들어 "Seattle"은 ( City GPE Geo Political Entity) 및 a Location . "Seattle"에 대한 가장 세분화된 분류는 다음과 같습니다 City . 텍스트 "Seattle"의 형식입니다 City . |
tags |
목록(태그) | 검색된 엔터티의 선호도를 계층 구조 또는 다른 그룹화로 표현하는 태그 개체 목록입니다. 태그에는 다음 두 개의 필드가 포함됩니다. 1. name : 태그의 고유한 이름입니다.2. confidenceScore : 0에서 1 사이의 태그에 대한 관련 신뢰도 점수입니다.이 고유한 tagName은 및 exclusionList 매개 변수에서 필터링하는 inclusionList 데 사용됩니다. |
metadata |
Object | 메타데이터는 검색된 엔터티 형식에 대한 더 많은 데이터를 포함하는 개체입니다. 필드에 metadataKind 따라 변경됩니다. |
샘플 출력
이 샘플 출력에는 추가 출력 특성의 예가 포함되어 있습니다.
{
"kind": "EntityRecognitionResults",
"results": {
"documents": [
{
"id": "1",
"entities": [
{
"text": "Microsoft",
"category": "Organization",
"type": "Organization",
"offset": 0,
"length": 9,
"confidenceScore": 0.97,
"tags": [
{
"name": "Organization",
"confidenceScore": 0.97
}
]
},
{
"text": "One",
"category": "Quantity",
"type": "Number",
"subcategory": "Number",
"offset": 21,
"length": 3,
"confidenceScore": 0.9,
"tags": [
{
"name": "Number",
"confidenceScore": 0.8
},
{
"name": "Quantity",
"confidenceScore": 0.8
},
{
"name": "Numeric",
"confidenceScore": 0.8
}
],
"metadata": {
"metadataKind": "NumberMetadata",
"numberKind": "Integer",
"value": 1.0
}
}
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2023-09-01"
}
}
NER 모델 지정
기본적으로 이 기능은 텍스트에서 사용 가능한 최신 AI 모델을 사용합니다. 특정 모델 버전을 사용하도록 API 요청을 구성할 수도 있습니다.
서비스 및 데이터 제한
분당 및 초당 보낼 수 있는 요청의 크기와 수에 대한 내용은 서비스 제한 문서를 참조하세요.