Skillsets - Create
검색 서비스에 새 기술 세트를 만듭니다.
POST {endpoint}/skillsets?api-version=2023-11-01
URI 매개 변수
Name | In(다음 안에) | 필수 | 형식 | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
검색 서비스의 엔드포인트 URL입니다. |
api-version
|
query | True |
string |
클라이언트 API 버전. |
요청 헤더
Name | 필수 | 형식 | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
디버깅에 도움이 되는 요청과 함께 전송된 추적 ID입니다. |
요청 본문
Name | 필수 | 형식 | Description |
---|---|---|---|
name | True |
string |
기술 세트의 이름입니다. |
skills | True |
SearchIndexerSkill[]:
|
기술 세트의 기술 목록입니다. |
@odata.etag |
string |
기술 세트의 ETag입니다. |
|
cognitiveServices | CognitiveServicesAccount: |
기술을 실행할 때 사용할 Azure AI 서비스에 대한 세부 정보입니다. |
|
description |
string |
기술 세트에 대한 설명입니다. |
|
encryptionKey |
Azure Key Vault 만드는 암호화 키에 대한 설명입니다. 이 키는 Microsoft가 아닌 누구도 기술 세트 정의의 암호를 해독할 수 없다는 완전한 보증을 원할 때 기술 세트 정의에 대한 추가 수준의 미사용 암호화를 제공하는 데 사용됩니다. 기술 세트 정의를 암호화한 후에는 항상 암호화된 상태로 유지됩니다. 검색 서비스는 이 속성을 null로 설정하려는 시도를 무시합니다. 암호화 키를 회전하려는 경우 필요에 따라 이 속성을 변경할 수 있습니다. 기술 세트 정의는 영향을 받지 않습니다. 고객 관리형 키를 사용하는 암호화는 무료 검색 서비스에 사용할 수 없으며 2019년 1월 1일 또는 그 이후에 생성된 유료 서비스에만 사용할 수 있습니다. |
||
knowledgeStore |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션의 정의입니다. |
응답
Name | 형식 | Description |
---|---|---|
201 Created |
기술 세트가 성공적으로 생성되었습니다. |
|
Other Status Codes |
오류 응답입니다. |
예제
SearchServiceCreateSkillset
샘플 요청
POST https://myservice.search.windows.net/skillsets?api-version=2023-11-01
{
"name": "demoskillset",
"description": "Extract entities, detect language and extract key-phrases",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.EntityRecognitionSkill",
"categories": [
"organization"
],
"defaultLanguageCode": "en",
"minimumPrecision": 0.7,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "organizations",
"targetName": "organizations"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"textSplitMode": "pages",
"maximumPageLength": 4000,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "MyCustomWebApiSkill",
"uri": "https://contoso.example.org",
"httpMethod": "POST",
"timeout": "PT30S",
"batchSize": 1,
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
],
"httpHeaders": {}
}
],
"knowledgeStore": {
"storageConnectionString": "DefaultEndpointsProtocol=https;AccountName=myStorage;AccountKey=myStorageKey;EndpointSuffix=core.windows.net",
"projections": [
{
"tables": [
{
"tableName": "Reviews",
"generatedKeyName": "ReviewId",
"source": "/document/Review",
"sourceContext": null,
"inputs": []
},
{
"tableName": "Sentences",
"generatedKeyName": "SentenceId",
"source": "/document/Review/Sentences/*",
"sourceContext": null,
"inputs": []
},
{
"tableName": "KeyPhrases",
"generatedKeyName": "KeyPhraseId",
"source": "/document/Review/Sentences/*/KeyPhrases",
"sourceContext": null,
"inputs": []
},
{
"tableName": "Entities",
"generatedKeyName": "EntityId",
"source": "/document/Review/Sentences/*/Entities/*",
"sourceContext": null,
"inputs": []
}
]
},
{
"objects": [
{
"storageContainer": "Reviews",
"source": "/document/Review",
"generatedKeyName": "/document/Review/Id"
}
]
}
]
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": "<applicationSecret>"
}
}
}
샘플 응답
{
"name": "demoskillset",
"description": "Extract entities, detect language and extract key-phrases",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.EntityRecognitionSkill",
"name": "#1",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "organizations",
"targetName": "organizations"
}
],
"categories": [
"organization"
],
"defaultLanguageCode": "en",
"minimumPrecision": 0.7
},
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "#2",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "#3",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
],
"defaultLanguageCode": null,
"textSplitMode": "pages",
"maximumPageLength": 4000
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "#4",
"description": null,
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
],
"defaultLanguageCode": null,
"maxKeyPhraseCount": null
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "MyCustomWebApiSkill",
"description": null,
"context": "/document",
"uri": "https://contoso.example.org",
"httpMethod": "POST",
"timeout": "PT30S",
"batchSize": 1,
"degreeOfParallelism": null,
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
],
"httpHeaders": {}
}
],
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
}
}
정의
Name | Description |
---|---|
Azure |
Azure Key Vault 저장된 암호화 키에 대한 인증된 액세스에 사용되는 검색 서비스에 대해 생성된 등록된 애플리케이션의 자격 증명입니다. |
Cognitive |
기술 세트에 연결된 키로 프로비전된 Azure AI 서비스 리소스입니다. |
Conditional |
부울 작업이 필요한 시나리오에서 출력에 할당할 데이터를 결정할 수 있는 기술입니다. |
Custom |
찾은 일치 항목 및 관련 메타데이터에 대한 정보를 포함하는 개체입니다. |
Custom |
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복합 개체입니다. |
Custom |
기술은 사용자 정의 단어 및 구의 사용자 정의 목록에서 텍스트를 찾습니다. |
Custom |
CustomEntityLookupSkill에서 입력 텍스트에 지원되는 언어 코드입니다. |
Default |
기술 세트의 기본 Azure AI 서비스 리소스를 나타내는 빈 개체입니다. |
Document |
보강 파이프라인 내의 파일에서 콘텐츠를 추출하는 기술입니다. |
Entity |
반환할 엔터티 범주를 나타내는 문자열입니다. |
Entity |
Text Analytics API를 사용하여 텍스트에서 연결된 엔터티를 추출합니다. |
Entity |
텍스트 분석 엔터티 인식. |
Entity |
EntityRecognitionSkill에서 입력 텍스트에 지원되는 언어 코드입니다. |
Entity |
Text Analytics API를 사용하여 텍스트에서 다양한 형식의 엔터티를 추출합니다. |
Image |
이미지 파일을 분석하는 기술입니다. 이미지 콘텐츠에 따라 다양한 시각적 기능 집합을 추출합니다. |
Image |
ImageAnalysisSkill에서 입력할 수 있는 언어 코드입니다. |
Image |
반환할 도메인별 세부 정보를 나타내는 문자열입니다. |
Input |
기술에 대한 입력 필드 매핑입니다. |
Key |
핵심 구 추출에 텍스트 분석을 사용하는 기술입니다. |
Key |
KeyPhraseExtractionSkill에서 입력 텍스트에 지원되는 언어 코드입니다. |
Language |
입력 텍스트의 언어를 감지하고 요청에 따라 제출된 모든 문서에 대해 단일 언어 코드를 보고하는 기술입니다. 언어 코드는 분석의 신뢰도를 나타내는 점수와 쌍을 이집니다. |
Merge |
두 개 이상의 문자열을 단일 통합 문자열로 병합하는 기술이며, 선택적 사용자 정의 구분 기호는 각 구성 요소 부분을 구분합니다. |
Ocr |
이미지 파일에서 텍스트를 추출하는 기술입니다. |
Ocr |
OcrSkill에서 입력할 수 있는 언어 코드입니다. |
Output |
기술에 대한 출력 필드 매핑입니다. |
PIIDetection |
Text Analytics API를 사용하여 입력 텍스트에서 개인 정보를 추출하고 마스킹 옵션을 제공합니다. |
PIIDetection |
입력 텍스트에서 검색된 개인 정보를 마스킹하는 데 사용할 maskingMode를 나타내는 문자열입니다. |
Search |
API에 대한 오류 조건에 대해 설명합니다. |
Search |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다. |
Search |
Azure Files 저장할 데이터에 대한 프로젝션 정의입니다. |
Search |
Azure Blob에 저장할 데이터에 대한 프로젝션 정의입니다. |
Search |
다양한 프로젝션 선택기의 컨테이너 개체입니다. |
Search |
Azure Tables에 저장할 데이터에 대한 설명입니다. |
Search |
기술 목록입니다. |
Search |
Azure Key Vault 고객 관리형 암호화 키입니다. 만들고 관리하는 키를 사용하여 인덱스 및 동의어 맵과 같은 검색 서비스에서 미사용 데이터를 암호화하거나 암호 해독할 수 있습니다. |
Sentiment |
텍스트 분석은 0에서 1까지의 범위에서 부동 소수점 값으로 점수가 매기된 긍정-부정 감정 분석입니다. |
Sentiment |
SentimentSkill의 입력 텍스트에 지원되는 언어 코드입니다. |
Sentiment |
Text Analytics API를 사용하여 구조화되지 않은 텍스트를 평가하고 각 레코드에 대해 문장 및 문서 수준에서 서비스에서 찾은 가장 높은 신뢰도 점수를 기반으로 감정 레이블(예: "부정", "중립" 및 "긍정")을 제공합니다. |
Shaper |
출력을 재구성하기 위한 기술입니다. 복합 필드(다중 파트 필드라고도 함)를 지원하는 복합 형식을 만듭니다. |
Split |
문자열을 텍스트 청크로 분할하는 기술입니다. |
Split |
SplitSkill에서 입력 텍스트에 지원되는 언어 코드입니다. |
Text |
수행할 분할 모드를 나타내는 값입니다. |
Text |
텍스트를 한 언어에서 다른 언어로 번역하는 기술입니다. |
Text |
TextTranslationSkill에서 입력 텍스트에 지원되는 언어 코드입니다. |
Visual |
반환할 시각적 기능 유형을 나타내는 문자열입니다. |
Web |
Web API 엔드포인트를 호출할 수 있는 기술로, 사용자 지정 코드를 호출하여 기술 세트를 확장할 수 있습니다. |
AzureActiveDirectoryApplicationCredentials
Azure Key Vault 저장된 암호화 키에 대한 인증된 액세스에 사용되는 검색 서비스에 대해 생성된 등록된 애플리케이션의 자격 증명입니다.
Name | 형식 | Description |
---|---|---|
applicationId |
string |
미사용 데이터를 암호화할 때 사용할 Azure Key Vault 필요한 액세스 권한이 부여된 AAD 애플리케이션 ID입니다. 애플리케이션 ID는 AAD 애플리케이션의 개체 ID와 혼동해서는 안 됩니다. |
applicationSecret |
string |
지정된 AAD 애플리케이션의 인증 키입니다. |
CognitiveServicesAccountKey
기술 세트에 연결된 키로 프로비전된 Azure AI 서비스 리소스입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 세트에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다. |
description |
string |
기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다. |
key |
string |
기술 세트에 연결된 Azure AI 서비스 리소스를 프로비전하는 데 사용되는 키입니다. |
ConditionalSkill
부울 작업이 필요한 시나리오에서 출력에 할당할 데이터를 결정할 수 있는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
CustomEntity
찾은 일치 항목 및 관련 메타데이터에 대한 정보를 포함하는 개체입니다.
Name | 형식 | Description |
---|---|---|
accentSensitive |
boolean |
기본값은 false입니다. 엔터티 이름과의 비교가 악센트에 민감해야 하는지 여부를 나타내는 부울 값입니다. |
aliases |
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복잡한 개체의 배열입니다. |
|
caseSensitive |
boolean |
기본값은 false입니다. 엔터티 이름과 비교할 때 대/소문자를 구분해야 하는지를 나타내는 부울 값입니다. "Microsoft"의 샘플 대/소문자를 구분하지 않는 일치 항목은 microsoft, microSoft, MICROSOFT일 수 있습니다. |
defaultAccentSensitive |
boolean |
이 엔터티의 기본 악센트 구분 값을 변경합니다. 모든 별칭 accentSensitive 값의 기본값을 변경하는 데 사용됩니다. |
defaultCaseSensitive |
boolean |
이 엔터티의 기본 대/소문자 민감도 값을 변경합니다. 모든 별칭 caseSensitive 값의 기본값을 변경하는 데 사용됩니다. |
defaultFuzzyEditDistance |
integer |
이 엔터티의 기본 유사 항목 편집 거리 값을 변경합니다. 모든 별칭 fuzzyEditDistance 값의 기본값을 변경하는 데 사용합니다. |
description |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 일치하는 모든 엔터티에서 이 필드의 값이 기술 출력에 표시됩니다. |
fuzzyEditDistance |
integer |
기본값은 0입니다. 최댓값은 5입니다. 엔터티 이름과 일치하는 것으로 여겨질 수 있는 허용 가능한 다른 문자 수를 나타냅니다. 각 일치에 대한 최소 허용량이 반환됩니다. instance 경우 편집 거리가 3으로 설정된 경우 "Windows10"은 여전히 "Windows", "Windows10" 및 "Windows 7"과 일치합니다. 대/소문자 구분이 false로 설정된 경우 대/소문자 차이는 허용 오차에 포함되지 않지만 그렇지 않은 경우에는 포함됩니다. |
id |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 일치하는 모든 엔터티에서 이 필드의 값이 기술 출력에 표시됩니다. |
name |
string |
최상위 엔터티 설명자입니다. 기술 출력의 일치 항목은 이 이름으로 그룹화되고 검색되는 텍스트의 “정규화된” 형식을 나타냅니다. |
subtype |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 일치하는 모든 엔터티에서 이 필드의 값이 기술 출력에 표시됩니다. |
type |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 일치하는 모든 엔터티에서 이 필드의 값이 기술 출력에 표시됩니다. |
CustomEntityAlias
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복합 개체입니다.
Name | 형식 | Description |
---|---|---|
accentSensitive |
boolean |
별칭이 악센트를 구분하는지 확인합니다. |
caseSensitive |
boolean |
별칭이 대/소문자를 구분하는지 확인합니다. |
fuzzyEditDistance |
integer |
별칭의 유사 항목 편집 거리를 결정합니다. |
text |
string |
별칭의 텍스트입니다. |
CustomEntityLookupSkill
기술은 사용자 정의 단어 및 구의 사용자 정의 목록에서 텍스트를 찾습니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
entitiesDefinitionUri |
string |
일치시킬 대상 텍스트를 모두 포함하는 JSON 또는 CSV 파일의 경로입니다. 이 엔터티 정의는 인덱서 실행의 시작 부분에서 읽습니다. 인덱서 실행 중에 이 파일에 대한 모든 업데이트는 후속 실행까지 적용되지 않습니다. 이 구성은 HTTPS로 액세스할 수 있어야 합니다. |
globalDefaultAccentSensitive |
boolean |
AccentSensitive의 전역 플래그입니다. CustomEntity에서 AccentSensitive가 설정되지 않은 경우 이 값이 기본값이 됩니다. |
globalDefaultCaseSensitive |
boolean |
CaseSensitive의 전역 플래그입니다. CaseSensitive가 CustomEntity에서 설정되지 않은 경우 이 값이 기본값이 됩니다. |
globalDefaultFuzzyEditDistance |
integer |
FuzzyEditDistance에 대한 전역 플래그입니다. CustomEntity에서 FuzzyEditDistance가 설정되지 않은 경우 이 값이 기본값이 됩니다. |
inlineEntitiesDefinition |
인라인 CustomEntity 정의입니다. |
|
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
CustomEntityLookupSkillLanguage
CustomEntityLookupSkill에서 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
da |
string |
덴마크어 |
de |
string |
독일어 |
en |
string |
영어 |
es |
string |
스페인어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
it |
string |
이탈리아어 |
ko |
string |
한국어 |
pt |
string |
포르투갈어 |
DefaultCognitiveServicesAccount
기술 세트의 기본 Azure AI 서비스 리소스를 나타내는 빈 개체입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 세트에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다. |
description |
string |
기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다. |
DocumentExtractionSkill
보강 파이프라인 내의 파일에서 콘텐츠를 추출하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
configuration |
object |
기술에 대한 구성 사전입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
dataToExtract |
string |
기술에 대해 추출할 데이터 형식입니다. 정의되지 않은 경우 'contentAndMetadata'로 설정됩니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
parsingMode |
string |
기술에 대한 parsingMode입니다. 정의되지 않은 경우 '기본값'으로 설정됩니다. |
EntityCategory
반환할 엔터티 범주를 나타내는 문자열입니다.
Name | 형식 | Description |
---|---|---|
datetime |
string |
날짜 및 시간을 설명하는 엔터티입니다. |
string |
전자 메일 주소를 설명하는 엔터티입니다. |
|
location |
string |
물리적 위치를 설명하는 엔터티입니다. |
organization |
string |
organization 설명하는 엔터티입니다. |
person |
string |
사람을 설명하는 엔터티입니다. |
quantity |
string |
수량을 설명하는 엔터티입니다. |
url |
string |
URL을 설명하는 엔터티입니다. |
EntityLinkingSkill
Text Analytics API를 사용하여 텍스트에서 연결된 엔터티를 추출합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
minimumPrecision |
number |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정된 경우 모든 엔터티가 포함됩니다. |
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정되지 않은 경우 기본적으로 사용 가능한 최신 버전을 지정합니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
EntityRecognitionSkill
텍스트 분석 엔터티 인식.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
categories |
추출해야 하는 엔터티 범주 목록입니다. |
|
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
includeTypelessEntities |
boolean |
잘 알려져 있지만 미리 정의된 형식을 준수하지 않는 엔터티를 포함할지 여부를 결정합니다. 이 구성이 설정되지 않았거나(기본값) null로 설정되거나 false로 설정된 경우 미리 정의된 형식 중 하나를 준수하지 않는 엔터티가 표시되지 않습니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
minimumPrecision |
number |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정된 경우 모든 엔터티가 포함됩니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
EntityRecognitionSkillLanguage
EntityRecognitionSkill에서 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
ar |
string |
아랍어 |
cs |
string |
체코어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
hu |
string |
헝가리어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
ko |
string |
한국어 |
nl |
string |
네덜란드어 |
no |
string |
노르웨이어(복마알) |
pl |
string |
폴란드어 |
pt-BR |
string |
포르투갈어(브라질) |
pt-PT |
string |
포르투갈어(포르투갈) |
ru |
string |
러시아어 |
sv |
string |
스웨덴어 |
tr |
string |
터키어 |
zh-Hans |
string |
중국어 간체 |
zh-Hant |
string |
중국어 번체 |
EntityRecognitionSkillV3
Text Analytics API를 사용하여 텍스트에서 다양한 형식의 엔터티를 추출합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
categories |
string[] |
추출해야 하는 엔터티 범주 목록입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
minimumPrecision |
number |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정된 경우 모든 엔터티가 포함됩니다. |
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정되지 않은 경우 기본적으로 사용 가능한 최신 버전을 지정합니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
ImageAnalysisSkill
이미지 파일을 분석하는 기술입니다. 이미지 콘텐츠에 따라 다양한 시각적 기능 집합을 추출합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
details |
반환할 도메인별 세부 정보를 나타내는 문자열입니다. |
|
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
visualFeatures |
시각적 기능 목록입니다. |
ImageAnalysisSkillLanguage
ImageAnalysisSkill에서 입력할 수 있는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
ar |
string |
아랍어 |
az |
string |
아제르바이잔어 |
bg |
string |
불가리아어 |
bs |
string |
보스니아어(라틴 문자) |
ca |
string |
카탈로니아어 |
cs |
string |
체코어 |
cy |
string |
웨일스어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
et |
string |
에스토니아어 |
eu |
string |
바스크어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
ga |
string |
아일랜드어 |
gl |
string |
갈리시아어 |
he |
string |
히브리어 |
hi |
string |
힌디어 |
hr |
string |
크로아티아어 |
hu |
string |
헝가리어 |
id |
string |
인도네시아어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
kk |
string |
카자흐어 |
ko |
string |
한국어 |
lt |
string |
리투아니아어 |
lv |
string |
라트비아어 |
mk |
string |
마케도니아어 |
ms |
string |
말레이어(말레이시아) |
nb |
string |
노르웨이어(복말) |
nl |
string |
네덜란드어 |
pl |
string |
폴란드어 |
prs |
string |
다리어 |
pt |
string |
포르투갈어(포르투갈) |
pt-BR |
string |
포르투갈어(브라질) |
pt-PT |
string |
포르투갈어(포르투갈) |
ro |
string |
루마니아어 |
ru |
string |
러시아어 |
sk |
string |
슬로바키아어 |
sl |
string |
슬로베니아어 |
sr-Cyrl |
string |
세르비아어(키릴 문자) |
sr-Latn |
string |
세르비아어(라틴 문자) |
sv |
string |
스웨덴어 |
th |
string |
태국어 |
tr |
string |
터키어 |
uk |
string |
우크라이나어 |
vi |
string |
베트남어 |
zh |
string |
중국어 간체 |
zh-Hans |
string |
중국어 간체 |
zh-Hant |
string |
중국어 번체 |
ImageDetail
반환할 도메인별 세부 정보를 나타내는 문자열입니다.
Name | 형식 | Description |
---|---|---|
celebrities |
string |
유명인으로 인식되는 세부 정보입니다. |
landmarks |
string |
랜드마크로 인식되는 세부 정보입니다. |
InputFieldMappingEntry
기술에 대한 입력 필드 매핑입니다.
Name | 형식 | Description |
---|---|---|
inputs |
복합 형식을 만들 때 사용되는 재귀 입력입니다. |
|
name |
string |
입력의 이름입니다. |
source |
string |
입력의 원본입니다. |
sourceContext |
string |
재귀 입력을 선택하는 데 사용되는 원본 컨텍스트입니다. |
KeyPhraseExtractionSkill
핵심 구 추출에 텍스트 분석을 사용하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
maxKeyPhraseCount |
integer |
반환할 핵심 구 수를 나타내는 숫자입니다. 없는 경우 식별된 모든 핵심 구가 반환됩니다. |
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정되지 않은 경우 기본적으로 사용 가능한 최신 버전을 지정합니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
KeyPhraseExtractionSkillLanguage
KeyPhraseExtractionSkill에서 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
da |
string |
덴마크어 |
de |
string |
독일어 |
en |
string |
영어 |
es |
string |
스페인어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
ko |
string |
한국어 |
nl |
string |
네덜란드어 |
no |
string |
노르웨이어(복마알) |
pl |
string |
폴란드어 |
pt-BR |
string |
포르투갈어(브라질) |
pt-PT |
string |
포르투갈어(포르투갈) |
ru |
string |
러시아어 |
sv |
string |
스웨덴어 |
LanguageDetectionSkill
입력 텍스트의 언어를 감지하고 요청에 따라 제출된 모든 문서에 대해 단일 언어 코드를 보고하는 기술입니다. 언어 코드는 분석의 신뢰도를 나타내는 점수와 쌍을 이집니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultCountryHint |
string |
언어를 구분할 수 없는 경우 언어 감지 모델에 대한 힌트로 사용할 국가 코드입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정되지 않은 경우 기본적으로 사용 가능한 최신 버전을 지정합니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
MergeSkill
두 개 이상의 문자열을 단일 통합 문자열로 병합하는 기술이며, 선택적 사용자 정의 구분 기호는 각 구성 요소 부분을 구분합니다.
Name | 형식 | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
|
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
||
insertPostTag |
string |
태그는 병합된 텍스트의 끝을 나타냅니다. 기본적으로 태그는 빈 공간입니다. |
|
insertPreTag |
string |
태그는 병합된 텍스트의 시작을 나타냅니다. 기본적으로 태그는 빈 공간입니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
|
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
OcrSkill
이미지 파일에서 텍스트를 추출하는 기술입니다.
Name | 형식 | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
|
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
||
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
|
detectOrientation |
boolean |
False |
방향 검색을 켜거나 설정하지 않음을 나타내는 값입니다. 기본값은 false입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
||
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
|
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
OcrSkillLanguage
OcrSkill에서 입력할 수 있는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
Jns |
string |
Jaunsari(데바나기리어) |
af |
string |
아프리칸스어 |
anp |
string |
앙기카어(데바나기리어) |
ar |
string |
아랍어 |
ast |
string |
아스투리아스어 |
awa |
string |
Awadhi-Hindi(데바나기리어) |
az |
string |
아제르바이잔어(라틴어) |
be |
string |
벨라루스어(키릴 자모 및 라틴 문자) |
be-cyrl |
string |
벨로루시어(키릴 자모) |
be-latn |
string |
벨로루시어(라틴어) |
bfy |
string |
Bagheli |
bfz |
string |
Mahasu Pahari(데바나기리어) |
bg |
string |
불가리아어 |
bgc |
string |
Haryanvi |
bho |
string |
Bhojpuri-Hindi(데바나기리어) |
bi |
string |
비슬라마어 |
bns |
string |
Bundeli |
br |
string |
브르타뉴어 |
bra |
string |
Brajbha |
brx |
string |
Bodo(데바나기리어) |
bs |
string |
보스니아어(라틴 문자) |
bua |
string |
부랴트어(키릴 자모) |
ca |
string |
카탈로니아어 |
ceb |
string |
세부아노어 |
ch |
string |
차모로어 |
cnr-cyrl |
string |
몬테네그린어(키릴 자모) |
cnr-latn |
string |
몬테네그린어(라틴어) |
co |
string |
코르시카어 |
crh |
string |
크림 타타르어(라틴어) |
cs |
string |
체코어 |
csb |
string |
카슈비아어 |
cy |
string |
웨일스어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
dhi |
string |
Dhimal(데바나기리어) |
doi |
string |
Dogri(데바나기리어) |
dsb |
string |
저지 소르브어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
et |
string |
에스토니아어 |
eu |
string |
바스크어 |
fa |
string |
페르시아어 |
fi |
string |
핀란드어 |
fil |
string |
필리핀어 |
fj |
string |
피지어 |
fo |
string |
페로어 |
fr |
string |
프랑스어 |
fur |
string |
Frulian |
fy |
string |
서 프리지아어 |
ga |
string |
아일랜드어 |
gag |
string |
가가우즈어(라틴어) |
gd |
string |
스코틀랜드 게일어 |
gil |
string |
길버트어 |
gl |
string |
갈리시아어 |
gon |
string |
Gondi(데바나기리어) |
gv |
string |
맹크스어 |
gvr |
string |
Gurung(데바나기리어) |
haw |
string |
하와이어 |
hi |
string |
힌디어 |
hlb |
string |
Halbi(데바나기리어) |
hne |
string |
Chhattisgarhi(데바나기리어) |
hni |
string |
하니어 |
hoc |
string |
호(데바나기리) |
hr |
string |
크로아티아어 |
hsb |
string |
고지대 슬라브어 |
ht |
string |
아이티 크리올 |
hu |
string |
헝가리어 |
ia |
string |
국제어 |
id |
string |
인도네시아어 |
is |
string |
아이슬란드어 |
it |
string |
이탈리아어 |
iu |
string |
이누크티투트어 (라틴어) |
ja |
string |
일본어 |
jv |
string |
자바어 |
kaa |
string |
카라칼파크어(라틴어) |
kaa-cyrl |
string |
카라칼파크어(키릴 자모) |
kac |
string |
카친어(라틴어) |
kea |
string |
Kabuverdianu |
kfq |
string |
Korku |
kha |
string |
카시어 |
kk-cyrl |
string |
카자흐어(키릴 자모) |
kk-latn |
string |
카자흐어(라틴어) |
kl |
string |
그린란드어 |
klr |
string |
칼링 |
kmj |
string |
Malto(데바나기리어) |
ko |
string |
한국어 |
kos |
string |
코스라에어 |
kpy |
string |
코랴크어 |
krc |
string |
카라차이발카르어 |
kru |
string |
쿠루흐어(데바나기리어) |
ksh |
string |
리프아리안어 |
ku-arab |
string |
쿠르드어(아랍어) |
ku-latn |
string |
쿠르드어(라틴 문자) |
kum |
string |
쿠믹어(키릴 자모) |
kw |
string |
콘월어 |
ky |
string |
키르기스어(키릴 자모) |
la |
string |
라틴어 |
lb |
string |
룩셈부르크어 |
lkt |
string |
라코타어 |
lt |
string |
리투아니아어 |
mi |
string |
마오리어 |
mn |
string |
몽골어(키릴 자모) |
mr |
string |
마라티어 |
ms |
string |
말레이어(라틴 문자) |
mt |
string |
몰타어 |
mww |
string |
몽 다오어(라틴어) |
myv |
string |
에르자어(키릴 자모) |
nap |
string |
나폴리어 |
nb |
string |
노르웨이어 |
ne |
string |
네팔어 |
niu |
string |
니우에안어 |
nl |
string |
네덜란드어 |
no |
string |
노르웨이어 |
nog |
string |
노가이어 |
oc |
string |
오크어 |
os |
string |
오세트어 |
pa |
string |
펀잡어(아랍어) |
pl |
string |
폴란드어 |
prs |
string |
다리어 |
ps |
string |
파슈토어 |
pt |
string |
포르투갈어 |
quc |
string |
키체어 |
rab |
string |
Chamling |
rm |
string |
로망슈어 |
ro |
string |
루마니아어 |
ru |
string |
러시아어 |
sa |
string |
산스크리트어(데바나기리) |
sat |
string |
산타리 (데바나기리) |
sck |
string |
Sadri(데바나기리어) |
sco |
string |
스코틀랜드어 |
sk |
string |
슬로바키아어 |
sl |
string |
슬로베니아어 |
sm |
string |
사모아어(라틴어) |
sma |
string |
남부 사미어 |
sme |
string |
북부 사미어(라틴어) |
smj |
string |
룰레 사미어 |
smn |
string |
이나리 사미어 |
sms |
string |
스콜트 사미어 |
so |
string |
소말리어(아랍어) |
sq |
string |
알바니아어 |
sr |
string |
세르비아어(라틴 문자) |
sr-Cyrl |
string |
세르비아어(키릴 자모) |
sr-Latn |
string |
세르비아어(라틴 문자) |
srx |
string |
Sirmauri(데바나기리어) |
sv |
string |
스웨덴어 |
sw |
string |
스와힐리어(라틴어) |
tet |
string |
테툼어 |
tg |
string |
타지크어(키릴 자모) |
thf |
string |
탕미 |
tk |
string |
투르크멘어(라틴어) |
to |
string |
통가어 |
tr |
string |
터키어 |
tt |
string |
타타르어 (라틴어) |
tyv |
string |
투반어 |
ug |
string |
위구르어(아랍어) |
unk |
string |
알 수 없음(모두) |
ur |
string |
우르두어 |
uz |
string |
우즈베크어(라틴 문자) |
uz-arab |
string |
우즈베키스탄어(아랍어) |
uz-cyrl |
string |
우즈베크어(키릴 자모) |
vo |
string |
볼라퓌크어 |
wae |
string |
Walser |
xnr |
string |
Kangri(데바나기리어) |
xsr |
string |
Sherpa(데바나기리어) |
yua |
string |
유카텍 마야어 |
za |
string |
장족어 |
zh-Hans |
string |
중국어 간체 |
zh-Hant |
string |
중국어 번체 |
zu |
string |
줄루어 |
OutputFieldMappingEntry
기술에 대한 출력 필드 매핑입니다.
Name | 형식 | Description |
---|---|---|
name |
string |
기술에서 정의한 출력의 이름입니다. |
targetName |
string |
출력의 대상 이름입니다. 선택 사항이며 기본적으로 이름을 지정합니다. |
PIIDetectionSkill
Text Analytics API를 사용하여 입력 텍스트에서 개인 정보를 추출하고 마스킹 옵션을 제공합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
domain |
string |
지정된 경우 는 엔터티 범주의 하위 집합만 포함하도록 PII 도메인을 설정합니다. 가능한 값은 'phi', 'none'입니다. 기본값은 'none'입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
maskingCharacter |
string |
maskingMode 매개 변수가 바꾸기로 설정된 경우 텍스트를 마스킹하는 데 사용되는 문자입니다. 기본값은 |
maskingMode |
입력 텍스트에서 검색된 개인 정보를 마스킹하는 다양한 방법을 제공하는 매개 변수입니다. 기본값은 'none'입니다. |
|
minimumPrecision |
number |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정된 경우 모든 엔터티가 포함됩니다. |
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정되지 않은 경우 기본적으로 사용 가능한 최신 버전을 지정합니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
piiCategories |
string[] |
추출하고 마스킹해야 하는 PII 엔터티 범주 목록입니다. |
PIIDetectionSkillMaskingMode
입력 텍스트에서 검색된 개인 정보를 마스킹하는 데 사용할 maskingMode를 나타내는 문자열입니다.
Name | 형식 | Description |
---|---|---|
none |
string |
마스킹이 발생하지 않으며 maskedText 출력이 반환되지 않습니다. |
replace |
string |
검색된 엔터티를 maskingCharacter 매개 변수에 지정된 문자로 바꿉니다. 문자는 검색된 엔터티의 길이로 반복되므로 오프셋이 입력 텍스트와 출력 maskedText 모두에 올바르게 해당합니다. |
SearchError
API에 대한 오류 조건에 대해 설명합니다.
Name | 형식 | Description |
---|---|---|
code |
string |
서버 정의 오류 코드 집합 중 하나입니다. |
details |
이 보고된 오류로 이어진 특정 오류에 대한 세부 정보 배열입니다. |
|
message |
string |
사람이 읽을 수 있는 오류 표현입니다. |
SearchIndexerKnowledgeStore
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다.
Name | 형식 | Description |
---|---|---|
projections |
인덱싱 중에 수행할 추가 프로젝션 목록입니다. |
|
storageConnectionString |
string |
스토리지 계정 프로젝션에 대한 연결 문자열 저장됩니다. |
SearchIndexerKnowledgeStoreFileProjectionSelector
Azure Files 저장할 데이터에 대한 프로젝션 정의입니다.
Name | 형식 | Description |
---|---|---|
generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
inputs |
복잡한 프로젝션에 대한 중첩된 입력입니다. |
|
referenceKeyName |
string |
다른 프로젝션에 대한 참조 키의 이름입니다. |
source |
string |
프로젝트로 데이터를 원본으로 지정합니다. |
sourceContext |
string |
복잡한 프로젝션에 대한 원본 컨텍스트입니다. |
storageContainer |
string |
프로젝션을 저장할 Blob 컨테이너입니다. |
SearchIndexerKnowledgeStoreObjectProjectionSelector
Azure Blob에 저장할 데이터에 대한 프로젝션 정의입니다.
Name | 형식 | Description |
---|---|---|
generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
inputs |
복잡한 프로젝션에 대한 중첩된 입력입니다. |
|
referenceKeyName |
string |
다른 프로젝션에 대한 참조 키의 이름입니다. |
source |
string |
프로젝트로 데이터를 원본으로 지정합니다. |
sourceContext |
string |
복잡한 프로젝션에 대한 원본 컨텍스트입니다. |
storageContainer |
string |
프로젝션을 저장할 Blob 컨테이너입니다. |
SearchIndexerKnowledgeStoreProjection
다양한 프로젝션 선택기의 컨테이너 개체입니다.
Name | 형식 | Description |
---|---|---|
files |
Azure File Storage에 대한 프로젝션. |
|
objects |
Azure Blob Storage에 대한 프로젝션. |
|
tables |
Azure Table Storage에 대한 프로젝션. |
SearchIndexerKnowledgeStoreTableProjectionSelector
Azure Tables에 저장할 데이터에 대한 설명입니다.
Name | 형식 | Description |
---|---|---|
generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
inputs |
복잡한 프로젝션에 대한 중첩된 입력입니다. |
|
referenceKeyName |
string |
다른 프로젝션에 대한 참조 키의 이름입니다. |
source |
string |
프로젝트로 데이터를 원본으로 지정합니다. |
sourceContext |
string |
복잡한 프로젝션에 대한 원본 컨텍스트입니다. |
tableName |
string |
예상 데이터를 저장할 Azure 테이블의 이름입니다. |
SearchIndexerSkillset
기술 목록입니다.
Name | 형식 | Description |
---|---|---|
@odata.etag |
string |
기술 세트의 ETag입니다. |
cognitiveServices | CognitiveServicesAccount: |
기술을 실행할 때 사용할 Azure AI 서비스에 대한 세부 정보입니다. |
description |
string |
기술 세트에 대한 설명입니다. |
encryptionKey |
Azure Key Vault 만드는 암호화 키에 대한 설명입니다. 이 키는 Microsoft가 아닌 누구도 기술 세트 정의의 암호를 해독할 수 없다는 완전한 보증을 원할 때 기술 세트 정의에 대한 추가 수준의 미사용 암호화를 제공하는 데 사용됩니다. 기술 세트 정의를 암호화한 후에는 항상 암호화된 상태로 유지됩니다. 검색 서비스는 이 속성을 null로 설정하려는 시도를 무시합니다. 암호화 키를 회전하려는 경우 필요에 따라 이 속성을 변경할 수 있습니다. 기술 세트 정의는 영향을 받지 않습니다. 고객 관리형 키를 사용하는 암호화는 무료 검색 서비스에 사용할 수 없으며 2019년 1월 1일 또는 그 이후에 생성된 유료 서비스에만 사용할 수 있습니다. |
|
knowledgeStore |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션의 정의입니다. |
|
name |
string |
기술 세트의 이름입니다. |
skills |
SearchIndexerSkill[]:
|
기술 세트의 기술 목록입니다. |
SearchResourceEncryptionKey
Azure Key Vault 고객 관리형 암호화 키입니다. 만들고 관리하는 키를 사용하여 인덱스 및 동의어 맵과 같은 검색 서비스에서 미사용 데이터를 암호화하거나 암호 해독할 수 있습니다.
Name | 형식 | Description |
---|---|---|
accessCredentials |
Azure Key Vault 액세스하는 데 사용되는 선택적 Azure Active Directory 자격 증명입니다. 대신 관리 ID를 사용하는 경우에는 필요하지 않습니다. |
|
keyVaultKeyName |
string |
미사용 데이터를 암호화하는 데 사용할 Azure Key Vault 키의 이름입니다. |
keyVaultKeyVersion |
string |
미사용 데이터를 암호화하는 데 사용할 Azure Key Vault 키의 버전입니다. |
keyVaultUri |
string |
미사용 데이터를 암호화하는 데 사용할 키가 포함된 AZURE Key Vault(DNS 이름이라고도 함)의 URI입니다. 예제 URL은 |
SentimentSkill
텍스트 분석은 0에서 1까지의 범위에서 부동 소수점 값으로 점수가 매기된 긍정-부정 감정 분석입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
SentimentSkillLanguage
SentimentSkill의 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
da |
string |
덴마크어 |
de |
string |
독일어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
it |
string |
이탈리아어 |
nl |
string |
네덜란드어 |
no |
string |
노르웨이어(복마알) |
pl |
string |
폴란드어 |
pt-PT |
string |
포르투갈어(포르투갈) |
ru |
string |
러시아어 |
sv |
string |
스웨덴어 |
tr |
string |
터키어 |
SentimentSkillV3
Text Analytics API를 사용하여 구조화되지 않은 텍스트를 평가하고 각 레코드에 대해 문장 및 문서 수준에서 서비스에서 찾은 가장 높은 신뢰도 점수를 기반으로 감정 레이블(예: "부정", "중립" 및 "긍정")을 제공합니다.
Name | 형식 | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
|
defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
|
includeOpinionMining |
boolean |
False |
true로 설정하면 기술 출력에는 오피니언 마이닝에 대한 Text Analytics 정보, 즉 대상(명사 또는 동사) 및 텍스트의 관련 평가(형용사)가 포함됩니다. 기본값은 false입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
||
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정되지 않은 경우 기본적으로 사용 가능한 최신 버전을 지정합니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
|
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
ShaperSkill
출력을 재구성하기 위한 기술입니다. 복합 필드(다중 파트 필드라고도 함)를 지원하는 복합 형식을 만듭니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
SplitSkill
문자열을 텍스트 청크로 분할하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
maximumPageLength |
integer |
원하는 최대 페이지 길이입니다. 기본값은 10000입니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
textSplitMode |
수행할 분할 모드를 나타내는 값입니다. |
SplitSkillLanguage
SplitSkill에서 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
am |
string |
암하라어 |
bs |
string |
보스니아어 |
cs |
string |
체코어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
en |
string |
영어 |
es |
string |
스페인어 |
et |
string |
에스토니아어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
he |
string |
히브리어 |
hi |
string |
힌디어 |
hr |
string |
크로아티아어 |
hu |
string |
헝가리어 |
id |
string |
인도네시아어 |
is |
string |
아이슬란드어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
ko |
string |
한국어 |
lv |
string |
라트비아어 |
nb |
string |
노르웨이어 |
nl |
string |
네덜란드어 |
pl |
string |
폴란드어 |
pt |
string |
포르투갈어(포르투갈) |
pt-br |
string |
포르투갈어(브라질) |
ru |
string |
러시아어 |
sk |
string |
슬로바키아어 |
sl |
string |
슬로베니아어 |
sr |
string |
세르비아어 |
sv |
string |
스웨덴어 |
tr |
string |
터키어 |
ur |
string |
우르두어 |
zh |
string |
중국어(간체) |
TextSplitMode
수행할 분할 모드를 나타내는 값입니다.
Name | 형식 | Description |
---|---|---|
pages |
string |
텍스트를 개별 페이지로 분할합니다. |
sentences |
string |
텍스트를 개별 문장으로 분할합니다. |
TextTranslationSkill
텍스트를 한 언어에서 다른 언어로 번역하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultFromLanguageCode |
에서 언어를 명시적으로 지정하지 않는 문서에 대해 에서 문서를 번역할 언어 코드입니다. |
|
defaultToLanguageCode |
에 언어를 명시적으로 지정하지 않는 문서에 대해 문서를 로 번역할 언어 코드입니다. |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
suggestedFrom |
fromLanguageCode 입력이나 defaultFromLanguageCode 매개 변수가 제공되지 않고 자동 언어 검색에 실패한 경우 문서를 번역할 언어 코드입니다. 기본값은 |
TextTranslationSkillLanguage
TextTranslationSkill에서 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
af |
string |
아프리칸스어 |
ar |
string |
아랍어 |
bg |
string |
불가리아어 |
bn |
string |
벵골어 |
bs |
string |
보스니아어(라틴 문자) |
ca |
string |
카탈로니아어 |
cs |
string |
체코어 |
cy |
string |
웨일스어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
et |
string |
에스토니아어 |
fa |
string |
페르시아어 |
fi |
string |
핀란드어 |
fil |
string |
필리핀어 |
fj |
string |
피지어 |
fr |
string |
프랑스어 |
he |
string |
히브리어 |
hi |
string |
힌디어 |
hr |
string |
크로아티아어 |
ht |
string |
아이티 크리올 |
hu |
string |
헝가리어 |
id |
string |
인도네시아어 |
is |
string |
아이슬란드어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
ko |
string |
한국어 |
lt |
string |
리투아니아어 |
lv |
string |
라트비아어 |
mg |
string |
마다가스카르어 |
ms |
string |
말레이어 |
mt |
string |
몰타어 |
mww |
string |
몽 다오어 |
nb |
string |
노르웨이어 |
nl |
string |
네덜란드어 |
otq |
string |
케레타로 오토미어 |
pl |
string |
폴란드어 |
pt |
string |
포르투갈어 |
ro |
string |
루마니아어 |
ru |
string |
러시아어 |
sk |
string |
슬로바키아어 |
sl |
string |
슬로베니아어 |
sm |
string |
사모아어 |
sr-Cyrl |
string |
세르비아어(키릴 자모) |
sr-Latn |
string |
세르비아어(라틴 문자) |
sv |
string |
스웨덴어 |
sw |
string |
스와힐리어 |
ta |
string |
타밀어 |
te |
string |
텔루구어 |
th |
string |
태국어 |
tlh |
string |
클링곤어 |
to |
string |
통가어 |
tr |
string |
터키어 |
ty |
string |
타히티어 |
uk |
string |
우크라이나어 |
ur |
string |
우르두어 |
vi |
string |
베트남어 |
yua |
string |
유카텍 마야어 |
yue |
string |
광둥어(번체) |
zh-Hans |
string |
중국어 간체 |
zh-Hant |
string |
중국어 번체 |
VisualFeature
반환할 시각적 기능 유형을 나타내는 문자열입니다.
Name | 형식 | Description |
---|---|---|
adult |
string |
성인으로 인식되는 시각적 기능. |
brands |
string |
상업용 브랜드로 인식되는 시각적 기능 |
categories |
string |
카테고리. |
description |
string |
설명 |
faces |
string |
사람 얼굴로 인식되는 시각적 기능입니다. |
objects |
string |
개체로 인식되는 시각적 기능입니다. |
tags |
string |
태그 |
WebApiSkill
Web API 엔드포인트를 호출할 수 있는 기술로, 사용자 지정 코드를 호출하여 기술 세트를 확장할 수 있습니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
batchSize |
integer |
문서 수를 나타내는 원하는 일괄 처리 크기입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
degreeOfParallelism |
integer |
설정된 경우 Web API에 대해 수행할 수 있는 병렬 호출의 수입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
httpHeaders |
object |
http 요청을 만드는 데 필요한 헤더입니다. |
httpMethod |
string |
http 요청에 대한 메서드입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 문자 |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
timeout |
string |
요청에 대해 원하는 시간 제한입니다. 기본값은 30초입니다. |
uri |
string |
Web API의 URL입니다. |