다음을 통해 공유


Microsoft Syntex 모델에 대한 요구 사항 및 제한 사항

적용 대상: ✓ 모든 사용자 지정 모델 | ✓ 미리 빌드된 모든 모델

Microsoft Syntex 사용자 지정 모델 및 미리 빌드된 모델을 만들 수 있습니다. 선택한 모델 유형에 따라 파일 형식 및 크기, 지원해야 하는 언어, 지리적 고려 사항 및 사용할 모델 유형을 결정하는 데 도움이 되는 기타 요인과 같은 다양한 요구 사항이 있을 수 있습니다.

사용자 지정 모델:

미리 빌드된 모델:

사용자 지정 모델

구조화되지 않은 문서 처리

아이콘 설명
파일 기호입니다. 지원되는 파일 형식
이 모델은 .csv, .doc, .docx 파일 형식을 지원합니다. .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls 및 .xlsx(.xls 및 .xlsx 파일의 수식은 실행되지 않음).
대화 기호입니다. 지원되는 언어
이 모델은 영어, 프랑스어, 독일어, 이탈리아어 및 스페인어를 비롯한 모든 라틴어 기반 언어를 지원합니다.
단락 기호입니다. OCR 고려 사항
이 모델은 OCR(광학 문자 인식) 기술을 사용하여 .pdf 파일, 이미지 파일 및 .tiff 파일을 검사합니다. OCR 처리는 다음 요구 사항을 충족하는 문서에서 가장 잘 작동합니다.
- .jpg, .png 또는 .pdf 파일 형식(텍스트 또는 스캔)입니다. 텍스트 포함 .pdf 파일은 문자 추출 및 위치에 오류가 없으므로 더 좋습니다.
- .pdf 파일이 암호로 잠겨 있는 경우 파일을 제출하기 전에 잠금을 제거해야 합니다.
- 컬렉션당 학습에 사용되는 문서의 결합된 파일 크기는 50MB를 초과하면 안 되며 PDF 문서에는 500페이지를 초과하면 안 됩니다.
- 이미지의 경우 크기는 50 x 50에서 10,000 x 10,000 픽셀 사이여야 합니다. 매우 넓거나 홀수 차원이 있는 이미지(예: 평면도)는 OCR 프로세스에서 잘리고 정확도가 낮아질 수 있습니다.
- .pdf 파일의 경우 크기는 Legal 또는 A3 용지 크기에 해당하는 최대 11 x 17인치여야 합니다.
- 종이 문서에서 스캔하는 경우 스캔은 고품질 이미지여야 합니다.
- 라틴어 알파벳(영어 문자)을 사용해야 합니다.
Microsoft Office 텍스트 기반 파일 및 OCR 스캔 파일(.pdf, 이미지 또는 .tiff)에 대한 다음과 같은 차이점을 확인합니다.
- 모든 파일: 64,000자에서 잘립니다(학습 중 및 문서 라이브러리의 파일에 대해 실행할 때).
- OCR 스캔 파일: 500페이지 제한이 있습니다. PDF 및 이미지 파일 형식만 OCR에서 처리됩니다.
지구본 기호입니다. Multi-Geo 환경
Microsoft 365 Multi-Geo 환경에서 Syntex를 설정할 때는 중앙 위치에서 모델 형식을 사용하도록만 구성할 수 있습니다. 위성 위치에서 이 모델 유형을 사용하려면 Microsoft 지원에 문의하세요.
개체 기호입니다. 다중 모델 라이브러리
학습된 두 개 이상의 모델이 동일한 라이브러리에 적용되는 경우 파일은 평균 신뢰도 점수가 가장 높은 모델을 사용하여 분류됩니다. 추출된 엔터티는 적용된 모델에서만 제공됩니다.

자유형 문서 처리

아이콘 설명
파일 기호입니다. 지원되는 파일 형식
이 모델은 다음 파일 형식을 지원 합니다. 파일 형식 요구 사항을 참조하세요.
대화 기호입니다. 지원되는 언어
이 모델은 다음 언어를 지원합니다. 일반 문서에 대한 모델을 참조하세요.
단락 기호입니다. OCR 고려 사항
이 모델은 OCR(광학 문자 인식) 기술을 사용하여 .pdf 파일, 이미지 파일 및 .tiff 파일을 검사합니다. OCR 처리는 이러한 요구 사항을 충족하는 문서에서 가장 잘 작동합니다.
대역폭/효율성 기호입니다. 최적화 팁
모델이 원하는 대로 수행되지 않는 경우 다음 단계를 수행하여 모델의 성능을 향상시킵니다.
지구본 기호입니다. Multi-Geo 환경
Microsoft 365 Multi-Geo 환경에서 Syntex를 설정할 때는 중앙 위치에서 모델 형식을 사용하도록만 구성할 수 있습니다. 위성 위치에서 이 모델 유형을 사용하려면 Microsoft 지원에 문의하세요.
기호를 차단합니다. 사용자 지정 Power Platform 환경
Power Platform 처리에 사용자 지정 환경(기본 환경이 아닌)을 사용하는 경우 추가 설정 요구 사항이 있습니다. 자세한 내용은 사용자 지정 Power Platform 환경을 참조하세요.
개체 기호입니다. 다중 모델 라이브러리
학습된 두 개 이상의 모델이 동일한 라이브러리에 적용되는 경우 파일은 평균 신뢰도 점수가 가장 높은 모델을 사용하여 분류됩니다. 추출된 엔터티는 적용된 모델에서만 제공됩니다. 라이브러리당 하나의 자유형 또는 하나의 구조화된 모델만 가질 수 있습니다.

구조적 문서 처리

아이콘 설명
파일 기호입니다. 지원되는 파일 형식
이 모델은 다음 파일 형식을 지원 합니다. 파일 형식 요구 사항을 참조하세요.
대화 기호입니다. 지원되는 언어
이 모델은 다음 언어를 지원합니다. 고정 템플릿 문서에 대한 모델을 참조하세요.
단락 기호입니다. OCR 고려 사항
이 모델은 OCR(광학 문자 인식) 기술을 사용하여 .pdf 파일, 이미지 파일 및 .tiff 파일을 검사합니다. OCR 처리는 이러한 요구 사항을 충족하는 문서에서 가장 잘 작동합니다.
대역폭/효율성 기호입니다. 최적화 팁
모델이 원하는 대로 수행되지 않는 경우 다음 단계를 수행하여 모델의 성능을 향상시킵니다.
지구본 기호입니다. Multi-Geo 환경
Microsoft 365 Multi-Geo 환경에서 Syntex를 설정할 때는 중앙 위치에서 모델 형식을 사용하도록만 구성할 수 있습니다. 위성 위치에서 이 모델 유형을 사용하려면 Microsoft 지원에 문의하세요.
기호를 차단합니다. 사용자 지정 Power Platform 환경
Power Platform 처리에 사용자 지정 환경(기본 환경이 아닌)을 사용하는 경우 추가 설정 요구 사항이 있습니다. 자세한 내용은 사용자 지정 Power Platform 환경을 참조하세요.
개체 기호입니다. 다중 모델 라이브러리
학습된 두 개 이상의 모델이 동일한 라이브러리에 적용되는 경우 파일은 평균 신뢰도 점수가 가장 높은 모델을 사용하여 분류됩니다. 추출된 엔터티는 적용된 모델에서만 제공됩니다. 라이브러리당 하나의 자유형 또는 하나의 구조화된 모델만 가질 수 있습니다.

사전 구축 모델

계약 처리

아이콘 설명
파일 기호입니다. 지원되는 파일 형식
이 모델은 .bmp, .jpeg, .pdf, .png 및 .tiff 파일 형식을 지원합니다.
대화 기호입니다. 지원되는 언어
이 모델은 영어 계약만 지원합니다.
단락 기호입니다. OCR 고려 사항
이 모델은 OCR(광학 문자 인식) 기술을 사용하여 .pdf 파일, 이미지 파일 및 .tiff 파일을 검사합니다. OCR 처리는 다음 요구 사항을 충족하는 문서에서 가장 잘 작동합니다.
- .jpg, .png 또는 .pdf 파일 형식(텍스트 또는 스캔)입니다. 텍스트 포함 .pdf 파일은 문자 추출 및 위치에 오류가 없으므로 더 좋습니다.
- .pdf 및 .tiff 파일의 경우 최대 2,000페이지를 처리할 수 있습니다.
- 파일 크기는 50MB 미만이어야 합니다.
- 이미지의 경우 크기는 50 x 50에서 10,000 x 10,000 픽셀 사이여야 합니다.
- .pdf 파일의 경우 크기는 Legal 또는 A3 용지 크기에 해당하는 최대 11 x 17인치여야 합니다.
- 학습 데이터의 총 크기는 500페이지 이하입니다.
지구본 기호입니다. Multi-Geo 환경
Microsoft 365 Multi-Geo 환경에서 Syntex를 설정할 때는 중앙 위치에서 모델 형식을 사용하도록만 구성할 수 있습니다. 위성 위치에서 이 모델 유형을 사용하려면 Microsoft 지원에 문의하세요.
개체 기호입니다. 다중 모델 라이브러리
학습된 두 개 이상의 모델이 동일한 라이브러리에 적용되는 경우 파일은 평균 신뢰도 점수가 가장 높은 모델을 사용하여 분류됩니다. 추출된 엔터티는 적용된 모델에서만 제공됩니다.

송장 처리

아이콘 설명
파일 기호입니다. 지원되는 파일 형식
이 모델은 .bmp, .jpeg, .pdf, .png 및 .tiff 파일 형식을 지원합니다.
대화 기호입니다. 지원되는 언어
이 모델은 영어, 스페인어, 독일어, 프랑스어, 이탈리아어, 포르투갈어 및 네덜란드어로 된 청구서를 지원합니다.
단락 기호입니다. OCR 고려 사항
이 모델은 OCR(광학 문자 인식) 기술을 사용하여 .pdf 파일, 이미지 파일 및 .tiff 파일을 검사합니다. OCR 처리는 다음 요구 사항을 충족하는 문서에서 가장 잘 작동합니다.
- .jpg, .png 또는 .pdf 파일 형식(텍스트 또는 스캔)입니다. 텍스트 포함 .pdf 파일은 문자 추출 및 위치에 오류가 없으므로 더 좋습니다.
- .pdf 및 .tiff 파일의 경우 최대 2,000페이지를 처리할 수 있습니다.
- 파일 크기는 50MB 미만이어야 합니다.
- 이미지의 경우 크기는 50 x 50에서 10,000 x 10,000 픽셀 사이여야 합니다.
- .pdf 파일의 경우 크기는 Legal 또는 A3 용지 크기에 해당하는 최대 11 x 17인치여야 합니다.
- 학습 데이터의 총 크기는 500페이지 이하입니다.
지구본 기호입니다. Multi-Geo 환경
Microsoft 365 Multi-Geo 환경에서 Syntex를 설정할 때는 중앙 위치에서 모델 형식을 사용하도록만 구성할 수 있습니다. 위성 위치에서 이 모델 유형을 사용하려면 Microsoft 지원에 문의하세요.
개체 기호입니다. 다중 모델 라이브러리
학습된 두 개 이상의 모델이 동일한 라이브러리에 적용되는 경우 파일은 평균 신뢰도 점수가 가장 높은 모델을 사용하여 분류됩니다. 추출된 엔터티는 적용된 모델에서만 제공됩니다.

영수증 처리

아이콘 설명
파일 기호입니다. 지원되는 파일 형식
이 모델은 .bmp, .jpeg, .pdf, .png 및 .tiff 파일 형식을 지원합니다.
대화 기호입니다. 지원되는 언어
이 모델은 영어, Croation, 체코어, 덴마크어, 네덜란드어, 핀란드어, 독일어, 헝가리어, 이탈리아어, 일본어, 라트비아어, 리투아니아어, 노르웨이어, 포르투갈어, 스페인어, 스웨덴어 및 베트남어로 영수증을 지원합니다.
단락 기호입니다. OCR 고려 사항
이 모델은 OCR(광학 문자 인식) 기술을 사용하여 .pdf 파일, 이미지 파일 및 .tiff 파일을 검사합니다. OCR 처리는 다음 요구 사항을 충족하는 문서에서 가장 잘 작동합니다.
- .jpg, .png 또는 .pdf 파일 형식(텍스트 또는 스캔)입니다. 텍스트 포함 .pdf 파일은 문자 추출 및 위치에 오류가 없으므로 더 좋습니다.
- .pdf 및 .tiff 파일의 경우 최대 2,000페이지를 처리할 수 있습니다.
- 파일 크기는 50MB 미만이어야 합니다.
- 이미지의 경우 크기는 50 x 50에서 10,000 x 10,000 픽셀 사이여야 합니다.
- .pdf 파일의 경우 크기는 Legal 또는 A3 용지 크기에 해당하는 최대 11 x 17인치여야 합니다.
- 학습 데이터의 총 크기는 500페이지 이하입니다.
지구본 기호입니다. Multi-Geo 환경
Microsoft 365 Multi-Geo 환경에서 Syntex를 설정할 때는 중앙 위치에서 모델 형식을 사용하도록만 구성할 수 있습니다. 위성 위치에서 이 모델 유형을 사용하려면 Microsoft 지원에 문의하세요.
개체 기호입니다. 다중 모델 라이브러리
학습된 두 개 이상의 모델이 동일한 라이브러리에 적용되는 경우 파일은 평균 신뢰도 점수가 가장 높은 모델을 사용하여 분류됩니다. 추출된 엔터티는 적용된 모델에서만 제공됩니다.

중요한 정보 처리

아이콘 설명
파일 기호입니다. 지원되는 파일 형식
이 모델은 .csv 파일 형식을 지원합니다. .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls 및 .xlsx.
대화 기호입니다. 지원되는 언어
이 모델은 다음 언어를 지원 합니다. 지원되는 언어를 참조하세요.
이 모델은 필기 텍스트인쇄 텍스트 모두에 대한 언어도 지원합니다.
단락 기호입니다. OCR 고려 사항
이 모델은 OCR(광학 문자 인식) 기술을 사용하여 .pdf 파일, 이미지 파일 및 .tiff 파일을 검사합니다. OCR 처리는 다음 요구 사항을 충족하는 문서에서 가장 잘 작동합니다.
- .jpg, .png 또는 .pdf 파일 형식(텍스트 또는 스캔)입니다. 텍스트 포함 .pdf 파일은 문자 추출 및 위치에 오류가 없으므로 더 좋습니다.
- .pdf 및 .tiff 파일의 경우 최대 2,000페이지를 처리할 수 있습니다.
- 파일 크기는 50MB 미만이어야 합니다.
- 이미지의 경우 크기는 50 x 50에서 10,000 x 10,000 픽셀 사이여야 합니다.
- .pdf 파일의 경우 크기는 Legal 또는 A3 용지 크기에 해당하는 최대 11 x 17인치여야 합니다.
- 학습 데이터의 총 크기는 500페이지 이하입니다.
필기 텍스트인쇄 텍스트 모두에 대한 언어를 지원합니다.
지구본 기호입니다. Multi-Geo 환경
Microsoft 365 Multi-Geo 환경에서 Syntex를 설정할 때는 중앙 위치에서 모델 형식을 사용하도록만 구성할 수 있습니다. 위성 위치에서 이 모델 유형을 사용하려면 Microsoft 지원에 문의하세요.
개체 기호입니다. 다중 모델 라이브러리
학습된 두 개 이상의 모델이 동일한 라이브러리에 적용되는 경우 파일은 평균 신뢰도 점수가 가장 높은 모델을 사용하여 분류됩니다. 추출된 엔터티는 적용된 모델에서만 제공됩니다.

간단한 문서 처리

아이콘 설명
파일 기호입니다. 지원되는 파일 형식
이 모델은 .bmp, .jpeg, .pdf, .png 및 .tiff 파일 형식을 지원합니다.
대화 기호입니다. 지원되는 언어
이 모델은 100개 이상의 언어로 된 문서를 지원합니다.
단락 기호입니다. OCR 고려 사항
이 모델은 OCR(광학 문자 인식) 기술을 사용하여 .pdf 파일, 이미지 파일 및 .tiff 파일을 검사합니다. OCR 처리는 다음 요구 사항을 충족하는 문서에서 가장 잘 작동합니다.
- .jpg, .png 또는 .pdf 파일 형식(텍스트 또는 스캔)입니다. 텍스트 포함 .pdf 파일은 문자 추출 및 위치에 오류가 없으므로 더 좋습니다.
- .pdf 및 .tiff 파일의 경우 최대 2,000페이지를 처리할 수 있습니다.
- 파일 크기는 50MB 미만이어야 합니다.
- 이미지의 경우 크기는 50 x 50에서 10,000 x 10,000 픽셀 사이여야 합니다.
- .pdf 파일의 경우 크기는 Legal 또는 A3 용지 크기에 해당하는 최대 11 x 17인치여야 합니다.
- 학습 데이터의 총 크기는 500페이지 이하입니다.
지구본 기호입니다. Multi-Geo 환경
Microsoft 365 Multi-Geo 환경에서 Syntex를 설정할 때는 중앙 위치에서 모델 형식을 사용하도록만 구성할 수 있습니다. 위성 위치에서 이 모델 유형을 사용하려면 Microsoft 지원에 문의하세요.
개체 기호입니다. 다중 모델 라이브러리
학습된 두 개 이상의 모델이 동일한 라이브러리에 적용되는 경우 파일은 평균 신뢰도 점수가 가장 높은 모델을 사용하여 분류됩니다. 추출된 엔터티는 적용된 모델에서만 제공됩니다.