Windows 앱 SDK AI 기반 OCR(텍스트 인식)에 대한 API ref
Important
이 기능은 아직 사용할 수 없습니다. 그것은 Windows 앱 SDK 곧 실험 채널 릴리스에서 제공 될 것으로 예상된다.
Windows 앱 SDK 실험 채널에는 개발 초기 단계의 API 및 기능이 포함됩니다. 실험적 채널의 모든 API는 광범위한 수정 및 호환성이 손상되는 변경이 적용되며 언제든지 후속 릴리스에서 제거될 수 있습니다. 프로덕션 환경에서는 사용할 수 없으며 실험적 기능을 사용하는 앱은 Microsoft Store에 게시할 수 없습니다.
이미지 내에서 텍스트(문자, 단어, 선, 다각형 텍스트 경계 및 각 일치 항목의 신뢰도 수준)를 검색하고 추출하고 컴퓨터에서 읽을 수 있는 문자 스트림으로 변환할 수 있는 AI(인공 지능)를 통해 지원되는 Windows 앱 SDK API에 대해 알아봅니다.
자세한 내용은 Windows 앱 SDK OCR(텍스트 인식 시작)을 참조하세요.
팁
Windows 앱 SDK GitHub 리포지토리에서 새 문제를 만들어 이러한 API 및 해당 기능에 대한 피드백을 제공합니다. (제목에 OCR을 포함해야 합니다.)
Microsoft.Windows.Vision 네임스페이스
이미지의 텍스트 콘텐츠를 분석하는 기계 학습 모델에 대한 API를 제공합니다.
DetectedLineStyle 열거형
public enum DetectedLineStyle
인식할 수 있는 선 스타일을 지정합니다.
필드
필기: 0
텍스트 줄이 손으로 작성되었습니다.
기타: 1
텍스트 줄이 손으로 작성되지 않았습니다.
OrientationDetectionOptions 열거형
public enum OrientationDetectionOptions
인식할 수 있는 텍스트 방향을 지정합니다.
필드
없음: 0
방향이 인식되지 않습니다.
DetectOrientation: 1
방향이 인식됩니다.
RecognizedLine 클래스
public sealed class RecognizedLine
인식된 텍스트의 한 줄을 나타냅니다.
RecognizedLine.Style 속성
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
인식된 선 스타일을 가져옵니다.
속성 값
인식된 선 스타일입니다.
설명
텍스트 줄을 필기했는지 여부와 인식 신뢰도 수준을 포함합니다.
RecognizedLine.Text 속성
public string Text { get; }
인식된 줄의 텍스트를 가져옵니다.
속성 값
인식된 줄의 텍스트입니다.
설명
공백과 연결된 모든 단어입니다.
RecognizedLine.Words 속성
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
인식된 줄의 단어입니다.
속성 값
인식된 줄의 단어입니다.
RecognizedLineStyle 구조체
public struct RecognizedLineStyle
인식된 선의 스타일을 나타냅니다.
필드
신뢰
선 스타일 인식의 신뢰도 수준입니다.
속성
선 스타일 이름입니다.
RecognizedText 클래스
public sealed class RecognizedText
이미지-텍스트 인식 작업의 결과를 나타냅니다.
RecognizedText.ImageAngle 속성
public float ImageAngle { get; }
인식된 텍스트의 시계 방향 회전 각도를 도 단위로 가져옵니다.
속성 값
인식된 텍스트의 시계 방향 회전 각도(도)입니다.
RecognizedText.Lines 속성
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
인식된 줄의 컬렉션을 가져옵니다.
속성 값
인식된 줄의 컬렉션입니다.
RecognizedWord 클래스
public sealed class RecognizedWord
인식된 단일 단어를 나타냅니다.
RecognizedWord.BoundingBox 속성
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
인식된 단어의 사분면 경계를 가져옵니다.
속성 값
인식된 단어의 사분면 경계입니다. TopLeft는 단어의 회전을 기준으로 합니다.
RecognizedWord.Confidence 속성
public float Confidence { get; }
이 단어가 올바르게 인식되었을 가능성이 있는지 가져옵니다.
속성 값
와우 가능성이이 단어는 제대로 인식되었다. 값 범위는 0.0에서 1.0까지입니다.
RecognizedWord.Text 속성
public string Text { get; }
인식된 단어의 텍스트를 가져옵니다.
속성 값
인식된 단어의 텍스트입니다.
TextRecognition.BoundingBox 구조체
public struct BoundingBox
인식된 단어와 텍스트 줄의 경계에 사용되는 점이 4개인 다각형입니다.
필드
BottomLeft
경계 상자의 왼쪽 아래 모서리입니다.
BottomRight
경계 상자의 오른쪽 아래 모서리입니다.
TopLeft
경계 상자의 왼쪽 위 점입니다.
TopRight
경계 상자의 오른쪽 위 지점입니다.
설명
단어 또는 줄의 경계로 반환되는 경우 TopLeft, TopRight, BottomRight 및 BottomLeft 지점은 이미지에서 인식된 텍스트의 회전 및 기울이기를 기준으로 합니다. 다음 다이어그램은 0이 TopLeft이고, 1이 TopRight이고, 2가 BottomRight이고, 3이 텍스트에 상대적인 BottomLeft인 다양한 텍스트 회전에 대한 점 레이아웃을 보여 줍니다.
TextRecognizer 클래스
public sealed class TextRecognizer : System.IDisposable
원본 이미지에서 단어와 선 및 해당 사분면 경계를 인식합니다.
TextRecognizer.Close 메서드
개체 및 연결된 리소스를 삭제합니다.
설명
C#에서 구현되지 않았습니다.
TextRecognizer.CreateAsync 메서드
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
TextRecognizer 클래스의 새 인스턴스를 비동기적으로 만듭니다.
반품
TextRecognizer 클래스의 새 인스턴스입니다.
GetModelReadyStatus가 준비되지 않은 경우 오류가 반환됩니다.
TextRecognizer.IsAvailable 메서드
public static bool IsAvailable ();
기본 언어 모델이 설치되어 있는지 여부를 검색합니다.
반품
기본 언어 모델이 설치된 경우 True입니다. 그렇지 않으면 false입니다.
TextRecognizer.MakeAvailableAsync 메서드
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
기본 언어 모델이 설치되어 있고 사용할 수 있는지 확인합니다.
반품
완료 시 PackageDeploymentResult를 반환하는 진행률이 있는 비동기 작업입니다.
TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) 메서드
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
제공된 이미지의 텍스트를 인식합니다.
매개 변수
imageBuffer
압축되지 않은 비트맵입니다.
options
TextRecognizer에 대한 텍스트 인식 모델을 구성하는 옵션입니다.
반품
인식된 텍스트입니다.
TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) 메서드
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
제공된 이미지의 텍스트를 비동기적으로 인식합니다.
매개 변수
imageBuffer
압축되지 않은 비트맵입니다.
options
TextRecognizer에 대한 텍스트 인식 모델을 구성하는 옵션입니다.
반품
인식된 텍스트입니다.
TextRecognizerOptions 클래스
public sealed class TextRecognizerOptions
TextRecognizer에 대한 텍스트 인식 모델을 구성하는 옵션을 제공합니다.
TextRecognizerOptions.MaxAnalysisSize 속성
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
최대 이미지 크기를 가져오거나 설정합니다.
속성 값
최대 이미지 크기입니다. 기본값은 너비가 1152이고 높이가 768입니다.
설명
이 크기는 제안 사항이며 항상 적용되지 않을 수도 있습니다.
원본 이미지가 최대 크기보다 크면 자동으로 상한값으로 축소됩니다.
TextRecognizerOptions.MaxLineCount 속성
public uint MaxLineCount { get; set; }
인식 작업에서 반환할 최대 줄 수를 가져오거나 설정합니다.
속성 값
인식 작업에서 반환할 최대 줄 수입니다.
설명
기본값은 MaxLineCountSupported입니다. 지정한 경우 반환되는 최대 줄은 이 값보다 작고 MaxLineCountSupported입니다.
TextRecognizerOptions.OrientationDetection 속성
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
텍스트 방향을 검색할지 여부를 가져오거나 설정합니다.
속성 값
텍스트 방향을 검색할지 여부입니다. 기본값은 None입니다.
"TextRecognizerOptions.#ctor" 생성자
public TextRecognizerOptions ();
TextRecognizerOptions 클래스의 새 인스턴스를 초기화합니다.
관련 콘텐츠
- Windows 책임 있는 생성 AI 애플리케이션 및 기능 개발
- Windows 앱 SDK OCR(텍스트 인식) 시작
- Windows 앱 SDK
- Windows 앱 SDK 대한 최신 릴리스 정보