microsoft-cognitiveservices-speech-sdk package
클래스
ActivityReceivedEventArgs |
받은 메시지/이벤트의 콘텐츠를 정의합니다. |
AudioConfig |
사용할 입력 유형(마이크, 파일, 스트림)을 지정하는 데 사용되는 오디오 입력 구성을 나타냅니다. |
AudioInputStream |
사용자 지정 오디오 입력 구성에 사용되는 오디오 입력 스트림을 나타냅니다. |
AudioOutputStream |
사용자 지정 오디오 출력 구성에 사용되는 오디오 출력 스트림을 나타냅니다. |
AudioStreamFormat |
사용자 지정 오디오 입력 구성에 사용되는 오디오 스트림 형식을 나타냅니다. |
AutoDetectSourceLanguageConfig |
언어 자동 검색 구성. |
AutoDetectSourceLanguageResult |
출력 형식 |
AvatarConfig |
말하는 아바타 구성을 정의합니다. |
AvatarEventArgs |
아바타 이벤트를 말하기 위한 콘텐츠를 정의합니다. |
AvatarSynthesizer |
아바타 신시사이저를 정의합니다. |
AvatarVideoFormat |
아바타 출력 비디오 형식을 정의합니다. |
AvatarWebRTCConnectionResult |
아바타 WebRTC 연결 결과를 정의합니다. |
BaseAudioPlayer |
기본 오디오 플레이어 클래스 TODO: 지금은 PCM만 재생합니다. |
BotFrameworkConfig |
Bot Framework 백 엔드를 사용하기 위한 대화 서비스 커넥터 개체에 대한 구성을 정의하는 클래스입니다. |
CancellationDetails |
결과가 취소된 이유에 대한 자세한 정보를 포함합니다. |
CancellationDetailsBase |
결과가 취소된 이유에 대한 자세한 정보를 포함합니다. |
Connection |
Connection은 지정된 Recognizer의 음성 서비스에 대한 연결을 관리하기 위한 프록시 클래스입니다. 기본적으로 Recognizer는 필요할 때 서비스에 대한 연결을 자율적으로 관리합니다. Connection 클래스는 사용자가 명시적으로 연결을 열거나 닫고 연결 상태 변경 내용을 구독하는 추가 메서드를 제공합니다. 연결 사용은 선택 사항이며, 주로 연결 상태 따라 애플리케이션 동작을 미세 조정해야 하는 시나리오에 사용합니다. 사용자는 필요에 따라 Open()을 호출하여 이 연결과 연결된 인식기에서 인식을 시작하기 전에 사전에 연결을 수동으로 설정할 수 있습니다. Recognizer가 서비스에 연결하거나 연결을 끊어야 하는 경우 연결을 독립적으로 설정하거나 종료합니다. 이 경우 연결/연결 끊김 이벤트를 통해 연결 상태 변경하여 연결이 알림을 받습니다. 버전 1.2.1에 추가되었습니다. |
ConnectionEventArgs |
연결/연결 끊김과 같은 연결 이벤트에 대한 페이로드를 정의합니다. 버전 1.2.0에 추가됨 |
ConnectionMessage |
ConnectionMessage는 음성 서비스에서 보내고 받은 특정 메시지 구현을 나타냅니다. 이러한 메시지는 디버깅을 위해 제공되며 Azure Cognitive Services Speech Service의 프로덕션 사용 사례에 사용하면 안 됩니다. Speech Service에서 보내고 받은 메시지는 예고 없이 변경될 수 있습니다. 여기에는 메시지 내용, 헤더, 페이로드, 주문 등이 포함됩니다. 버전 1.11.0에 추가되었습니다. |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다. |
ConversationParticipantsChangedEventArgs |
SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다. |
ConversationTranscriber |
마이크, 파일 또는 기타 오디오 입력 스트림에서 스피커 분리를 사용하여 음성 인식을 수행하고 그 결과로 전사된 텍스트를 가져옵니다. |
ConversationTranscriptionCanceledEventArgs |
RecognitionErrorEvent의 콘텐츠를 정의합니다. |
ConversationTranscriptionEventArgs |
대화 전사/전사 이벤트의 콘텐츠를 정의합니다. |
ConversationTranscriptionResult |
대화 전사의 결과를 정의합니다. |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
Speech Start/End Detected와 같은 세션 이벤트에 대한 페이로드를 정의합니다. |
ConversationTranslationResult |
번역 텍스트 결과입니다. |
ConversationTranslator |
대화에 참가하거나, 나가거나, 대화에 연결합니다. |
Coordinate |
2D 공간에서 좌표를 정의합니다. |
CustomCommandsConfig |
CustomCommands 백 엔드를 사용하기 위한 대화 서비스 커넥터 개체에 대한 구성을 정의하는 클래스입니다. |
Diagnostics |
버전 1.21.0에 추가된 콘솔 출력을 관리하기 위한 진단 API를 정의합니다. |
DialogServiceConfig |
대화 서비스 커넥터에 대한 기본 구성을 정의하는 클래스 |
DialogServiceConnector |
대화 상자 서비스 커넥터 |
IntentRecognitionCanceledEventArgs |
의도 인식 취소된 결과 이벤트의 페이로드를 정의합니다. |
IntentRecognitionEventArgs |
의도 인식 결과 이벤트 인수입니다. |
IntentRecognitionResult |
의도 인식 결과입니다. |
IntentRecognizer |
의도 인식기. |
KeywordRecognitionModel |
사용자가 추가 음성 인식을 시작하는 키워드(keyword) 말하는 경우를 인식하기 위한 키워드(keyword) 인식 모델을 나타냅니다. |
LanguageUnderstandingModel |
언어 이해 모델 |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
MeetingTranscriptionCanceledEvent의 콘텐츠를 정의합니다. |
MeetingTranscriptionEventArgs |
모임 전사/전사 이벤트의 콘텐츠를 정의합니다. |
NoMatchDetails |
NoMatch 인식 결과에 대한 자세한 정보를 포함합니다. |
Participant |
대화의 참가자를 나타냅니다. 버전 1.4.0에 추가됨 |
PhraseListGrammar |
음성 인식을 개선하기 위해 새 구를 추가할 수 있습니다. 인식기에서 추가된 구는 다음 인식이 시작될 때 또는 다음에 SpeechSDK가 음성 서비스에 다시 연결해야 할 때 유효합니다. |
PronunciationAssessmentConfig |
발음 평가 구성. |
PronunciationAssessmentResult |
발음 평가 결과입니다. |
PropertyCollection |
속성 및 해당 값의 컬렉션을 나타냅니다. |
PullAudioInputStream |
사용자 지정 오디오 입력 구성에 사용되는 오디오 입력 스트림을 나타냅니다. |
PullAudioInputStreamCallback |
사용자 지정 오디오 입력 스트림에 대한 콜백 메서드(read() 및 close()))를 정의하는 추상 기본 클래스입니다. |
PullAudioOutputStream |
사용자 지정 오디오 출력 구성에 사용되는 메모리 백업 푸시 오디오 출력 스트림을 나타냅니다. |
PushAudioInputStream |
사용자 지정 오디오 입력 구성에 사용되는 메모리 백업 푸시 오디오 입력 스트림을 나타냅니다. |
PushAudioOutputStream |
사용자 지정 오디오 출력 구성에 사용되는 오디오 출력 스트림을 나타냅니다. |
PushAudioOutputStreamCallback |
사용자 지정 오디오 출력 스트림에 대한 콜백 메서드(write() 및 close()))를 정의하는 추상 기본 클래스입니다. |
RecognitionEventArgs |
Speech Start/End Detected와 같은 세션 이벤트에 대한 페이로드를 정의합니다. |
RecognitionResult |
음성 인식의 결과를 정의합니다. |
Recognizer |
주로 일반적인 이벤트 처리기를 포함하는 기본 클래스 Recognizer를 정의합니다. |
ServiceEventArgs |
버전 1.9.0에 추가된 모든 서비스 메시지 이벤트에 대한 페이로드를 정의합니다. |
SessionEventArgs |
SessionStarted/Stopped, SoundStarted/Stopped와 같은 세션 이벤트에 대한 콘텐츠를 정의합니다. |
SourceLanguageConfig |
원본 언어 구성. |
SpeakerAudioDestination |
브라우저에서만 작동하는 스피커 재생 오디오 대상을 나타냅니다. 참고: SDK는 미디어 소스 확장을 사용하여 오디오를 재생하려고 합니다. Mp3 형식은 Microsoft Edge, Chrome 및 Safari(데스크톱)에서 더 나은 지원을 제공합니다. 따라서 재생을 위해 mp3 형식을 지정하는 것이 좋습니다. |
SpeakerIdentificationModel |
Speaker Recognition Model에 대한 SpeakerIdentificationModel 클래스 정의 화자를 식별할 프로필 집합이 포함되어 있습니다. |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
출력 형식 |
SpeakerRecognizer |
음성 프로필 작업(예: createProfile, deleteProfile)에 대한 사용자의 Speaker Recognition Handles 작업에 대한 SpeakerRecognizer 클래스를 정의합니다. |
SpeakerVerificationModel |
Speaker Recognition Model에 대한 SpeakerVerificationModel 클래스 정의 화자를 확인할 프로필이 포함되어 있습니다. |
SpeechConfig |
음성 구성. |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
음성 인식/인식 이벤트의 콘텐츠를 정의합니다. |
SpeechRecognitionResult |
음성 인식의 결과를 정의합니다. |
SpeechRecognizer |
마이크, 파일 또는 기타 오디오 입력 스트림에서 음성 인식을 수행하고 그 결과로 전사된 텍스트를 가져옵니다. |
SpeechSynthesisBookmarkEventArgs |
음성 합성 책갈피 이벤트의 내용을 정의합니다. |
SpeechSynthesisEventArgs |
음성 합성 이벤트의 내용을 정의합니다. |
SpeechSynthesisResult |
음성 합성의 결과를 정의합니다. |
SpeechSynthesisVisemeEventArgs |
음성 합성 viseme 이벤트의 콘텐츠를 정의합니다. |
SpeechSynthesisWordBoundaryEventArgs |
음성 합성 단어 경계 이벤트의 내용을 정의합니다. |
SpeechSynthesizer |
텍스트 음성 변환에 대한 SpeechSynthesizer 클래스를 정의합니다. 버전 1.16.0에서 업데이트됨 |
SpeechTranslationConfig |
음성 번역 구성. |
SynthesisResult |
합성 결과에 대한 기본 클래스 |
SynthesisVoicesResult |
음성 합성의 결과를 정의합니다. |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
음성 인식 취소된 결과 이벤트의 페이로드를 정의합니다. |
TranslationRecognitionEventArgs |
번역 텍스트 결과 이벤트 인수입니다. |
TranslationRecognitionResult |
번역 텍스트 결과입니다. |
TranslationRecognizer |
번역 인식기 |
TranslationSynthesisEventArgs |
Translation Synthesis 이벤트 인수 |
TranslationSynthesisResult |
번역 합성 결과(예: 대상 언어로 번역된 텍스트의 음성 출력)를 정의합니다. |
Translations |
매개 변수 및 해당 값의 컬렉션을 나타냅니다. |
TurnStatusReceivedEventArgs |
받은 메시지/이벤트의 콘텐츠를 정의합니다. |
User | |
VoiceInfo |
버전 1.20.0에 추가된 음성 합성 음성에 대한 정보입니다. |
VoiceProfile |
Speaker Recognition에 대한 음성 프로필 클래스 정의 |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
음성 프로필 작업(예: createProfile, deleteProfile)에 대한 사용자의 Speaker Recognition Handles 작업에 대한 VoiceProfileClient 클래스를 정의합니다. |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
출력 형식 |
VoiceProfilePhraseResult |
출력 형식 |
VoiceProfileResult |
출력 형식 |
인터페이스
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
대화의 참가자를 나타냅니다. 버전 1.4.0에 추가됨 |
IPlayer |
일시 중지, 다시 시작 등과 같은 오디오 재생을 제어하는 오디오 플레이어 인터페이스를 나타냅니다. |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
열거형
AudioFormatTag | |
CancellationErrorCode |
CancellationReason이 Error인 경우 오류 코드를 정의합니다. 버전 1.1.0에 추가되었습니다. |
CancellationReason |
인식 결과가 취소될 수 있는 가능한 이유를 정의합니다. |
LanguageIdMode |
언어 식별 모드 |
LogLevel | |
NoMatchReason |
인식 결과가 인식되지 않을 수 있는 가능한 이유를 정의합니다. |
OutputFormat |
Speech Recognizer 출력 형식을 정의합니다. |
ParticipantChangedReason | |
ProfanityOption |
욕설 옵션입니다. 버전 1.7.0에 추가되었습니다. |
PronunciationAssessmentGradingSystem |
발음 점수 보정을 위한 점 시스템을 정의합니다. 기본값은 FivePoint입니다. 버전 1.15.0에 추가됨 |
PronunciationAssessmentGranularity |
발음 평가 세분성을 정의합니다. 기본값은 Phoneme입니다. 버전 1.15.0에 추가됨 |
PropertyId |
음성 속성 ID를 정의합니다. |
ResultReason |
인식 결과가 생성될 수 있는 가능한 이유를 정의합니다. |
ServicePropertyChannel |
속성 설정을 서비스에 전달하는 데 사용되는 채널을 정의합니다. 버전 1.7.0에 추가되었습니다. |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
음성 합성 경계 이벤트의 경계 유형을 정의합니다. |
SpeechSynthesisOutputFormat |
음성 합성 오디오 출력 형식을 정의합니다. SpeechSynthesisOutputFormat 버전 1.17.0에서 업데이트됨 |
VoiceProfileType |
출력 형식 |