Namespace Microsoft::CognitiveServices::Speech::Audio
Artikel 12/26/2024
3 Mitwirkende
Feedback
In diesem Artikel
Zusammenfassung
Angehörige
Beschreibungen
Enumeration PresetMicrophoneArrayGeometry
Typen von vordefinierten Mikrofonarraygeometrien. Weitere Informationen finden Sie unter Empfehlungen für Mikrofonarrays .
Enumeration MicrophoneArrayType
Typen von Mikrofonarrays.
Enumeration SpeakerReferenceChannel
Definiert die Position des Lautsprecherbezugskanals in Eingabeaudio.
AudioStreamContainerFormat-
Definiert das unterstützte Audiostreamcontainerformat. Geändert in Version 1.4.0.
Enumeration "AudioStreamWaveFormat"
Stellt das im WAV-Container angegebene Format dar.
Klasse Audio::AudioConfig
Stellt die Audioeingabe- oder Ausgabekonfiguration dar. Audioeingaben können aus einem Mikrofon, einer Datei oder einem Eingabedatenstrom stammen. Die Audioausgabe kann an einen Lautsprecher, eine Audiodateiausgabe im WAV-Format oder einen Ausgabedatenstrom erfolgen.
Klasse Audio::AudioInputStream
Stellt den Audioeingabedatenstrom dar, der für benutzerdefinierte Audioeingabekonfigurationen verwendet wird.
Klasse Audio::AudioOutputStream
Stellt den Audioausgabedatenstrom dar, der für benutzerdefinierte Audioausgabekonfigurationen verwendet wird. Aktualisiert in Version 1.7.0.
Klasse Audio::AudioProcessingOptions
Stellt Audioverarbeitungsoptionen dar, die mit der Audiokonfigurationsklasse verwendet werden.
Klasse Audio::AudioStreamFormat
Klasse zum Darstellen des Audiodatenstromformats, das für benutzerdefinierte Audioeingabekonfigurationen verwendet wird. Aktualisiert in Version 1.5.0.
Klasse Audio::P ullAudioInputStream
Pull audio input stream class.
Klasse Audio::P ullAudioInputStreamCallback
Eine Schnittstelle, die Rückrufmethoden für einen Audioeingabedatenstrom definiert.
Klasse Audio::P ullAudioOutputStream
Stellt den speichergesicherten Pull-Audioausgabedatenstrom dar, der für eine benutzerdefinierte Audioausgabe verwendet wird. Aktualisiert in Version 1.7.0.
Klasse Audio::P ushAudioInputStream
Stellt speichergesicherte Push-Audioeingabedatenstrom dar, der für benutzerdefinierte Audioeingabekonfigurationen verwendet wird.
Klasse Audio::P ushAudioOutputStream
Push-Audioausgabedatenstromklasse. In Version 1.4.0 hinzugefügt.
Klasse Audio::P ushAudioOutputStreamCallback-
Eine Schnittstelle, die Rückrufmethoden für einen Audioausgabedatenstrom definiert. Aktualisiert in Version 1.7.0.
Struktur Audio::MicrophoneArrayGeometry
Stellt die Geometrie eines Mikrofonarrays dar.
Angehörige
Enumeration PresetMicrophoneArrayGeometry
Werte
Beschreibungen
Nicht initialisiert
Gibt an, dass keine Geometrie angegeben wurde. Das Speech SDK bestimmt die Geometrie des Mikrofonarrays.
Zirkel7
Gibt ein Mikrofonarray mit einem Mikrofon in der Mitte und sechs Mikrofonen gleichmäßig in einem Kreis mit Radius von ungefähr 42,5 mm an.
Kreisförmig4
Gibt ein Mikrofonarray mit einem Mikrofon in der Mitte und drei Mikrofonen gleichmäßig in einem Kreis mit Radius von ungefähr 42,5 mm an.
Linear 4
Gibt ein Mikrofonarray mit vier linear platzierten Mikrofonen mit einem Abstand von 40 mm an.
Linear2
Gibt ein Mikrofonarray mit zwei linear platzierten Mikrofonen mit 40 mm Abstand dazwischen an.
Mono
Gibt ein Mikrofonarray mit einem einzigen Mikrofon an.
Gewohnheit
Gibt ein Mikrofonarray mit benutzerdefinierter Geometrie an.
Typen von vordefinierten Mikrofonarraygeometrien. Weitere Informationen finden Sie unter Empfehlungen für Mikrofonarrays .
Enumeration MicrophoneArrayType
Werte
Beschreibungen
Linear
Gibt an, dass das Mikrofonarray Über Mikrofone in einer geraden Linie verfügt.
Flach
Gibt an, dass das Mikrofonarray Mikrofone in einer Ebene aufweist.
Typen von Mikrofonarrays.
Enumeration SpeakerReferenceChannel
Werte
Beschreibungen
Nichts
Gibt an, dass die Eingabeaudio keinen Lautsprecherverweiskanal hat.
LastChannel
Gibt an, dass der letzte Kanal im Eingabeaudio dem Lautsprecherbezug für die Echounterdrückung entspricht.
Definiert die Position des Lautsprecherbezugskanals in Eingabeaudio.
Werte
Beschreibungen
OGG_OPUS
Stream ContainerFormat-Definition für OGG OPUS.
MP3
Stream ContainerFormat-Definition für MP3.
FLAC
Stream ContainerFormat-Definition für FLAC. In Version 1.7.0 hinzugefügt.
ALAW
Stream ContainerFormat-Definition für ALAW. In Version 1.7.0 hinzugefügt.
MULAW
Stream ContainerFormat-Definition für MULAW. In Version 1.7.0 hinzugefügt.
AMRNB
Stream ContainerFormat-Definition für AMRNB. Derzeit nicht unterstützt.
AMRWB
Stream ContainerFormat-Definition für AMRWB. Derzeit nicht unterstützt.
JEGLICHE
Stream ContainerFormat-Definition für ein anderes oder unbekanntes Format.
Definiert das unterstützte Audiostreamcontainerformat. Geändert in Version 1.4.0.
Werte
Beschreibungen
PCM
AudioStreamWaveFormat-Definition für PCM-Daten (Pulse-Code modulated) im ganzzahligen Format.
ALAW
AudioStreamWaveFormat-Definition A-law-codiertes Format.
MULAW
AudioStreamWaveFormat-Definition für mu-law-encoded format.
G722
AudioStreamWaveFormat-Definition für G.722-codiertes Format.
Stellt das im WAV-Container angegebene Format dar.