Freigeben über


Namespace Microsoft::CognitiveServices::Speech::Audio

Zusammenfassung

Angehörige Beschreibungen
Enumeration PresetMicrophoneArrayGeometry Typen von vordefinierten Mikrofonarraygeometrien. Weitere Informationen finden Sie unter Empfehlungen für Mikrofonarrays.
Enumeration MicrophoneArrayType Typen von Mikrofonarrays.
Enumeration SpeakerReferenceChannel Definiert die Position des Lautsprecherbezugskanals in Eingabeaudio.
AudioStreamContainerFormat- Definiert das unterstützte Audiostreamcontainerformat. Geändert in Version 1.4.0.
Enumeration "AudioStreamWaveFormat" Stellt das im WAV-Container angegebene Format dar.
Klasse Audio::AudioConfig Stellt die Audioeingabe- oder Ausgabekonfiguration dar. Audioeingaben können aus einem Mikrofon, einer Datei oder einem Eingabedatenstrom stammen. Die Audioausgabe kann an einen Lautsprecher, eine Audiodateiausgabe im WAV-Format oder einen Ausgabedatenstrom erfolgen.
Klasse Audio::AudioInputStream Stellt den Audioeingabedatenstrom dar, der für benutzerdefinierte Audioeingabekonfigurationen verwendet wird.
Klasse Audio::AudioOutputStream Stellt den Audioausgabedatenstrom dar, der für benutzerdefinierte Audioausgabekonfigurationen verwendet wird. Aktualisiert in Version 1.7.0.
Klasse Audio::AudioProcessingOptions Stellt Audioverarbeitungsoptionen dar, die mit der Audiokonfigurationsklasse verwendet werden.
Klasse Audio::AudioStreamFormat Klasse zum Darstellen des Audiodatenstromformats, das für benutzerdefinierte Audioeingabekonfigurationen verwendet wird. Aktualisiert in Version 1.5.0.
Klasse Audio::P ullAudioInputStream Pull audio input stream class.
Klasse Audio::P ullAudioInputStreamCallback Eine Schnittstelle, die Rückrufmethoden für einen Audioeingabedatenstrom definiert.
Klasse Audio::P ullAudioOutputStream Stellt den speichergesicherten Pull-Audioausgabedatenstrom dar, der für eine benutzerdefinierte Audioausgabe verwendet wird. Aktualisiert in Version 1.7.0.
Klasse Audio::P ushAudioInputStream Stellt speichergesicherte Push-Audioeingabedatenstrom dar, der für benutzerdefinierte Audioeingabekonfigurationen verwendet wird.
Klasse Audio::P ushAudioOutputStream Push-Audioausgabedatenstromklasse. In Version 1.4.0 hinzugefügt.
Klasse Audio::P ushAudioOutputStreamCallback- Eine Schnittstelle, die Rückrufmethoden für einen Audioausgabedatenstrom definiert. Aktualisiert in Version 1.7.0.
Struktur Audio::MicrophoneArrayGeometry Stellt die Geometrie eines Mikrofonarrays dar.

Angehörige

Enumeration PresetMicrophoneArrayGeometry

Werte Beschreibungen
Nicht initialisiert Gibt an, dass keine Geometrie angegeben wurde. Das Speech SDK bestimmt die Geometrie des Mikrofonarrays.
Zirkel7 Gibt ein Mikrofonarray mit einem Mikrofon in der Mitte und sechs Mikrofonen gleichmäßig in einem Kreis mit Radius von ungefähr 42,5 mm an.
Kreisförmig4 Gibt ein Mikrofonarray mit einem Mikrofon in der Mitte und drei Mikrofonen gleichmäßig in einem Kreis mit Radius von ungefähr 42,5 mm an.
Linear 4 Gibt ein Mikrofonarray mit vier linear platzierten Mikrofonen mit einem Abstand von 40 mm an.
Linear2 Gibt ein Mikrofonarray mit zwei linear platzierten Mikrofonen mit 40 mm Abstand dazwischen an.
Mono Gibt ein Mikrofonarray mit einem einzigen Mikrofon an.
Gewohnheit Gibt ein Mikrofonarray mit benutzerdefinierter Geometrie an.

Typen von vordefinierten Mikrofonarraygeometrien. Weitere Informationen finden Sie unter Empfehlungen für Mikrofonarrays.

Enumeration MicrophoneArrayType

Werte Beschreibungen
Linear Gibt an, dass das Mikrofonarray Über Mikrofone in einer geraden Linie verfügt.
Flach Gibt an, dass das Mikrofonarray Mikrofone in einer Ebene aufweist.

Typen von Mikrofonarrays.

Enumeration SpeakerReferenceChannel

Werte Beschreibungen
Nichts Gibt an, dass die Eingabeaudio keinen Lautsprecherverweiskanal hat.
LastChannel Gibt an, dass der letzte Kanal im Eingabeaudio dem Lautsprecherbezug für die Echounterdrückung entspricht.

Definiert die Position des Lautsprecherbezugskanals in Eingabeaudio.

Enumeration AudioStreamContainerFormat

Werte Beschreibungen
OGG_OPUS Stream ContainerFormat-Definition für OGG OPUS.
MP3 Stream ContainerFormat-Definition für MP3.
FLAC Stream ContainerFormat-Definition für FLAC. In Version 1.7.0 hinzugefügt.
ALAW Stream ContainerFormat-Definition für ALAW. In Version 1.7.0 hinzugefügt.
MULAW Stream ContainerFormat-Definition für MULAW. In Version 1.7.0 hinzugefügt.
AMRNB Stream ContainerFormat-Definition für AMRNB. Derzeit nicht unterstützt.
AMRWB Stream ContainerFormat-Definition für AMRWB. Derzeit nicht unterstützt.
JEGLICHE Stream ContainerFormat-Definition für ein anderes oder unbekanntes Format.

Definiert das unterstützte Audiostreamcontainerformat. Geändert in Version 1.4.0.

Enumeration AudioStreamWaveFormat

Werte Beschreibungen
PCM AudioStreamWaveFormat-Definition für PCM-Daten (Pulse-Code modulated) im ganzzahligen Format.
ALAW AudioStreamWaveFormat-Definition A-law-codiertes Format.
MULAW AudioStreamWaveFormat-Definition für mu-law-encoded format.
G722 AudioStreamWaveFormat-Definition für G.722-codiertes Format.

Stellt das im WAV-Container angegebene Format dar.