Condividi tramite


ActivationSignalDetectionTrainingDataFormat Enumerazione

Definizione

Specifica i formati di dati di training del segnale di attivazione supportati da ActivationSignalDetector per il assistente digitale.

public enum class ActivationSignalDetectionTrainingDataFormat
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 655360)]
enum class ActivationSignalDetectionTrainingDataFormat
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 655360)]
public enum ActivationSignalDetectionTrainingDataFormat
var value = Windows.ApplicationModel.ConversationalAgent.ActivationSignalDetectionTrainingDataFormat.voice8kHz8BitMono
Public Enum ActivationSignalDetectionTrainingDataFormat
Ereditarietà
ActivationSignalDetectionTrainingDataFormat
Attributi

Requisiti Windows

Famiglia di dispositivi
Windows 10, version 2004 (è stato introdotto in 10.0.19041.0)
API contract
Windows.Foundation.UniversalApiContract (è stato introdotto in v10.0)

Campi

Audio44kHz16BitMono 6

I dati di training sono audio generici in mono a 44kHz a 16 bit.

Audio44kHz8BitMono 5

I dati di training sono audio generici in mono a 44kHz a 8 bit.

Audio48kHz16BitMono 8

I dati di training sono audio generici in mono a 48kHz a 16 bit.

Audio48kHz8BitMono 7

I dati di training sono audio generici in mono a 48kHz a 8 bit.

AudioOEMDefined 9

I dati di training sono audio generici in un formato specificato da un provider hardware.

OtherOEMDefined 10

I dati di training sono in un formato specificato da un provider hardware.

Voice16kHz16BitMono 3

I dati di training sono audio vocali in mono a 16 bit a 16kHz.

Voice16kHz8BitMono 2

I dati di training sono audio vocali in mono a 16kHz a 8 bit.

Voice8kHz16BitMono 1

I dati di training sono audio vocali in mono a 16 bit 8kHz.

Voice8kHz8BitMono 0

I dati di training sono audio vocali in mono a 8 bit.

VoiceOEMDefined 4

I dati di training sono audio vocali definiti da un OEM.

Commenti

Le applicazioni di assistente digitale possono eseguire il training dei rilevatori di parole chiave per riconoscere in modo più accurato la voce di un singolo utente applicando personalizzazioni algoritmiche al rilevatore in base ai dati vocali (il rilevatore fornisce queste personalizzazioni). Ad esempio, eseguire il training di un rilevatore di parole chiave parlato per rilevare solo la parola chiave quando viene parlato da una persona specifica.

Ciò viene ottenuto tramite una serie di passaggi di training di ActivationSignalDetectionConfiguration , in cui ogni passaggio usa un frammento logico di dati di input vocale.

Si applica a

Vedi anche