Raccolta dell'input dell'utente
Con il rilascio di Servizi di comunicazione di Azure call automation recognize azione, gli sviluppatori possono ora migliorare le applicazioni IVR o contact center per riconoscere l'input dell'utente. Uno degli scenari più comuni di riconoscimento è la riproduzione di un messaggio per l'utente, che richiede di fornire una risposta che viene quindi riconosciuta dall'applicazione, una volta riconosciuta l'applicazione, quindi esegue un'azione corrispondente. L'input dei chiamanti può essere ricevuto in diversi modi, tra cui DTMF (input utente tramite le cifre sul dispositivo chiamante), riconoscimento vocale o combinazione di DTMF e voce.
Riconoscimento vocale con riconoscimento vocale
L'integrazione dei servizi di comunicazione di Azure con i servizi di intelligenza artificiale di Azure consente di usare l'azione Recognize per analizzare l'audio in tempo reale per trascrivere parole pronunciate in testo. Microsoft usa un modello linguistico universale come modello di base sottoposto a training con dati di proprietà di Microsoft e riflette la lingua parlata comunemente usata. Il modello è sottoposto a training preliminare con dialetti e fonetiche che rappresentano vari domini comuni. Per altre informazioni sulle lingue supportate, vedere Lingue e supporto vocale per il servizio Voce.
DTMF
Il riconoscimento DTMF (Dual-Tone MultiFrequency) è il processo di comprensione di toni/suoni generati da un telefono quando viene premuto un numero. L'attrezzatura alla fine di ricezione è in ascolto del tono specifico e li converte in comandi. Questi comandi in genere segnalano la finalità dell'utente durante lo spostamento di un menu in uno scenario IVR o in alcuni casi possono essere usati per acquisire informazioni importanti che l'utente deve fornire tramite il tastierino del telefono.
Eventi DTMF e toni associati
Event | Tono |
---|---|
0 | Zero |
1 | Uno |
2 | Due |
3 | 3 |
4 | 4 |
5 | Cinque |
6 | Sei |
7 | Sette |
8 | Otto |
9 | Nove |
Un | A |
B | B |
A | A |
D | D |
* | Asterisco |
# | Pound |
Casi d'uso comuni
L'azione di riconoscimento può essere usata per molti motivi, ecco alcuni esempi di come gli sviluppatori possono usare l'azione di riconoscimento nell'applicazione.
Migliorare il percorso utente con richieste self-service
- Gli utenti possono controllare la chiamata : abilitando il riconoscimento di input, è possibile consentire al chiamante di spostarsi nel menu IVR e fornire informazioni che possono essere usate per risolvere la query.
- Raccogliere informazioni sull'utente: abilitando il riconoscimento di input l'applicazione può raccogliere input dai chiamanti. Può trattarsi di informazioni come numeri di conto, informazioni sulla carta di credito e così via.
- Trascrivere la risposta del chiamante: con il riconoscimento vocale è possibile raccogliere l'input dell'utente e trascrivere l'audio in testo e analizzarlo per eseguire azioni aziendali specifiche.
Interrompi richieste audio
L'utente può uscire da un menu IVR e parlare con un agente umano: con un'interruzione DTMF l'applicazione può consentire agli utenti di interrompere il flusso del menu IVR e di poter chattare con un agente umano.
Architettura di esempio per raccogliere l'input dell'utente in una chiamata con riconoscimento vocale
Architettura di esempio per raccogliere l'input dell'utente in una chiamata
Limitazione nota
- DTMF in banda non è supportato, usare invece DTMF RFC 2833.
- Le richieste di testo di sintesi vocale supportano un massimo di 400 caratteri, se la richiesta è più lunga di questa, è consigliabile usare SSML per le azioni di riproduzione basate su sintesi vocale.
- Per gli scenari in cui si supera il limite di quota del servizio Voce, è possibile richiedere di aumentare questo limite seguendo la procedura descritta qui.
Passaggi successivi
- Vedere la guida pratica per informazioni su come raccogliere l'input dell'utente.
- Informazioni sull'utilizzo e sui log operativi pubblicati dall'automazione delle chiamate.