Per eseguire il training di un modello, avviare un processo di training. Solo i processi completati correttamente creano un modello. I processi di training scadono dopo sette giorni e non sarà possibile recuperare i dettagli dei processi dopo questa scadenza. Se il processo di training è stato completato correttamente ed è stato creato un modello, tale modello non è interessato dalla scadenza del processo. È possibile eseguire un solo processo di training alla volta e non è possibile avviare altri processi nello stesso progetto.
Il training può richiedere da pochi secondi, quando si gestiscono progetti semplici, fino a un paio d’ore, quando si raggiunge il limite massimo di espressioni.
La valutazione del modello viene attivata automaticamente dopo che è stato eseguito il training correttamente. Il processo di valutazione inizia usando il modello sottoposto a training per l’esecuzione delle stime sulle espressioni nel set di test, poi prosegue con il confronto dei risultati stimati con le etichette fornite (per stabilire una baseline di verità). I risultati vengono restituiti per poter esaminare le prestazioni del modello.
Prerequisiti
Un progetto creato correttamente con un account di archiviazione BLOB di Azure configurato
Prima di iniziare il processo di training, le espressioni etichettate nel progetto vengono divise in un set di training e un set di test. Ognuno svolge una funzione diversa.
Il set di training viene usato nel training del modello ed è il set da cui il modello apprende le espressioni etichettate.
Il set di test è un set cieco che non viene introdotto nel modello durante il training, ma solo durante la valutazione.
Una volta eseguito il training del modello correttamente, è possibile usare il modello per eseguire stime dalle espressioni nel set di test. Tali stime vengono usate per calcolare metriche di valutazione.
È preferibile accertarsi che tutti gli intenti siano adeguatamente rappresentati sia nel set di training che nel set di test.
Il flusso di lavoro di orchestrazione supporta due metodi per la divisione dei dati:
Divisione automatica del set di test dai dati di training: il sistema dividerà i dati con tag tra il set di training e il set di test in base alle percentuali scelte dall’utente. La divisione percentuale consigliata è l'80% per il training e il 20% per i test.
Nota
Se si sceglie l'opzione Divisione automatica del set di test dai dati di training, solo i dati assegnati al set di training verranno divisi in base alle percentuali specificate.
Usa una divisione manuale dei dati di training e di test: questo metodo consente agli utenti di definire a quale set devono appartenere le espressioni. Questo passaggio è abilitato solo se sono state aggiunte espressioni al set di test durante l’etichettatura.
Nota
È possibile aggiungere espressioni nel set di dati di training solo per intenti non connessi.
Selezionare Processi di training dal menu a sinistra.
Selezionare Avvia un processo di training dal menu in alto.
Selezionare Esegui il training di un nuovo modello e digitare il nome del modello nella casella di testo. Si può anche sovrascrivere un modello esistente selezionando questa opzione e scegliendo il modello da sovrascrivere dal menu a discesa. La sovrascrittura di un modello sottoposto a training è irreversibile, ma non influisce sui modelli distribuiti fino a quando non si distribuisce il nuovo modello.
Divisione automatica del set di test dai dati di training: le espressioni con tag verranno divise in maniera casuale tra il set di training e il set di test in base alle percentuali scelte dall'utente. La divisione percentuale predefinita è l'80% per il training e il 20% per i test. Per modificare questi valori, scegliere quale set si desidera modificare e digitare nel nuovo valore.
Nota
Se si sceglie l'opzione Divisione automatica del set di test dai dati di training, solo le espressioni nel set di training verranno divise in base alle percentuali specificate.
Usa una divisione manuale dei dati di training e di test: assegnare ogni espressione al set di training o al set di test durante il passaggio di aggiunta dei tag del progetto.
Nota
L'opzione Usa una divisione manuale dei dati di training e di test verrà abilitata solo se si aggiungono espressioni al set di test nella pagina dei dati dei tag. In caso contrario, verrà disabilitato.
Selezionare il pulsante Esegui il training.
Nota
Solo i processi di training completati correttamente genereranno modelli.
Il training può richiedere tempo tra un paio di minuti e un paio di ore in base alle dimensioni dei dati contrassegnati.
È possibile eseguire un solo processo di training alla volta. Non è possibile avviare altri processi di training nello stesso progetto fino al completamento del processo in esecuzione.
Creare una richiesta POST usando l'URL, le intestazioni e il corpo JSON seguenti per inviare un processo di training.
Richiesta URL
Usare l'URL seguente durante la creazione della richiesta API. Sostituire i valori segnaposto seguenti con i propri valori.
Percentuale dei dati con tag da includere nel set di training. Il valore consigliato è 80.
80
testingSplitPercentage
20
Percentuale dei dati con tag da includere nel set di test. Il valore consigliato è 20.
20
Nota
trainingSplitPercentage e testingSplitPercentage sono necessari solo se Kind è impostato su percentage e la somma di entrambe le percentuali deve essere uguale a 100.
Dopo aver inviato la richiesta API, si riceverà una risposta 202 indicante l'esito positivo. Nelle intestazioni della risposta, estrarre il valore operation-location. Il formato sarà simile al seguente:
Selezionare l'ID del processo di training dall'elenco. Viene visualizzato un riquadro laterale in cui è possibile controllare lo stato di avanzamento del training, lo stato del processo e altri dettagli relativi a questo processo.
Il training può richiedere tempo a seconda delle dimensioni dei dati di training e della complessità dello schema. È possibile usare la richiesta seguente per continuare il polling dello stato del processo di training fino a quando viene completato correttamente.
Usare la seguente richiesta GET per ottenere lo stato dello stato di avanzamento del training del modello. Sostituire i valori segnaposto seguenti con i propri valori.
Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.
EmailApp
{JOB-ID}
L'ID per individuare lo stato del training del modello. È il valore dell'intestazione location ricevuto al momento dell'invio del processo di training.
Usare l'intestazione seguente per autenticare la richiesta.
Chiave
valore
Ocp-Apim-Subscription-Key
La chiave della risorsa. È usata per l’autenticazione delle richieste API.
Testo della risposta
Dopo aver inviato la richiesta, si otterrà la risposta seguente. Continuare il polling di questo endpoint fino a quando il parametro dello stato diventa "succeeded".
Per annullare un processo di training in Language Studio, accedere alla pagina Esegui il training del modello. Selezionare il processo di training da annullare e selezionare Annulla dal menu in alto.
Creare una richiesta POST usando l'URL, le intestazioni e il corpo JSON seguenti per annullare un processo di training.
Richiesta URL
Usare l'URL seguente durante la creazione della richiesta API. Sostituire i valori segnaposto seguenti con i propri valori.
Usare l'intestazione seguente per autenticare la richiesta.
Chiave
valore
Ocp-Apim-Subscription-Key
La chiave della risorsa. È usata per l’autenticazione delle richieste API.
Dopo aver inviato la richiesta API, si riceverà una risposta 202 con l'esito positivo indicante che il processo di training è stato annullato. Risultati di una chiamata con esito positivo con un'intestazione Operation-Location usata per controllare lo stato del processo.