Condividi tramite


Configurare contenitori Docker OCR (riconoscimento ottico dei caratteri) di lettura

È possibile configurare l'ambiente di runtime del contenitore Lettura OCR di Visione di Azure AI usando gli argomenti del comando docker run. Questo contenitore include alcune impostazioni obbligatorie, insieme ad alcune impostazioni facoltative. Sono disponibili numerosi esempi del comando. Le impostazioni specifiche del contenitore sono le impostazioni di fatturazione.

Impostazioni di configurazione

Le impostazioni di configurazione del contenitore sono le seguenti:

Richiesto Impostazione Purpose
ApiKey Tiene traccia delle informazioni di fatturazione.
No ApplicationInsights Consente di aggiungere al contenitore il supporto per i dati di telemetria di Azure Application Insights.
Fatturazione Specifica l'URI dell'endpoint della risorsa del servizio in Azure.
Eula Indica che è stata accettata la licenza per il contenitore.
No Fluentd Scrive il log e, facoltativamente, i dati delle metriche in un server Fluentd.
No Proxy HTTP Configura un proxy HTTP per le richieste in uscita.
No Registrazione Fornisce il supporto di registrazione ASP.NET Core per il contenitore.
No Mounts Legge e scrive i dati dal computer host al contenitore e dal contenitore al computer host.

Importante

Le impostazioni ApiKey, Billing e Eula vengono usate insieme ed è necessario fornire valori validi per tutte e tre, altrimenti il contenitore non verrà avviato. Per altre informazioni sull'uso di queste impostazioni di configurazione per creare un'istanza di un contenitore, vedere Billing (Fatturazione).

Il contenitore include anche le impostazioni di configurazione specifiche del contenitore seguenti:

Richiesto Impostazione Scopo
No ReadEngineConfig:ResultExpirationPeriod Solo contenitori v2.0. Periodo di scadenza dei risultati in ore. L'impostazione predefinita è 48 ore. L'impostazione specifica quando il sistema deve cancellare i risultati del riconoscimento. Ad esempio, in caso di resultExpirationPeriod=1, il sistema cancella il risultato del riconoscimento 1 ora dopo il processo. In caso di resultExpirationPeriod=0, il sistema cancella il risultato del riconoscimento dopo il recupero del risultato.
No Cache:Redis Solo contenitori v2.0. Abilita l'archiviazione Redis per l'archiviazione dei risultati. Una cache è necessaria se più contenitori OCR di lettura vengono posizionati dietro un servizio di bilanciamento del carico.
No Queue:RabbitMQ Solo contenitori v2.0. Abilita RabbitMQ per l'invio di attività. L'impostazione è utile quando più contenitori OCR di lettura vengono posizionati dietro un servizio di bilanciamento del carico.
No Queue:Azure:QueueVisibilityTimeoutInMilliseconds Solo contenitori v3.x. Tempo in cui un messaggio deve essere invisibile quando viene elaborato da un altro ruolo di lavoro.
No Storage::DocumentStore::MongoDB Solo contenitori v2.0. Abilita MongoDB per l'archiviazione dei risultati permanente.
No Storage:ObjectStore:AzureBlob:ConnectionString Solo contenitori v3.x. Stringa di connessione dell'archiviazione BLOB di Azure.
No Storage:TimeToLiveInDays Solo contenitori v3.x. Periodo di scadenza dei risultati in giorni. L'impostazione specifica quando il sistema deve cancellare i risultati del riconoscimento. Il valore predefinito è due giorni, il che significa che qualsiasi risultato che è attivo per più tempo di quel periodo non è garantito che venga recuperato correttamente. Il valore è integer e deve essere compreso tra un giorno e sette giorni.
No StorageTimeToLiveInMinutes v3.2-model-2021-09-30-preview e nuovi contenitori. Periodo di scadenza dei risultati in minuti. L'impostazione specifica quando il sistema deve cancellare i risultati del riconoscimento. Il valore predefinito è due giorni (2.880 minuti), il che significa che tutti i risultati che si verificano per più tempo di quel periodo non sono garantiti per essere recuperati correttamente. Il valore è integer e deve essere compreso tra 60 minuti e sette giorni (10080 minuti).
No Task:MaxRunningTimeSpanInMinutes Solo contenitori v3.x. Tempo massimo di esecuzione per una singola richiesta. Il valore predefinito è 60 minuti.
No EnableSyncNTPServer Solo contenitori v3.x, ad eccezione di v3.2-model-2021-09-30-preview e contenitori più recenti. Abilita il meccanismo di sincronizzazione del server NTP (Network Time Protocol), che garantisce la sincronizzazione tra l'orario di sistema e il runtime dell'attività previsto. Tenere presente che questo richiede traffico di rete esterno. Il valore predefinito è true.
No NTPServerAddress Solo contenitori v3.x, ad eccezione di v3.2-model-2021-09-30-preview e contenitori più recenti. Server NTP per la sincronizzazione dell'orario. Il valore predefinito è time.windows.com.
No Mounts:Shared Solo contenitori v3.x. Cartella locale per l'archiviazione del risultato del riconoscimento. Il valore predefinito è /share. Per l'esecuzione del contenitore senza usare Archiviazione BLOB di Azure, è consigliabile montare un volume in questa cartella per assicurarsi di disporre di spazio sufficiente per i risultati del riconoscimento.

Impostazione di configurazione ApiKey

L'impostazione ApiKey specifica la chiave di risorsa di Visione usata per tenere traccia delle informazioni di fatturazione per il contenitore. È necessario specificare un valore per ApiKey e il valore deve essere una chiave valida per la risorsa di Visione specificata per l'impostazione di configurazione Billing.

Questa impostazione è disponibile nelle posizioni seguenti:

  • Portale di Azure: Gestione risorse di Servizi di Azure AI in Chiavi

Impostazione ApplicationInsights

L'impostazione ApplicationInsights consente di aggiungere al contenitore il supporto per i dati di telemetria di Azure Application Insights. Application Insights offre funzionalità di monitoraggio avanzate del contenitore. È possibile monitorare con facilità la disponibilità, le prestazioni e l'utilizzo del contenitore. È anche possibile identificare e diagnosticare rapidamente gli errori nel contenitore.

La tabella seguente illustra le impostazioni di configurazione supportate nella sezione ApplicationInsights.

Obbligatoria Nome Tipo di dati Descrizione
No InstrumentationKey String Chiave di strumentazione dell'istanza di Application Insights a cui vengono inviati i dati di telemetria per il contenitore. Per altre informazioni, vedere Application Insights per ASP.NET Core.

Esempio:
InstrumentationKey=123456789

Impostazione di configurazione Billing

L'impostazione Billing specifica l'URI dell’endpoint della risorsa di Servizi di Azure AI in Azure usata per misurare le informazioni di fatturazione per il contenitore. È necessario specificare un valore per questa impostazione di configurazione e il valore deve essere un URI dell’endpoint valido per una risorsa di Servizi di Azure AI in Azure. Il contenitore segnala l'utilizzo ogni 10-15 minuti.

Questa impostazione è disponibile nelle posizioni seguenti:

  • Portale di Azure: panoramica di Servizi di Azure AI, con etichetta Endpoint

Ricordarsi di aggiungere il routing vision/<version> all’URI dell’endpoint, come illustrato nella tabella seguente.

Obbligatoria Nome Tipo di dati Descrizione
Billing String URI dell'endpoint di fatturazione

Esempio:
Billing=https://westcentralus.api.cognitive.microsoft.com/vision/v3.2

Impostazione EULA

L'impostazione Eula indica che è stata accettata la licenza per il contenitore. È necessario specificare un valore per questa impostazione di configurazione e tale valore deve essere impostato su accept.

Obbligatoria Nome Tipo di dati Descrizione
Eula String Accettazione della licenza

Esempio:
Eula=accept

I contenitori di Servizi di Azure AI sono concessi in licenza in base al contratto che disciplina l'uso di Azure. Se non si dispone di tale contratto, si acconsente che l'uso di Azure sia disciplinato dal Contratto di Sottoscrizione Microsoft Online, in cui sono incluse le condizioni per l'utilizzo dei Servizi Online. Per le anteprime si accettano inoltre le Condizioni Supplementari per l'Utilizzo delle Anteprime di Microsoft Azure. Con l'uso del contenitore si acconsente a rispettare tali condizioni.

Impostazioni Fluentd

Fluentd è un agente di raccolta dati open source per la registrazione unificata. Le impostazioni Fluentd gestiscono la connessione del contenitore a un server Fluentd. Il contenitore include un provider di registrazione di Fluentd che consente al contenitore di scrivere log e, facoltativamente, dati delle metriche in un server di Fluentd.

La tabella seguente illustra le impostazioni di configurazione supportate nella sezione Fluentd.

Nome Tipo di dati Descrizione
Host Stringa Indirizzo IP o nome host DNS del server Fluentd.
Port Intero Porta del server Fluentd.
Il valore predefinito è 24224.
HeartbeatMs Intero Intervallo di heartbeat, espresso in millisecondi. Se prima della scadenza di questo intervallo è non stato inviato alcun traffico dell'evento, viene inviato un heartbeat al server Fluentd. Il valore predefinito è 60000 millisecondi (1 minuto).
SendBufferSize Intero Spazio di buffer di rete, espresso in byte, allocato per le operazioni di invio. Il valore predefinito è 32768 byte (32 kilobyte).
TlsConnectionEstablishmentTimeoutMs Intero Timeout, espresso in millisecondi, per stabilire una connessione SSL/TLS con il server Fluentd. Il valore predefinito è 10000 millisecondi (10 secondi).
Se UseTLS è impostato su false, questo valore viene ignorato.
UseTLS Booleano Indica se il contenitore deve usare SSL/TLS per comunicare con il server Fluentd. Il valore predefinito è false.

Impostazioni delle credenziali del proxy HTTP

Se è necessario configurare un proxy HTTP per eseguire le richieste in uscita, usare questi due argomenti:

Nome Tipo di dati Descrizione
HTTP_PROXY string Il proxy da usare, ad esempio, http://proxy:8888
<proxy-url>
HTTP_PROXY_CREDS string Tutte le credenziali necessarie per l'autenticazione nel proxy, ad esempio username:password. Questo valore deve essere in lettere minuscole.
<proxy-user> string L'utente per il proxy.
<proxy-password> string La password associata a <proxy-user> per il proxy.
docker run --rm -it -p 5000:5000 \
--memory 2g --cpus 1 \
--mount type=bind,src=/home/azureuser/output,target=/output \
<registry-location>/<image-name> \
Eula=accept \
Billing=<endpoint> \
ApiKey=<api-key> \
HTTP_PROXY=<proxy-url> \
HTTP_PROXY_CREDS=<proxy-user>:<proxy-password> \

Impostazioni di registrazione

Le impostazioni Logging gestiscono il supporto di registrazione di ASP.NET Core per il contenitore. È possibile usare le stesse impostazioni di configurazione e gli stessi valori per il contenitore che si usano per un'applicazione ASP.NET Core.

I provider di registrazione seguenti sono supportati dal contenitore:

Provider Scopo
Console Provider di registrazione Console di ASP.NET Core. Tutti i valori predefiniti e le impostazioni di configurazione di ASP.NET Core per questo provider di registrazione sono supportati.
Debug Provider di registrazione Debug di ASP.NET Core. Tutti i valori predefiniti e le impostazioni di configurazione di ASP.NET Core per questo provider di registrazione sono supportati.
Disco Provider di registrazione JSON. Questo provider di registrazione scrive i dati di log nel montaggio di output.

Questo comando del contenitore archivia informazioni di registrazione nel formato JSON al montaggio di output:

docker run --rm -it -p 5000:5000 \
--memory 2g --cpus 1 \
--mount type=bind,src=/home/azureuser/output,target=/output \
<registry-location>/<image-name> \
Eula=accept \
Billing=<endpoint> \
ApiKey=<api-key> \
Logging:Disk:Format=json \
Mounts:Output=/output

Questo comando del contenitore visualizza informazioni di debug, con il prefisso dbug, durante l'esecuzione del contenitore:

docker run --rm -it -p 5000:5000 \
--memory 2g --cpus 1 \
<registry-location>/<image-name> \
Eula=accept \
Billing=<endpoint> \
ApiKey=<api-key> \
Logging:Console:LogLevel:Default=Debug

Registrazione su disco

Il provider di registrazione Disk supporta le impostazioni di configurazione seguenti:

Nome Tipo di dati Descrizione
Format Stringa Formato di output dei file di log.
Nota: per abilitare il provider di registrazione, questo valore deve essere impostato su json. Se questo valore viene specificato senza specificare anche un montaggio di output durante la creazione di un'istanza di un contenitore, si verifica un errore.
MaxFileSize Intero Dimensione massima, espressa in megabyte (MB), di un file di log. Quando la dimensione del file di log corrente corrisponde a questo valore o lo supera, il provider di registrazione avvia un nuovo file di log. Se viene specificato -1, la dimensione del file di log è limitata solo dalla dimensione massima del file del montaggio di output eventualmente presente. Il valore predefinito è 1.

Per altre informazioni sulla configurazione del supporto di registrazione di ASP.NET Core, vedere Registrazione in ASP.NET Core.

Impostazioni di montaggio

Usare montaggi di associazione per leggere e scrivere dati da e verso il contenitore. È possibile specificare un montaggio di input o di output specificando l'opzione --mount nel comando docker run.

I contenitori Visione di Azure AI non usano montaggi di input o di output per l'archiviazione di dati di servizio o di training.

La sintassi esatta della posizione di montaggio host varia a seconda del sistema operativo host. Inoltre, il percorso di montaggio del computer host potrebbe non essere accessibile a causa di un conflitto tra le autorizzazioni usate dall'account del servizio Docker e le autorizzazioni del percorso di montaggio host.

Facoltativo Nome Tipo di dati Descrizione
Non consentito Input String I contenitori di Visione artificiale di Azure non usano questo campo.
Facoltativo Output String Destinazione del montaggio di output. Il valore predefinito è /output. Questo è il percorso dei log. Include i log dei contenitori.

Esempio:
--mount type=bind,src=c:\output,target=/output

Comandi Docker di esempio

Gli esempi seguenti usano le impostazioni di configurazione per illustrare come scrivere e usare i comandi docker run. Quando è in esecuzione, il contenitore continua l'esecuzione finché non lo si arresta.

  • Carattere di continuazione della riga: i comandi Docker nelle sezioni seguenti usano la barra rovesciata, \, come carattere di continuazione della riga. Sostituirla o rimuoverla in base ai requisiti del sistema operativo host.
  • Ordine degli argomenti: non modificare l'ordine degli argomenti a meno che non si abbia familiarità con i contenitori Docker.

Sostituire {nome_argomento} con i propri valori:

Segnaposto Valore Formato o esempio
{API_KEY} Chiave dell'endpoint della risorsa di Visione nella pagina delle chiavi di risorsa. xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
{ENDPOINT_URI} Il valore dell'endpoint di fatturazione è disponibile nella pagina di panoramica delle risorse. Vedere raccogliere i parametri obbligatori per esempi espliciti.

Nota

Le nuove risorse create dopo il 1° luglio 2019 useranno nomi di sottodomini personalizzati. Per altre informazioni e per un elenco completo degli endpoint a livello di area, vedere Nomi di sottodomini personalizzati per Servizi di Azure AI.

Importante

È necessario specificare le opzioni Eula, Billing e ApiKey per eseguire il contenitore. In caso contrario, il contenitore non si avvia. Per altre informazioni, vedereFatturazione. Il valore ApiKey è la Chiave proveniente dalla pagina delle chiavi delle risorse di Visione.

Esempi di Docker per contenitori

Gli esempi di Docker seguenti sono relativi al contenitore OCR di lettura.

Esempio di base

docker run --rm -it -p 5000:5000 --memory 16g --cpus 8 \
mcr.microsoft.com/azure-cognitive-services/vision/read:3.2-model-2022-04-30 \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Esempio di registrazione

docker run --rm -it -p 5000:5000 --memory 16g --cpus 8 \
mcr.microsoft.com/azure-cognitive-services/vision/read:3.2-model-2022-04-30 \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}
Logging:Console:LogLevel:Default=Information

Passaggi successivi