Informazioni sul riconoscimento ottico dei caratteri in Microsoft Purview

Articolo
10/02/2024

L'analisi OCR (Optical Character Recognition) consente a Microsoft Purview di analizzare le immagini alla ricerca di informazioni riservate. L'analisi OCR è una funzionalità facoltativa e deve essere abilitata a livello di tenant. Una volta abilitata, si selezionano le posizioni in cui si desidera analizzare le immagini. L'analisi delle immagini è disponibile per i dispositivi Exchange, SharePoint, OneDrive, Teams, Windows e macOS. Dopo aver configurato le impostazioni OCR, i criteri esistenti per la prevenzione della perdita dei dati (DLP), la gestione dei record e la gestione dei rischi Insider (IRM) vengono applicati alle immagini e al contenuto basato su testo. Ad esempio, si supponga di aver configurato il contenuto della condizione DLP contenente informazioni riservate e incluso un classificatore di dati, ad esempio il tipo di informazioni sensibili della carta di credito (SIT). In questo caso, Microsoft Purview analizza i numeri di carta di credito in testo e immagini in tutte le posizioni scelte.

Flusso di lavoro in breve

Fase	Cosa serve
Creare una sottoscrizione di Azure, se necessario	Se l'organizzazione non dispone già di una sottoscrizione con pagamento in base al consumo di Azure per il tenant, l'amministratore globale deve iniziare creando un account Azure.
Stimare gli addebiti per l'analisi OCR	Usare lo strumento di stima dei costi OCR per stimare gli addebiti previsti per i casi d'uso specifici.
Configurare la fatturazione con pagamento in base al consumo per abilitare OCR.	L'amministratore globale o di SharePoint deve seguire le istruzioni riportate in Configurare Microsoft Syntex fatturazione in Azure per aggiungere una sottoscrizione per OCR.
Configurare le impostazioni di analisi OCR	L'amministratore della conformità per l'organizzazione configura le impostazioni OCR per il tenant.

Prerequisiti

Per usare l'analisi OCR, l'amministratore globale dell'organizzazione deve verificare che sia disponibile una sottoscrizione con pagamento in base al consumo di Azure. In caso contrario, è necessario configurare questa funzionalità seguendo le istruzioni riportate in Creare le sottoscrizioni di Azure iniziali

Configurare la fatturazione

Quando si abilita OCR, tutti i tipi di informazioni sensibili e i classificatori sottoponibili a training possono rilevare i caratteri presenti nelle immagini.

Poiché si tratta di una funzionalità facoltativa, l'amministratore globale deve configurare la fatturazione con pagamento in base al consumo per abilitare OCR. Per aggiungere una sottoscrizione per OCR, vedere le istruzioni in Configurare la fatturazione Microsoft Syntex in Azure.

Nota

Dopo aver immesso le informazioni di fatturazione in Microsoft Syntex, l'amministratore della conformità può configurare OCR in Microsoft Purview, senza requisiti aggiuntivi di configurazione o licenza.

È possibile trovare informazioni sui prezzi con pagamento in base al consumo di OCR nella pagina Configura fatturazione Microsoft Syntex in Azure.

Stimare gli addebiti per l'analisi OCR

L'addebito per l'uso di OCR è di $ 1,00 per ogni 1.000 elementi analizzati. Ogni immagine analizzata viene conteggiata come una transazione. Ciò significa che le immagini autonome (JPEG, JPG, PNG, BMP o TIFF) vengono conteggiate come una singola transazione. Significa anche che ogni pagina in un file PDF viene addebitata separatamente. Ad esempio, se sono presenti 10 pagine in un file PDF, un'analisi OCR del file PDF viene conteggiata come 10 scansioni separate. Per informazioni sull'uso dello strumento di stima dei costi OCR, vedere Stima dei costi OCR.

Nota

Per ridurre i costi OCR, gli addebiti per l'analisi di ogni immagine univoca vengono addebitati una sola volta.

Le immagini di piccole dimensioni, ad esempio logo e firme inviate tramite posta elettronica tramite Microsoft Exchange, vengono analizzate e fatturate una sola volta per ogni immagine univoca in tutti gli utenti del tenant. Per tutte le istanze successive, i risultati dell'analisi precedente verranno riutilizzati.

Inoltre, ogni immagine analizzata può essere usata in un numero qualsiasi di criteri per la prevenzione della perdita di dati, la gestione dei rischi Insider, l'etichettatura automatica e la gestione dei record senza costi aggiuntivi.

Importante

Per informazioni sui requisiti di Adobe per l'uso delle funzionalità di Prevenzione della perdita dei dati Microsoft Purview (DLP) con file PDF, vedere questo articolo di Adobe: Microsoft Purview Information Protection Support in Acrobat.

Configurare le impostazioni OCR

Selezionare la scheda appropriata per il portale in uso. A seconda del piano di Microsoft 365, il Portale di conformità di Microsoft Purview viene ritirato o verrà ritirato a breve.

Per altre informazioni sul portale di Microsoft Purview, vedere Portale di Microsoft Purview. Per altre informazioni sul portale di conformità, vedere Portale di conformità di Microsoft Purview.

Portale di Microsoft Purview
Portale di conformità

Accedere al portale di Microsoft Purview.
Selezionare Impostazioni.
Selezionare Riconoscimento ottico dei caratteri (OCR) per immettere le impostazioni di configurazione OCR.
Selezionare le posizioni in cui si desidera analizzare le immagini.
Selezionare i gruppi di distribuzione da includere o escludere dalle analisi OCR.
Selezionare Fine

Le posizioni e le soluzioni supportate sono elencate nella tabella seguente.

Autorizzazioni

L'account usato per creare e distribuire i criteri deve essere membro di uno di questi gruppi di ruoli

Amministratore di conformità
Amministratore dati di conformità
Amministratore globale
Azure Information Protection
Amministratore di Information Protection

Nota

In generale, le impostazioni OCR diventano effettive circa un'ora dopo l'attivazione.
Per informazioni sulla funzionalità OCR in Conformità delle comunicazioni Microsoft Purview, vedere Creare e gestire i criteri di conformità delle comunicazioni.

Posizioni e soluzioni supportate

Posizione	Soluzioni supportate
Exchange	Prevenzione della perdita dei dati Protezione delle informazioni: criteri di etichettatura automatica Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Siti di SharePoint	Prevenzione della perdita dei dati Gestione dei rischi Insider² Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Account di OneDrive	Prevenzione della perdita dei dati Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Messaggi di chat e canali di Teams	Prevenzione della perdita dei dati Gestione dei rischi Insider²
Dispositivi	Prevenzione della perdita dei dati Gestione dei rischi Insider²

¹ Supporta parole chiave e tipi di informazioni sensibili.
² Considera i tipi di informazioni sensibili e i classificatori sottoponibili a training presenti nelle immagini per l'assegnazione dei punteggi di rischio.

Tipi di file supportati

Questa funzionalità supporta l'analisi delle immagini nei tipi di file seguenti, con i requisiti indicati:

Tipi di file supportati	Requisiti delle immagini
JPEG, JPG, PNG, BMP, TIFF e PDF (solo immagine)	Dimensioni dei file: I file di immagine non devono superare i 20 MB per Exchange e Teams. Per gli endpoint di SharePoint, OneDrive e Windows e macOS, le dimensioni massime del file di immagine sono di 50 MB. Risoluzione dell'immagine: La risoluzione dell'immagine deve essere di almeno 50 x 50 pixel e non superiore a 16.000 x 16.000 px.

Importante

Vengono analizzate solo le immagini caricate dopo l'abilitazione di OCR.
Sia la posta elettronica in ingresso (posta elettronica proveniente da utenti esterni all'organizzazione) che quella in uscita (posta elettronica inviata dagli utenti all'interno dell'organizzazione) sono soggette all'analisi OCR. Per limitare le analisi OCR solo ai messaggi di posta elettronica in uscita, modificare le impostazioni OCR dall'ambito predefinito Tutti i gruppi di distribuzione ai gruppi di distribuzione specifici e specificare i gruppi di distribuzione interni da analizzare. Per informazioni sulla modifica di questa configurazione, vedere Configurare le impostazioni OCR.
I suggerimenti per i criteri di prevenzione della perdita dei dati non sono supportati per le immagini in Exchange.
Se si esclude un percorso nelle impostazioni di prevenzione della perdita dei dati dell'endpoint, OCR non analizzerà le immagini in tali cartelle.
Quando OCR è attivato per i dispositivi Windows e macOS, i dispositivi iniziano a inviare messaggi al cloud per l'analisi. Il limite di larghezza di banda predefinito è di 1024 MB di dati per dispositivo al giorno. OCR interrompe l'analisi delle immagini una volta raggiunto questo limite giornaliero. Se si vuole continuare a analizzare le immagini, è possibile aumentare il limite di larghezza di banda.

Lingue supportate

L'analisi OCR supporta più di 150 lingue.

Riepilogo

Per usare OCR, è necessario configurare Microsoft Syntex fatturazione con pagamento in base al consumo. Non è necessario configurare Microsoft Syntex stesso.
La configurazione di OCR avviene a livello di tenant, quindi una volta configurato OCR, è disponibile per l'intero stack di Microsoft Purview.
Non è necessario creare classificatori di dati separati per OCR. Dopo aver configurato OCR, i tipi di informazioni sensibili esistenti, i tipi di informazioni sensibili basati sulla corrispondenza dei dati esatti, i classificatori sottoponibili a training e i SIT di impronta digitale analizzano immagini, documenti e messaggi di posta elettronica.

Condividi tramite

Informazioni sul riconoscimento ottico dei caratteri in Microsoft Purview

Flusso di lavoro in breve

Prerequisiti

Configurare la fatturazione

Stimare gli addebiti per l'analisi OCR

Configurare le impostazioni OCR

Autorizzazioni

Posizioni e soluzioni supportate

Tipi di file supportati

Lingue supportate

Riepilogo

Vedere anche

Commenti e suggerimenti

Risorse aggiuntive