Condividi tramite


Limiti dei servizi in Azure AI Search

I limiti massimi per archiviazione, carichi di lavoro e quantità di indici e altri oggetti dipendono dal piano tariffario scelto per Azure AI Search: Gratuito, Basic, Standard o Ottimizzato per l’archiviazione.

  • Il pianoGratuito è un servizio condiviso multi-tenant fornito con la sottoscrizione di Azure.

  • Il piano Basic fornisce risorse di calcolo dedicate per i carichi di lavoro di produzione su scala più ridotta, ma condivide alcune infrastrutture di rete con altri tenant.

  • Il piano Standard prevede computer dedicati con maggiore capacità di elaborazione e archiviazione a ogni livello. Il piano Standard è disponibile in quattro livelli: S1, S2, S3 ed S3 HD. S3 Alta densità (S3 HD) è progettato per configurazioni multi-tenancy e grandi quantità di indici di dimensioni ridotte (3.000 indici per ogni servizio). S3 HD non fornisce la funzionalità dell'indicizzatore e l'inserimento dei dati deve sfruttare le API che eseguono il push dei dati dall'origine all'indice.

  • Il piano Ottimizzato per l'archiviazione viene eseguito su computer dedicati con una maggiore quantità totale di archiviazione, larghezza di banda di archiviazione e memoria rispetto al piano Standard. Questo piano è destinato agli indici di grandi dimensioni e a modifica lenta. Il piano Ottimizzato per l'archiviazione comprende due livelli: L1 e L2.

Limiti delle sottoscrizioni

È possibile creare più servizi di ricerca fatturabili (Basic e superiori), fino al numero massimo di servizi consentiti per ogni livello. Ad esempio, è possibile creare fino a 16 servizi a livello Basic e altri 16 servizi a livello S1 usando la stessa sottoscrizione. Per altre informazioni sui livelli, vedere Scegliere un livello (o SKU) per Azure AI Search.

È possibile aumentare i limiti massimi del servizio su richiesta. Se sono necessari più servizi nell’ambito della stessa sottoscrizione, inviare una richiesta di supporto.

Conto risorse Gratuito 1 Di base S1 S2 S3 S3 HD L1 L2
Numero massimo di servizi 1 16 16 8 6 6 6 6
Numero massimo di unità di ricerca (SU)2 N/D 3 unità di ricerca 36 unità di ricerca 36 unità di ricerca 36 unità di ricerca 36 unità di ricerca 36 unità di ricerca 36 unità di ricerca

1 È possibile avere un servizio di ricerca gratuito per ogni sottoscrizione di Azure. Il livello gratuito si basa sull'infrastruttura condivisa con altri clienti. Poiché l'hardware non è dedicato, la scalabilità orizzontale non è supportata e l'archiviazione è limitata a 50 MB.

2 Le unità di ricerca sono unità di fatturazione allocate come replica o come partizione. Sono necessari entrambi. Per altre informazioni sulle combinazioni di unità di ricerca, vedere Stimare e gestire la capacità di un servizio di ricerca.

Limiti del servizio

La tabella seguente illustra il contratto di servizio, i conteggi delle partizioni e i conteggi delle repliche a livello di servizio.

Conto risorse Gratuito Di base S1 S2 S3 S3 HD L1 L2
Contratto di servizio (SLA) No
Partizioni N/D 3 1 12 12 12 3 12 12
Repliche N/D 3 12 12 12 12 12 12

1 Il livello Basic supporta tre partizioni e tre repliche, per un totale di nove unità di ricerca (SU) sui nuovi servizi di ricerca creati dopo il 3 aprile 2024. I servizi di base meno recenti sono limitati a una partizione e a tre repliche.

Un servizio di ricerca è soggetto a un limite massimo di archiviazione (dimensioni della partizione moltiplicate per il numero di partizioni) o a un limite rigido per il numero massimo di indici o indicizzatori, a seconda di quale evento si verifica per primo.

I contratti di servizio si applicano ai servizi fatturabili con due o più repliche per i carichi di lavoro di query o a tre o più repliche per carichi di lavoro di query e indicizzazione. Il numero di partizioni non è un fattore di cui viene tenuto conto ai fini del contratto di servizio. Per altre informazioni, vedere Affidabilità in Azure AI Search.

I servizi gratuiti non hanno partizioni o repliche fisse e condividono risorse con altri sottoscrittori.

Archiviazione della partizione (GB)

I limiti di archiviazione per servizio variano in base a due fattori: data di creazione del servizio e area. Esistono limiti più elevati per i servizi più recenti nella maggior parte delle aree supportate.

Questa tabella illustra l'avanzamento dell'aumento della quota di archiviazione in GB nel tempo. Le partizioni con capacità superiore sono state portate online a partire da aprile 2024, nelle aree elencate nelle note a piè di pagina. Una capacità superiore è limitata ai nuovi servizi di ricerca. Al momento, non è disponibile alcun aggiornamento sul posto.

Data di creazione servizio Di base S1 S2 S3/HD L1 L2
Prima del 3 aprile 2024 2 25 100 200 1.024 2.048
Dal 3 aprile 2024 al 17 maggio 2024 1 15 160 512 1.024 1.024 2.048
Dopo il 17 maggio 2024 2 15 160 512 1.024 2.048 4.096

1 Archiviazione con capacità superiore per Basic, S1, S2, S3 in queste aree. America:Brasile meridionale, Canada centrale, Canada orientale, Stati Uniti orientali, Stati Uniti orientali 2Stati Uniti centrali, Stati Uniti centro-settentrionali, Stati Uniti centro-meridionali, Stati Uniti occidentali, Stati Uniti occidentali 2, Stati Uniti occidentali 3, Stati Uniti centro-occidentali. Europa: Francia centrale. Italia settentrionale, Europa settentrionale, Norvegia orientale, Polonia centrale, Svizzera settentrionale, Svezia centrale, Regno Unito meridionale, Regno Unito occidentale. Medio Oriente: Emirati Arabi Uniti settentrionali. Africa: Sudafrica settentrionale. Asia Pacifico: Australia East​, Australia sud-orientale, India centrale, Jio India occidentale, Asia orientale, Asia sudorientale, Giappone orientale, Giappone occidentale, Corea centrale, Corea meridionale.

2 Maggiore capacità di archiviazione per L1 e L2. Più aree offrono capacità più elevata a ogni livello fatturabile. Europa: Germania settentrionale, Germania centro-occidentale, Svizzera occidentale. Azure per enti pubblici: Texas, Arizona, Virginia. Africa: Sudafrica settentrionale. Asia Pacifico: Cina settentrionale 3, Cina orientale 3.

Alcune aree vengono ancora eseguite sull'infrastruttura precedente, soggette ai limiti del 3 aprile. Prima di creare un nuovo servizio, controllare le aree supportate per assicurarsi che l'area selezionata fornisca la capacità aggiuntiva.

Limiti per gli indici

Conto risorse Gratuito Basic 1 S1 S2 S3 S3 HD L1 L2
Numero massimo di indici 3 5 o 15 50 200 200 1000 per partizione o 3000 per servizio 10 10
Numero massimo di campi semplici per indice 2 1000 100 1000 1000 1000 1000 1000 1000
Dimensioni massime per campo vettoriale 4098 4098 4098 4098 4098 4098 4098 4098
Numero massimo di raccolte complesse per indice 40 40 40 40 40 40 40 40
Numero massimo di elementi in tutte le raccolte complesse per documento3 3000 3000 3000 3000 3000 3000 3000 3000
Profondità massima dei campi complessi 10 10 10 10 10 10 10 10
Numero massimo di suggerimenti per indice 1 1 1 1 1 1 1 1
Numero massimo di profili di punteggio per indice 100 100 100 100 100 100 100 100
Numero massimo di funzioni per profilo 8 8 8 8 8 8 8 8
Dimensioni massime dell’indice 4 N/D N/D N/D 1,88 TB 2,34 TB 100 GB N/D N/D

1 I servizi Basic creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) per gli indici. Il livello di base è l'unico livello con un limite inferiore di 100 campi per indice.

2Il limite superiore per i campi include sia i campi di primo livello che i sottocampi annidati in una raccolta complessa. Ad esempio, se un indice contiene 15 campi e ha due raccolte complesse con cinque sottocampi ciascuno, il numero dei campi dell'indice è 25. Gli indici con una raccolta di campi molto grandi possono essere lenti. Limitare i campi e gli attributi solo a quelli necessari ed eseguire l'indicizzazione e il test delle query per verificare che le prestazioni siano accettabili.

3 È previsto un limite superiore per gli elementi perché la presenza di un numero elevato di elementi aumenta significativamente lo spazio di archiviazione necessario per l'indice. Un elemento di una raccolta complessa viene considerato un membro di tale raccolta. Si supponga, ad esempio, di avere un documento Hotel con una raccolta Rooms complessa; ogni stanza nella raccolta Rooms sarà considerata un elemento. Durante l'indicizzazione, nel suo complesso il motore di indicizzazione può elaborare in modo sicuro un massimo di 3.000 elementi nel documento. Questo limite è stato introdotto in api-version=2019-05-06 e si applica solo a raccolte complesse e non a raccolte di stringhe o a campi complessi.

4 Nella maggior parte dei livelli, la dimensione massima dell'indice è tutta la risorsa di archiviazione disponibile nel servizio di ricerca. Per S2, S3 e S3 HD, la dimensione massima di qualsiasi indice è il numero specificato nella tabella. Si applica ai servizi di ricerca creati dopo il 3 aprile 2024.

Se il provisioning del servizio viene effettuato in un cluster più potente, è possibile che i limiti massimi risultino diversi. I limiti rappresentano il denominatore comune. Gli indici creati in base alle specifiche precedenti sono portabili tra livelli di servizio equivalenti in qualsiasi area.

Limiti per i documenti

Il numero massimo di documenti per indice è:

  • 24 miliardi di servizi di ricerca Basic, S1, S2, S3, L1 e L2.
  • 2 miliardi su S3 HD.

Ogni elemento di una raccolta complessa viene conteggiato come un documento distinto ai fini di questi limiti.

La dimensione massima del documento quando si chiama un'API di indice è di circa 16 MB.

La dimensione del documento costituisce effettivamente un limite alla dimensione del corpo della richiesta dell'API di indice. Poiché è possibile passare all'API di indice un batch costituito da più documenti in una sola volta, il limite della dimensione dipende in effetti dal numero di documenti presenti nel batch. Per un batch con un solo documento, la dimensione massima del documento è di 16 MB di JSON.

Quando si stimano le dimensioni del documento, ricordarsi di prendere in considerazione solo i campi che aggiungono valore agli scenari di ricerca ed escludere tutti i campi di origine che non hanno alcun scopo nelle query che si intende eseguire.

Limiti delle dimensioni dell'indice vettoriale

Quando si indicizzano documenti con campi vettoriali, Azure AI Search costruisce indici vettoriali interni usando i parametri dell'algoritmo forniti. Le dimensioni di questi indici vettoriali sono limitate dalla memoria riservata alla ricerca vettoriale del livello del servizio (o SKU). Per indicazioni sulla gestione e l'ottimizzazione dell'archiviazione vettoriale, vedere Dimensioni dell'indice vettoriale e mantenersi al di sotto dei limiti.

I limiti dei vettori variano in base a:

Esistono limiti di vettori più elevati a partire da aprile 2024 per in nuovi servizi di ricerca nelle aree che forniscono la capacità aggiuntiva, ovvero la maggior parte.

Questa tabella mostra l'avanzamento dell'aumento della quota vettoriale in GB nel corso del tempo. La quota è per partizione, quindi se si ridimensiona un nuovo servizio Standard (S1) a 6 partizioni, la quota totale del vettore è 35 moltiplicata per 6.

Data di creazione servizio Di base S1 S2 S3/HD L1 L2
Prima del 1° luglio 2023 1 0.5 1 6 12 12 36
Dal 1° luglio 2023 al 3 aprile 20242 1 3 12 36 12 36
Dal 3 aprile 2024 al 17 maggio 20243 5 35 150 300 12 36
Dopo il 17 maggio 20244 5 35 150 300 150 300

1 Limiti iniziali del vettore durante l'anteprima anticipata.

2 Limiti del vettore durante il periodo di anteprima successivo. Tre regioni non hanno i limiti più elevati: Germania centro-occidentale, India occidentale, Qatar centrale.

3 Quota di vettori più elevata in base alle partizioni più grandi per i livelli e le aree supportati.

4 Maggiore quota vettoriale per più livelli e aree in base agli aggiornamenti delle dimensioni della partizione.

Il servizio applica una quota pari alle dimensioni dell'indice vettoriale per ogni partizione nel servizio di ricerca. Ogni partizione aggiuntiva aumenta la quota relativa alle dimensioni dell'indice vettoriale disponibile. Questa quota è un limite rigido che ha lo scopo di garantire che il servizio rimanga integro, il che significa che si verifica un errore in caso di ulteriori tentativi di indicizzazione dopo il superamento del limite. È possibile riavviare l'indicizzazione dopo aver liberato la quota disponibile eliminando alcuni documenti vettoriali o effettuando un ridimensionamento nelle partizioni.

Importante

I limiti dei vettori più elevati sono associati a dimensioni di partizione maggiori. Le aree che vengono ancora eseguite in un’infrastruttura precedente sono soggette ai limiti di luglio-aprile. Rivedere l'elenco delle aree per verificare lo stato dei limiti di archiviazione delle partizioni.

Limiti dell'indicizzatore

Sono previsti tempi di esecuzione massimi per garantire il bilanciamento e la stabilità del servizio nel complesso, ma i set di dati di maggiori dimensioni potrebbero richiedere più tempo di indicizzazione rispetto al massimo consentito. Se un processo di indicizzazione non può essere completato nel tempo massimo consentito, provare a eseguirlo in modo pianificato. L'utilità di pianificazione tiene traccia dello stato di indicizzazione. Se un processo di indicizzazione pianificato viene interrotto per qualsiasi motivo, alla successiva esecuzione pianificata l'indicizzatore può riprendere dall'ultima interruzione.

Conto risorse Gratuito 1 Basic 2 S1 S2 S3 S3 HD 3 L1 L2
Numero massimo di indicizzatori 3 5 o 15 50 200 200 N/D 10 10
Numero massimo di origini dati 3 5 o 15 50 200 200 N/D 10 10
Numero massimo di set di competenze 4 3 5 o 15 50 200 200 N/D 10 10
Carico di indicizzazione massimo per chiamata 10.000 documenti Limitato solo da numero massimo di documenti Limitato solo da numero massimo di documenti Limitato solo da numero massimo di documenti Limitato solo da numero massimo di documenti N/D Nessun limite Nessun limite
Pianificazione minima 5 minuti 5 minuti 5 minuti 5 minuti 5 minuti 5 minuti 5 minuti 5 minuti
Tempo massimo di esecuzione 5 1-3 minuti 2 o 24 ore 2 o 24 ore 2 o 24 ore 2 o 24 ore N/D 2 o 24 ore 2 o 24 ore
Tempo di esecuzione massimo per gli indicizzatori con un set di competenze 6 3-10 minuti 2 ore 2 ore 2 ore 2 ore N/D 2 ore 2 ore
Indicizzatore BLOB: dimensioni massime per un BLOB, MB 16 16 128 256 256 N/D 256 256
Indicizzatore BLOB: numero massimo di caratteri di contenuto estratti da un BLOB 32.000 64.000 4 milioni 8 milioni 16 milioni N/D 4 milioni 4 milioni

1 I servizi del livello Gratuito hanno un tempo massimo di esecuzione degli indicizzatori di 3 minuti per le origini BLOB e di 1 minuto per tutte le altre origini dati. La chiamata dell'indicizzatore viene eseguita una volta ogni 180 secondi. Per l'indicizzazione tramite intelligenza artificiale che effettua chiamate ai servizi Azure per intelligenza artificiale, i servizi gratuiti sono limitati a 20 transazioni gratuite al giorno per ogni indicizzatore, in cui una transazione viene definita come documento che passa correttamente attraverso la pipeline di arricchimento (suggerimento: è possibile reimpostare un indicizzatore per reimpostarne il conteggio).

2 I servizi Basic creati prima di dicembre 2017 hanno limiti inferiori (5 anziché 15) per gli indicizzatori, le origini dati e i set di competenze.

3 I servizi del livello S3 HD non includono il supporto per l'indicizzatore.

4 Numero massimo di 30 competenze per set di competenze.

5 Per quanto riguarda la durata massima di 2 o 24 ore degli indicizzatori: un massimo di 2 ore è la durata più comune e quella che dovrebbe essere pianificata. Il limite di 24 ore deriva da un'implementazione precedente dell'indicizzatore. Se gli indicizzatori non pianificati vengono eseguiti continuamente per 24 ore, è probabile che non sia stato possibile eseguire la migrazione di tali indicizzatori all'infrastruttura più recente. Come regola generale, per l'indicizzazione dei processi che non possono terminare entro due ore, impostare l'indicizzatore su una pianificazione di 2 ore. Quando viene completato il primo intervallo di 2 ore, l'indicizzatore riprende da dove è stato interrotto all'avvio dell'intervallo successivo di 2 ore.

6 L'arricchimento tramite intelligenza artificiale e l'analisi delle immagini sono attività complesse e usano una quantità estremamente elevata della potenza di elaborazione disponibile. Il tempo di esecuzione per questi carichi di lavoro è più breve per consentire ad altri processi nella coda di avere più opportunità di essere eseguiti.

Nota

Come indicato in Limiti per gli indici, gli indicizzatori applicheranno anche il limite superiore di 3000 elementi in tutte le raccolte complesse per documento a partire dalla versione più recente dell'API disponibile a livello generale che supporta i tipi complessi (2019-05-06). Se l'indicizzatore è stato creato con una versione precedente dell'API, non sarà soggetto a questo limite. Per mantenere la massima compatibilità, un indicizzatore creato con una versione precedente dell'API e quindi aggiornato con una versione dell'API 2019-05-06 o successiva verrà comunque escluso dai limiti. I clienti devono essere consapevoli dell'impatto negativo della presenza di raccolte complesse di grandi dimensioni (come indicato in precedenza) ed è consigliabile creare nuovi indicizzatori con la versione più recente dell'API disponibile a livello generale.

Gli indicizzatori possono accedere ad altre risorse di Azure tramite endpoint privati gestiti tramite l'API della risorsa del collegamento privato condiviso. Questa sezione descrive i limiti associati a questa funzionalità.

Conto risorse Gratuito Di base S1 S2 S3 S3 HD L1 L2
Supporto dell'indicizzatore per l’endpoint privato No No
Supporto dell'endpoint privato per gli indicizzatori con un set di competenze 1 No No No No
Numero massimo di endpoint privati N/D 10 o 30 100 400 400 N/D 20 20
Numero massimo di tipi di risorse distinti 2 N/D 4 7 15 15 N/D 4 4

1 L'arricchimento tramite intelligenza artificiale e l'analisi delle immagini sono attività complesse e usano una quantità estremamente elevata della potenza di elaborazione disponibile. Per questo motivo, le connessioni private vengono disabilitate ai livelli inferiori allo scopo di garantire le prestazioni e la stabilità del servizio di ricerca stesso.

2 Il numero di tipi di risorse distinti viene calcolato come numero di valori univoci groupId usati in tutte le risorse del collegamento privato condiviso per un determinato servizio di ricerca, indipendentemente dallo stato della risorsa.

Limiti per i sinonimi

Il numero massimo di mappe di sinonimi varia in base al livello. Ogni regola può avere fino a 20 espansioni, dove un'espansione è un termine equivalente. Se ad esempio si specifica "gatto", l'associazione con "gattino", "felino" e "felis" (il genere dei gatti) viene conteggiata come 3 espansioni.

Conto risorse Gratuito Di base S1 S2 S3 S3-HD L1 L2
Numero massimo di mappe di sinonimi 3 3 5 10 20 20 10 10
Numero massimo di regole per mappa 5000 20000 20000 20000 20000 20000 20000 20000

Limiti degli alias di indice

Il numero massimo di alias di indice varia in base al livello. In tutti i livelli il numero massimo di alias è pari al doppio del numero massimo di indici consentiti.

Conto risorse Gratuito Di base S1 S2 S3 S3-HD L1 L2
Numero massimo di alias 6 10 o 30 100 400 400 2000 per partizione o 6000 per servizio 20 20

Limiti dei dati (arricchimento tramite intelligenza artificiale)

Una pipeline di arricchimento tramite intelligenza artificiale che effettua chiamate a una risorsa di Lingua di Azure AI per il riconoscimento di entità, il collegamento di entità, l'estrazione di frasi chiave, l'analisi del sentiment, il rilevamento della lingua e il rilevamento di informazioni personali è soggetta a limiti dei dati. Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli all'analizzatore di valutazione, usare la competenza cognitiva di divisione del testo.

Limitazioni

Le richieste API vengono limitate man mano che il sistema si avvicina alla capacità massima. La limitazione delle richieste si comporta in modo diverso per le diverse API. Le API di query (ricerca/suggerimenti/completamento automatico) e le API di indicizzazione vengono limitate in modo dinamico in base al carico del servizio. Le API di indice e l'API delle operazioni del servizio hanno limiti di frequenza per le richieste statiche.

Limiti statici per la frequenza delle richieste per le operazioni correlate a un indice:

  • Indici di elenco (GET /indexes): 3 al secondo per unità di ricerca
  • Ottenere un indice (GET /indexes/myindex): 10 al secondo per unità di ricerca
  • Creare un indice (POST /indexes): 12 al minuto per unità di ricerca
  • Creare o aggiornare un indice (PUT /indexes/myindex): 6 al secondo per unità di ricerca
  • Eliminare un indice (DELETE /indexes/myindex): 12 al minuto per unità di ricerca

Limiti statici per la frequenza delle richieste per le operazioni correlate a un indice:

  • Statistiche del servizio (GET /servicestats): 4 al secondo per unità di ricerca

La riclassificazione L2 con il reranker semantico presenta un volume previsto:

  • fino a 10 query concorrenti per replica. Se si prevedono requisiti di velocità effettiva coerenti vicino, a o superiore a questo livello, inviare un ticket di supporto in modo che sia possibile effettuare il provisioning per il carico di lavoro.

Limiti delle richieste API

  • 16 MB al massimo per 1 richiesta
  • Lunghezza dell’URL pari a un massimo di 8 KB
  • Al massimo 1.000 documenti per ogni batch di carichi, unioni o eliminazioni di indice
  • 32 campi al massimo nella clausola $orderby
  • Al massimo 100.000 caratteri in una clausola di ricerca
  • Il numero massimo di clausole in search (espressioni separate da AND o OR) è 1024
  • 32.766 byte (32 KB meno 2 byte) di testo con codifica UTF-8 per la dimensione massima del termine di ricerca
  • La dimensione massima del termine di ricerca è di 1.000 caratteri per la ricerca con prefisso e la ricerca regex
  • La ricerca con caratteri jolly e la ricerca di espressioni regolari sono limitate a un massimo di 1.000 stati durante l'elaborazione da Lucene.

1 In Azure AI Search il corpo di una richiesta è soggetto a un limite massimo di 16 MB, che impone un limite pratico ai contenuti di singoli campi o raccolte non vincolati a limiti teorici. Per altre informazioni sulla composizione dei campi e sulle relative restrizioni, vedere Tipi di dati supportati.

Esistono limiti per le dimensioni e la composizione delle query perché le query non associate possono destabilizzare il servizio di ricerca. In genere, tali query vengono create a livello di codice. Se l'applicazione genera query di ricerca a livello di codice, è consigliabile progettarla in modo che non generi query di dimensioni illimitate.

Limiti delle risposte API

  • Al massimo 1,000 documenti restituiti per pagina di risultati della ricerca
  • 100 suggerimenti al massimo restituiti per richiesta di API di suggerimento

Limiti delle chiavi API

Le chiavi API vengono usate per l'autenticazione del servizio. Sono disponibili due tipi. Le chiavi amministratore, specificate nell'intestazione della richiesta, consentono l'accesso completo in lettura e scrittura al servizio. Le chiavi di query sono di sola lettura, sono specificate nell'URL e in genere sono distribuite ad applicazioni client.

  • 2 chiavi di amministrazione al massimo per ogni servizio
  • 50 chiavi di query al massimo per ogni servizio