Vettore del catalogo dei modelli di Azure AI Foundry
Importante
Questo vettore è disponibile in anteprima pubblica in Condizioni supplementari per l'utilizzo. L'API REST 2024-05-01-Preview supporta questa funzionalità.
Il vettore del catalogo dei modelli di Azure AI Foundry si connette a un modello di incorporamento distribuito tramite il catalogo dei modelli di Azure AI Foundry a un endpoint di Azure Machine Learning. I dati vengono elaborati nell'area geografica in cui viene distribuito il modello.
Se è stata usata la vettorizzazione integrata per creare le matrici vettoriali, il set di competenze deve includere una competenza AML che punta al catalogo dei modelli nel portale di Azure AI Foundry.
Parametri del vettorizzatore
I parametri fanno distinzione tra maiuscole e minuscole. Quali parametri si sceglie di usare dipendono dall'autenticazione eventualmente richiesta dall'endpoint online AML.
Nome parametro | Descrizione |
---|---|
uri |
(Obbligatorio) URI dell'endpoint online AML a cui viene inviato il payload JSON. È consentito solo lo schema URI https. |
modelName |
(Obbligatorio) ID del modello del catalogo dei modelli di Azure AI Foundry distribuito nell'endpoint fornito. I modelli supportati sono:
|
key |
(Obbligatorio per l'autenticazione della chiave) Chiave per l'endpoint online AML. |
resourceId |
(Obbligatorio per l'autenticazione tramite token). ID risorsa di Azure Resource Manager dell'endpoint online AML. Deve essere nel formato sottoscrizioni/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}. |
region |
(Facoltativo per l'autenticazione tramite token). L'area in cui viene distribuito l'endpoint online AML. Necessario se l'area è diversa dall'area del servizio di ricerca. |
timeout |
(facoltativo) Se specificato, indica il timeout per il client HTTP che effettua la chiamata API. Il valore deve essere formattato come valore XSD "dayTimeDuration" (un subset limitato di un valore duration ISO 8601 ). Ad esempio, PT60S per 60 secondi. Se non impostato, viene scelto un valore predefinito di 30 secondi. Il timeout può essere impostato su un massimo di 230 secondi e un minimo di 1 secondo. |
Quali parametri di autenticazione usare
I parametri di autenticazione necessari dipendono dall'autenticazione eventualmente usata dall'endpoint online AML. Gli endpoint online AML offrono due opzioni di autenticazione:
- Autenticazione basata su chiave. Viene fornita una chiave statica per autenticare le richieste di assegnazione dei punteggi dal vettorizzatore.
- Usare i parametri URI e chiave
- Autenticazione basata su token. L'endpoint online AML viene distribuito usando l'autenticazione basata su token. L'identità gestita del servizio Azure AI Search deve essere abilitata. Il vettorizzatore usa quindi l'identità gestita del servizio per l'autenticazione nell'endpoint online AML, senza chiavi statiche necessarie. All'identità deve essere assegnato il ruolo di proprietario o collaboratore.
- Usare il parametro resourceId.
- Se il servizio di ricerca si trova in un'area diversa dall'area di lavoro AML, usare il parametro regione per impostare l'area in cui è stato distribuito l'endpoint online AML
Tipi di query vettoriali supportati
I tipi di query vettoriali supportati dal vettore di vettorizzazione del catalogo dei modelli di Azure AI Foundry dipendono dall'oggetto modelName
configurato.
Modello di incorporamento | Supporta la query text |
Supporta la query imageUrl |
Supporta la query imageBinary |
---|---|---|---|
Facebook-DinoV2-Image-Embeddings-ViT-Base | X | X | |
Facebook-DinoV2-Image-Embeddings-ViT-Giant | X | X | |
Cohere-embed-v3-english | X | ||
Cohere-embed-v3-multilingual | X |
Dimensioni previste del campo
Le dimensioni del campo previste per un campo vettoriale configurato con un vettore del catalogo dei modelli di Azure AI Foundry dipendono dall'oggetto modelName
configurato.
modelName |
Dimensioni previste |
---|---|
Facebook-DinoV2-Image-Embeddings-ViT-Base | 768 |
Facebook-DinoV2-Image-Embeddings-ViT-Giant | 1536 |
Cohere-embed-v3-english | 1024 |
Cohere-embed-v3-multilingual | 1024 |
Definizione di esempio
I nomi dei modelli suggeriti nel catalogo dei modelli di Azure AI Foundry sono costituiti dal modello di base e da un suffisso casuale a tre lettere. Il nome del modello sarà diverso da quello illustrato in questo esempio.
"vectorizers": [
{
"name": "my-model-catalog-vectorizer",
"kind": "aml",
"amlParameters": {
"uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
"key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
"timeout": "PT60S",
"modelName": "Cohere-embed-v3-multilingual-hin",
"resourceId": null,
"region": null,
},
}
]