Compartilhar via


Vetorizador do catálogo de modelos do Azure AI Foundry

Importante

Este vetorizador está em visualização pública nos Termos de Uso Complementares. A API REST 2024-05-01-Preview dá suporte a esse recurso.

O vetorizador de catálogo de modelos do Azure AI Foundry se conecta a um modelo de inserção que foi implantado por meio do catálogo de modelos do Azure AI Foundry em um ponto de extremidade do Azure Machine Learning. Seus dados são processados na área geográfica em que o modelo é implantado.

Se você usou a vetorização integrada para criar as matrizes de vetor, o conjunto de habilidades deverá incluir uma habilidade AML apontando para o catálogo de modelos no portal do Azure AI Foundry.

Parâmetros do vetorizador

Os parâmetros diferenciam maiúsculas de minúsculas. Os parâmetros que você escolhe usar dependem do tipo de autenticação que seu ponto de extremidade online AML exige, se houver.

Nome do Parâmetro Descrição
uri (Obrigatório) O URI do ponto de extremidade online AML para o qual o conteúdo do JSON é enviado. Somente o esquema do URI https é permitido.
modelName (Obrigatório) A ID do modelo do catálogo de modelos do Azure AI Foundry implantado no ponto de extremidade fornecido. Os modelos suportados são:
  • Facebook-DinoV2-Image-Embeddings-ViT-Base
  • Facebook-DinoV2-Image-Embeddings-ViT-Giant
  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
key (Necessário para autenticação de chave) A chave para o ponto de extremidade online do AML.
resourceId (Necessário para autenticação de token). A ID de recurso Azure Resource Manager do ponto de extremidade online do AML. Ele deve estar no formato assinaturas/{GUID}/resourceGroups/{nome-do-grupo-de-recursos}/Microsoft. MachineLearningServices/Workspaces/{Workspace-Name}/onlineendpoints/{endpoint_name}.
region (Opcional para autenticação de token). A região o ponto de extremidade online do AML é implantado. É necessário se a região for diferente da região do serviço de pesquisa.
timeout (Opcional) Quando especificado, indica o tempo limite para o cliente http que fez a chamada à API. Ele deve ser formatado como um valor XSD de "dayTimeDuration" (um subconjunto restrito de um valor de duração ISO 8601 ). Por exemplo, PT60S por 60 segundos. Se não for definido, um valor padrão de 30 segundos será escolhido. O tempo limite pode ser definido para um máximo de 230 segundos e um mínimo de 1 segundo.

Quais parâmetros de autenticação usar

Os parâmetros de autenticação necessários dependem da autenticação que seu ponto de extremidade online AML usa, se houver. Os pontos de extremidade online do AML fornecem duas opções de autenticação:

  • Autenticação baseada em chave. Uma chave estática é fornecida para autenticar as solicitações de pontuação do vetorizador.
    • Usar os parâmetros de URI e chave
  • Autenticação baseada em token. O ponto de extremidade online do AML é implantado usando a autenticação baseada em token. A identidade gerenciada do serviço de IA do Azure Search deve estar habilitado. Em seguida, o vetorizador usa a identidade gerenciada do serviço para se autenticar no ponto de extremidade online do AML, sem a necessidade de chaves estáticas. A identidade deve ser atribuída ao proprietário ou à função de colaborador.
    • Use o parâmetro resourceId .
    • Caso o serviço de pesquisa esteja em uma região diferente do espaço de trabalho do AML, use o parâmetro região para definir a região em que o ponto de extremidade online do AML foi implantado

Tipos de consultas vetoriais com suporte

Quais tipos de consulta de vetor são compatíveis com o vetorizador de catálogo de modelos do Azure AI Foundry depende do modelName que está configurado.

Modelo de inserção Dá suporte à consulta text Dá suporte à consulta imageUrl Dá suporte à consulta imageBinary
Facebook-DinoV2-Image-Embeddings-ViT-Base X X
Facebook-DinoV2-Image-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

Dimensões de campo esperadas

As dimensões de campo esperadas para um campo configurado com um vetorizador de catálogo de modelos do Azure AI Foundry dependem do modelName que está configurado.

modelName Dimensões esperadas
Facebook-DinoV2-Image-Embeddings-ViT-Base 768
Facebook-DinoV2-Image-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

Definição de exemplo

Os nomes de modelo sugeridos no catálogo de modelos do Azure AI Foundry consistem no modelo base mais um sufixo aleatório de três letras. O nome do seu modelo será diferente do mostrado neste exemplo.

"vectorizers": [
    {
        "name": "my-model-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
            "key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
            "timeout": "PT60S",
            "modelName": "Cohere-embed-v3-multilingual-hin",
            "resourceId": null,
            "region": null,
        },
    }
]

Confira também