Saiba como gerar inserções com o OpenAI do Azure
Uma inserção é um formato especial de representação de dados que pode ser facilmente utilizado por algoritmos e modelos de machine learning. A inserção é uma representação densa de informações do significado semântico de um texto. Cada inserção é um vetor de números de ponto flutuante, de modo que a distância entre duas inserções no espaço do vetor esteja correlacionada com a similaridade semântica entre duas entradas no formato original. Por exemplo, se dois textos forem semelhantes, suas representações de vetor também deverão ser semelhantes. As inserções potencializam a pesquisa de similaridade de vetor em Bancos de Dados do Azure, como Azure Cosmos DB for MongoDB vCore, Banco de Dados SQL do Azure ou Banco de Dados do Azure para PostgreSQL – Servidor Flexível.
Como obter inserções
Para obter um vetor de inserção para um trecho de texto, fazemos uma solicitação ao ponto de extremidade de inserções, conforme mostrado nos seguintes snippets de código:
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
Práticas recomendadas
Verificar se as entradas não excedem o comprimento máximo
- O comprimento máximo do texto de entrada para nossos modelos de inserção mais recentes é de 8.192 tokens. Você deve verificar se as entradas não excedem esse limite antes de fazer uma solicitação.
- Se enviar uma matriz de entradas em uma única solicitação de inserção, o tamanho máximo da matriz será 2048.
- Ao enviar uma matriz de entradas em uma única solicitação, lembre-se de que o número de tokens por minuto em suas solicitações deve permanecer abaixo do limite de cota atribuído na implantação do modelo. Por padrão, os modelos de inserção da última geração 3 estão sujeitos a um limite de 350 K de TPM por região.
Limitações e riscos
Nossos modelos de inserção podem não ser confiáveis ou representar riscos sociais em determinados casos e podem causar danos na ausência de mitigações. Examine nosso conteúdo de IA Responsável para obter mais informações sobre como abordar o uso com responsabilidade.
Próximas etapas
- Saiba mais sobre como usar o OpenAI do Azure e inserções para executar a pesquisa de documentos com nosso tutorial sobre inserções.
- Saiba mais sobre os modelos subjacentes que alimentam o OpenAI do Azure.
- Armazene suas inserções e execute a pesquisa de vetor (similaridade) usando sua escolha de serviço:
- IA do Azure Search
- Azure Cosmos DB para MongoDB vCore
- Banco de Dados SQL do Azure
- Azure Cosmos DB para NoSQL
- Azure Cosmos DB para PostgreSQL
- Banco de Dados do Azure para PostgreSQL — Servidor Flexível
- Cache Redis do Azure
- Use um Eventhouse como um banco de dados vetorial - Inteligência em Tempo Real no Microsoft Fabric