Função ai_similarity
Aplica-se a: Databricks SQL Databricks Runtime
Importante
Esta funcionalidade está em Pré-visualização Pública.
Na pré-visualização:
- O modelo de linguagem subjacente pode lidar com vários idiomas, no entanto, essas funções são ajustadas para o inglês.
- Há limite de taxa para as APIs subjacentes do Modelo de Base. Consulte Limites das APIs do Modelo de Base para update esses limites.
- Devido ao limite de taxa, esta função foi projetada para testes em pequenos conjuntos de dados com menos de 100 linhas. Para os casos de uso com mais de 100 linhas de dados, o Databricks recomenda o uso de
ai_query
e de um ponto de extremidade de taxa de transferência provisionado. Consulte o exemplo sobre como executar inferência de LLM em lote usando o ai_query.
A ai_similarity()
função invoca um modelo de IA generativa de última geração das APIs do Databricks Foundation Model para comparar duas cadeias de caracteres e calcula a pontuação de semelhança semântica usando SQL.
Requisitos
Importante
Os modelos subjacentes que podem ser usados neste momento são licenciados sob a Licença Apache 2.0, Copyright © The Apache Software Foundation ou LLAMA 3.1 Community License Copyright Meta © Platforms, Inc. Todos os direitos reservados. Os clientes são responsáveis por garantir a conformidade com as licenças de modelo aplicáveis.
A Databricks recomenda a revisão dessas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os benchmarks internos da Databricks, a Databricks poderá alterar o modelo (e a list das licenças aplicáveis fornecidas nesta página).
Atualmente, GTE Large (Inglês) é o modelo subjacente que alimenta esta função de IA.
- Esta função só está disponível em espaços de trabalho em AI Functions usando regiões suportadas por APIs do Foundation Model.
- Esta função não está disponível no Azure Databricks SQL Classic.
- Verifique a página de preços do Databricks SQL.
Nota
No Databricks Runtime 15.1 e superior, essa função é suportada em blocos de anotações Databricks, incluindo blocos de anotações que são executados como uma tarefa em um fluxo de trabalho Databricks.
Sintaxe
ai_similarity(expr1, expr2)
Argumentos
-
expr1
: UmaSTRING
expressão. -
expr2
: UmaSTRING
expressão.
Devoluções
Um FLOAT
valor, que representa a semelhança semântica entre as duas cadeias de entrada. A pontuação de saída é relativa e só deve ser usada para classificação. Pontuação de 1 significa que os dois textos são iguais.
Exemplos
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 10;
Databricks Inc.