Fonction ai_extract
S’applique à : Databricks SQL Databricks Runtime
Important
Cette fonctionnalité est disponible en préversion publique.
Dans la préversion :
- Le modèle de langage sous-jacent peut gérer plusieurs langues. Toutefois, ces fonctions sont optimisées pour l’anglais.
- Il existe une limitation de débit pour les API Foundation Model sous-jacentes. Pour mettre à jour ces limites, consultez Limites des API Foundation Model.
La fonction ai_extract()
vous permet d’appeler un modèle d’IA générative de pointe pour extraire des entités spécifiées par des étiquettes dans un texte donné en utilisant SQL. Cette fonction utilise un modèle de conversation servant un point de terminaison rendu disponible par des API Databricks Foundation Model.
Spécifications
Important
Les modèles sous-jacents qui peuvent être utilisés à ce stade sont sous licence sous licence Apache 2.0, Copyright © The Apache Software Foundation ou LLAMA 3.1 Community License © Meta Platforms, Inc. Tous les droits réservés. Les clients sont tenus de d’assurer de leur conformité vis-à-vis des licences de modèle applicables.
Databricks recommande de passer en revue ces licences pour vérifier leur conformité avec les conditions applicables. Si les modèles émergent à l’avenir qui fonctionnent mieux en fonction des benchmarks internes de Databricks, Databricks peut modifier le modèle (et la liste des licences applicables fournies sur cette page).
Actuellement, Meta-Llama-3.1-70B-Instruct est le modèle sous-jacent qui alimente ces fonctions IA.
- Cette fonction est disponible uniquement pour les espaces de travail des régions prises en charge AI Functions avec les API Foundation Model.
- Cette fonction n’est pas disponible sur Azure Databricks SQL classique.
- Consultez la page de tarification de Databricks SQL.
Remarque
Dans Databricks Runtime 15.1 et versions ultérieures, cette fonction est prise en charge dans les notebooks Databricks, notamment ceux exécutés en tant que tâche dans un workflow Databricks.
Syntaxe
ai_extract(content, labels)
Arguments
content
: expressionSTRING
.labels
: UnARRAY<STRING>
littéral. Chaque élément est un type d’entité à extraire.
Retours
UnSTRUCT
où chaque champ correspond à un type d’entité spécifié dans labels
. Chaque champ contient une chaîne représentant l’entité extraite. Si plusieurs candidats pour un type d’entité sont trouvés, un seul est retourné.
Si content
est NULL
, le résultat est NULL
.
Exemples
> SELECT ai_extract(
'John Doe lives in New York and works for Acme Corp.',
array('person', 'location', 'organization')
);
{"person": "John Doe", "location": "New York", "organization": "Acme Corp."}
> SELECT ai_extract(
'Send an email to jane.doe@example.com about the meeting at 10am.',
array('email', 'time')
);
{"email": "jane.doe@example.com", "time": "10am"}