Expliquer le résumé extractif
Un résumé extractif produit un résumé en extrayant des phrases essentielles directement à partir du texte d’origine. Au lieu de générer du nouveau texte, il utilise des techniques de traitement du langage naturel pour trouver les phrases qui ensemble transmettent l’esprit ou le contexte principal d’un document.
Un résumé extractif s’effectue à l’aide de la fonction summarize_extractive()
qui se trouve dans le schéma azure_cognitive
de l’extension azure_ai
. Le schéma azure_cognitive
contient trois surcharges de la fonction summarize_extractive()
. La liste des arguments attendus par les trois surcharges de fonction comprend les éléments suivants :
Argument | Type | Default | Description |
---|---|---|---|
texte | text ou text[] |
Le ou les textes pour lesquels les résumés doivent être générés. | |
language_text | text ou text[] |
Le code de langue (ou tableau de codes de langues) représentant la langue du texte à résumer. Passez en revue la liste des langues prises en charge pour récupérer les codes de langue nécessaires. | |
sentence_count | integer |
3 | Le nombre de phrases de résumé à générer. |
sort_by | text |
'offset' | L’ordre de tri des phrases de résumé générées. Les valeurs acceptables sont « offset » et « rank », où le décalage (« offset ») représente la position de départ de chaque phrase extraite dans le contenu d’origine et le classement (« rank ») est un indicateur généré par IA montrant la pertinence d’une phrase pour l’esprit du contenu. |
batch_size | integer |
25 | Uniquement pour les deux surcharges qui attendent une entrée de text[] . Spécifie le nombre d’enregistrements à traiter à la fois. |
disable_service_logs | boolean |
false | Indicateur précisant s’il faut désactiver les journaux de service. |
timeout_ms | integer |
NULL | Délai d’expiration en millisecondes après lequel l’opération est arrêtée. |
throw_on_error | boolean |
true | Indicateur précisant si, en cas d’erreur, la fonction doit lever une exception entraînant une restauration des transactions d’enveloppement. |
max_attempts | integer |
1 | Nombre de nouvelles tentatives d’appel à Azure AI Services en cas d’échec. |
retry_delay_ms | integer |
1 000 | Durée d’attente, en millisecondes, avant une nouvelle tentative d’appel du point de terminaison Azure AI Services. |
Chaque fonction retourne un tableau de phrases extraites et un score de classement pour chacun d’entre eux, à l’aide du type composite azure_cognitive.sentence
, comme indiqué dans le tableau suivant :
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
La azure_cognitive.sentence
est un type composite contenant le texte d’une phrase extractive et un score de classement pour chaque phrase. Le score de classement, qui est une valeur comprise entre 0 et 1 (inclus), indique la pertinence d’une phrase concernant l’esprit du document d’origine. Le résumé des documents classe les phrases extraites. Vous pouvez déterminer si elles sont retournées dans leur ordre d’apparition ou selon leur classement à l’aide du paramètre sort_by
de la fonction.
Générer des résumés extractifs pour des descriptions immobilières
En tant que développeur pour Margie’s Travel, vous souhaitez évaluer la technique de résumé extractif accessible via l’extension azure_ai
et Azure AI Services. Vous souhaitez aussi évaluer la capacité de la méthode à générer des résumés concis en langage naturel de descriptions immobilières plus longues, telles que la description suivante de la première annonce dans la base de données :
« Détendez-vous dans ce charmant appartement d’une chambre, idéalement situé sur le côté ouest de Queen Anne Hill. Cet appartement élégant et privé (unité du bas dans un duplex) dispose d’un plan d’étage ouvert, de planchers en bambou, d’une cuisine entièrement équipée, d’un téléviseur, d’un lecteur DVD, d’un bouquet de télé de base et d’une chambre douillette avec un lit taille queen. L’appartement peut accueillir jusqu’à quatre personnes (deux dans la chambre et deux sur le canapé-lit confortable, draps inclus). La lessive ainsi que le Wi-Fi sont gratuits. L’appartement s’ouvre sur une terrasse privative, assortie de son propre barbecue, avec vue sur un jardin et une forêt de bambou noir. L’appartement est parfaitement situé à un bloc seulement des lignes de bus, d’où vous pouvez accéder au centre-ville de Seattle en 15 minutes ou au quartier Ballard historique en 10 minutes. Une petite ballade de cinq minutes vous permet d’accéder à une supérette naturelle et aux cafés. Sinon, promenez-vous une quinzaine de minutes vers le sommet de Queen Anne Hill où vous trouverez différents magasins, bars et restaurants éclectiques. »
Demandez un résumé en deux phrases de la description immobilière ci-dessus avec la requête suivante :
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
Le résumé extractif retourne les deux phrases les mieux notées du texte d’origine, ainsi qu’un score de classement pour chacune d’entre elles :
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}