Expliquer le résumé extractif

Effectué

Un résumé extractif produit un résumé en extrayant des phrases essentielles directement à partir du texte d’origine. Au lieu de générer du nouveau texte, il utilise des techniques de traitement du langage naturel pour trouver les phrases qui ensemble transmettent l’esprit ou le contexte principal d’un document.

Un résumé extractif s’effectue à l’aide de la fonction summarize_extractive() qui se trouve dans le schéma azure_cognitive de l’extension azure_ai. Le schéma azure_cognitive contient trois surcharges de la fonction summarize_extractive(). La liste des arguments attendus par les trois surcharges de fonction comprend les éléments suivants :

Argument Type Default Description
texte text ou text[] Le ou les textes pour lesquels les résumés doivent être générés.
language_text text ou text[] Le code de langue (ou tableau de codes de langues) représentant la langue du texte à résumer. Passez en revue la liste des langues prises en charge pour récupérer les codes de langue nécessaires.
sentence_count integer 3 Le nombre de phrases de résumé à générer.
sort_by text 'offset' L’ordre de tri des phrases de résumé générées. Les valeurs acceptables sont « offset » et « rank », où le décalage (« offset ») représente la position de départ de chaque phrase extraite dans le contenu d’origine et le classement (« rank ») est un indicateur généré par IA montrant la pertinence d’une phrase pour l’esprit du contenu.
batch_size integer 25 Uniquement pour les deux surcharges qui attendent une entrée de text[]. Spécifie le nombre d’enregistrements à traiter à la fois.
disable_service_logs boolean false Indicateur précisant s’il faut désactiver les journaux de service.
timeout_ms integer NULL Délai d’expiration en millisecondes après lequel l’opération est arrêtée.
throw_on_error boolean true Indicateur précisant si, en cas d’erreur, la fonction doit lever une exception entraînant une restauration des transactions d’enveloppement.
max_attempts integer 1 Nombre de nouvelles tentatives d’appel à Azure AI Services en cas d’échec.
retry_delay_ms integer 1 000 Durée d’attente, en millisecondes, avant une nouvelle tentative d’appel du point de terminaison Azure AI Services.

Chaque fonction retourne un tableau de phrases extraites et un score de classement pour chacun d’entre eux, à l’aide du type composite azure_cognitive.sentence, comme indiqué dans le tableau suivant :

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

La azure_cognitive.sentence est un type composite contenant le texte d’une phrase extractive et un score de classement pour chaque phrase. Le score de classement, qui est une valeur comprise entre 0 et 1 (inclus), indique la pertinence d’une phrase concernant l’esprit du document d’origine. Le résumé des documents classe les phrases extraites. Vous pouvez déterminer si elles sont retournées dans leur ordre d’apparition ou selon leur classement à l’aide du paramètre sort_by de la fonction.

Générer des résumés extractifs pour des descriptions immobilières

En tant que développeur pour Margie’s Travel, vous souhaitez évaluer la technique de résumé extractif accessible via l’extension azure_ai et Azure AI Services. Vous souhaitez aussi évaluer la capacité de la méthode à générer des résumés concis en langage naturel de descriptions immobilières plus longues, telles que la description suivante de la première annonce dans la base de données :

« Détendez-vous dans ce charmant appartement d’une chambre, idéalement situé sur le côté ouest de Queen Anne Hill. Cet appartement élégant et privé (unité du bas dans un duplex) dispose d’un plan d’étage ouvert, de planchers en bambou, d’une cuisine entièrement équipée, d’un téléviseur, d’un lecteur DVD, d’un bouquet de télé de base et d’une chambre douillette avec un lit taille queen. L’appartement peut accueillir jusqu’à quatre personnes (deux dans la chambre et deux sur le canapé-lit confortable, draps inclus). La lessive ainsi que le Wi-Fi sont gratuits. L’appartement s’ouvre sur une terrasse privative, assortie de son propre barbecue, avec vue sur un jardin et une forêt de bambou noir. L’appartement est parfaitement situé à un bloc seulement des lignes de bus, d’où vous pouvez accéder au centre-ville de Seattle en 15 minutes ou au quartier Ballard historique en 10 minutes. Une petite ballade de cinq minutes vous permet d’accéder à une supérette naturelle et aux cafés. Sinon, promenez-vous une quinzaine de minutes vers le sommet de Queen Anne Hill où vous trouverez différents magasins, bars et restaurants éclectiques. »

Demandez un résumé en deux phrases de la description immobilière ci-dessus avec la requête suivante :

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

Le résumé extractif retourne les deux phrases les mieux notées du texte d’origine, ainsi qu’un score de classement pour chacune d’entre elles :

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}