Dela via


Så här använder du textsammanfattning

Textsammanfattning är utformat för att förkorta innehåll som användarna anser vara för långt för att läsa. Både extraherande och abstrakt sammanfattning komprimerar artiklar, papper eller dokument till viktiga meningar.

Extraheringssammanfattning: Skapar en sammanfattning genom att extrahera meningar som tillsammans representerar den viktigaste eller mest relevanta informationen i det ursprungliga innehållet.

Abstrakt sammanfattning: Skapar en sammanfattning genom att generera sammanfattade meningar från dokumentet som avbildar huvudidén.

Frågefokuserad sammanfattning: Gör att du kan använda en fråga när du sammanfattar.

Var och en av dessa funktioner kan sammanfattas kring specifika intressanta objekt när de anges.

DE AI-modeller som används av API:et tillhandahålls av tjänsten, du behöver bara skicka innehåll för analys.

För enklare navigering finns här länkar till motsvarande avsnitt för varje tjänst:

Aspekt Avsnitt
Extrahering Extraheringssammanfattning
Abstrakt Abstrakt sammanfattning
Frågefokuserad Frågefokuserad sammanfattning

Funktioner

Dricks

Om du vill börja använda de här funktionerna kan du följa snabbstartsartikeln för att komma igång. Du kan också göra exempelbegäranden med Hjälp av Language Studio utan att behöva skriva kod.

API:et för extraherande sammanfattning använder bearbetningstekniker för naturligt språk för att hitta viktiga meningar i ett ostrukturerat textdokument. Dessa meningar förmedlar tillsammans huvudtanken med dokumentet.

Extraheringssammanfattning returnerar en rangpoäng som en del av systemsvaret tillsammans med extraherade meningar och deras position i de ursprungliga dokumenten. En rangpoäng är en indikator på hur relevant en mening bestäms vara, till huvudidén i ett dokument. Modellen ger en poäng mellan 0 och 1 (inklusive) för varje mening och returnerar de högst poängsatta meningarna per begäran. Om du till exempel begär en sammanfattning med tre meningar returnerar tjänsten de tre högst poängsatta meningarna.

Det finns en annan funktion i Azure AI Language, extrahering av nyckelfraser, som kan extrahera viktig information. När du bestämmer dig för mellan extrahering av nyckelfraser och extraheringssammanfattning bör du tänka på följande:

  • Extrahering av nyckelfraser returnerar fraser medan extraheringssammanfattning returnerar meningar.
  • Extraheringssammanfattning returnerar meningar tillsammans med en rankningspoäng och de högst rankade meningarna returneras per begäran.
  • Extraheringssammanfattning returnerar också följande positionsinformation:
    • Förskjutning: Startpositionen för varje extraherad mening.
    • Längd: Längden på varje extraherad mening.

Bestämma hur data ska bearbetas (valfritt)

Skicka data

Du skickar dokument till API:et som textsträngar. Analysen utförs när begäran har tagits emot. Eftersom API:et är asynkront kan det uppstå en fördröjning mellan att skicka en API-begäran och att ta emot resultatet.

När du använder den här funktionen är API-resultaten tillgängliga i 24 timmar från den tidpunkt då begäran matades in och anges i svaret. Efter den här tidsperioden rensas resultaten och är inte längre tillgängliga för hämtning.

Hämta textsammanfattningsresultat

När du får resultat från språkidentifiering kan du strömma resultatet till ett program eller spara utdata till en fil i det lokala systemet.

Följande är ett exempel på innehåll som du kan skicka för sammanfattning, som extraheras med hjälp av Microsoft-bloggartikeln En holistisk representation mot integrativ AI. Den här artikeln är bara ett exempel. API:et kan acceptera längre indatatext. Mer information finns i avsnittet databegränsningar.

"På Microsoft har vi varit på jakt efter att utveckla AI utöver befintliga tekniker genom att ta ett mer holistiskt, mänskligt centrerad tillvägagångssätt för lärande och förståelse. Som Chief Technology Officer för Azure AI-tjänster har jag arbetat med ett team med fantastiska forskare och ingenjörer för att förverkliga detta uppdrag. I min roll har jag ett unikt perspektiv när jag visar relationen mellan tre attribut för mänsklig kognition: enspråkig text (X), ljud- eller visuella sensoriska signaler, (Y) och flerspråkig (Z). I skärningspunkten mellan alla tre finns det magi – det vi kallar XYZ-kod som illustreras i bild 1 – en gemensam representation för att skapa kraftfullare AI som kan tala, höra, se och förstå människor bättre. Vi tror att XYZ-kod gör det möjligt för oss att uppfylla vår långsiktiga vision: överföringsinlärning mellan domäner, som omfattar modaliteter och språk. Målet är att ha förtränat modeller som gemensamt kan lära sig representationer för att stödja ett brett spektrum av underordnade AI-uppgifter, mycket på det sätt som människor gör idag. Under de senaste fem åren har vi uppnått mänsklig prestanda på riktmärken inom konversationstaligenkänning, maskinöversättning, samtalsfrågasvar, maskinläsningsförståelse och bildtexter. Dessa fem genombrott gav oss starka signaler mot vår mer ambitiösa strävan att skapa ett språng i AI-funktioner och uppnå multisensorisk och flerspråkig inlärning som ligger närmare i linje med hur människor lär sig och förstår. Jag tror att den gemensamma XYZ-koden är en grundläggande komponent i denna strävan, om den baseras på externa kunskapskällor i underordnad AI-uppgifter."

API-begäran för textsammanfattning bearbetas när begäran tas emot genom att ett jobb skapas för API-serverdelen. Om jobbet lyckades returneras utdata från API:et. Utdata är tillgängliga för hämtning i 24 timmar. Efter den här tiden rensas utdata. På grund av stöd för flerspråkiga och emojis kan svaret innehålla textförskjutningar. Mer information finns i bearbeta förskjutningar .

När du använder exemplet ovan kan API:et returnera följande sammanfattade meningar:

Extraheringssammanfattning:

  • "På Microsoft har vi varit på jakt efter att utveckla AI utöver befintliga tekniker genom att använda en mer holistisk, mänskligt centrerad strategi för lärande och förståelse."
  • "Vi tror att XYZ-kod gör det möjligt för oss att uppfylla vår långsiktiga vision: överföringsinlärning mellan domäner, som omfattar modaliteter och språk."
  • "Målet är att ha förtränat modeller som gemensamt kan lära sig representationer för att stödja ett brett spektrum av underordnade AI-uppgifter, mycket på det sätt som människor gör idag."

Abstrakt sammanfattning:

  • "Microsoft har ett mer holistiskt, mänskligt centrerad sätt att lära sig och förstå. Vi tror att XYZ-kod gör det möjligt för oss att uppfylla vår långsiktiga vision: överföringsinlärning mellan domäner, som omfattar modaliteter och språk. Under de senaste fem åren har vi uppnått mänskliga resultat på riktmärken i."

Prova sammanfattning av textextrahering

Du kan använda textextraheringssammanfattning för att få sammanfattningar av artiklar, artiklar eller dokument. Ett exempel finns i snabbstartsartikeln.

Du kan använda parametern sentenceCount för att vägleda hur många meningar som returneras, med 3 standardvärdet. Intervallet är från 1 till 20.

Du kan också använda parametern sortby för att ange i vilken ordning de extraherade meningarna returneras – antingen Offset eller Rank, med Offset standardvärdet.

parametervärde beskrivning
Rangordning Beställ meningar enligt deras relevans för indatadokumentet, enligt vad tjänsten har bestämt.
Förskjutning Behåller den ursprungliga ordningen där meningarna visas i indatadokumentet.

Prova abstrakt sammanfattning av text

I följande exempel kommer du igång med abstrakt sammanfattning av text:

  1. Kopiera kommandot nedan till en textredigerare. Bash-exemplet använder radfortsättningstecknet \ . Om konsolen eller terminalen använder ett annat radfortsättningstecken använder du det tecknet i stället.
curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2023-04-01 \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
' 
{
  "displayName": "Text Abstractive Summarization Task Example",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code enables us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
      }
    ]
  },
  "tasks": [
    {
      "kind": "AbstractiveSummarization",
      "taskName": "Text Abstractive Summarization Task 1",
    }
  ]
}
'
  1. Gör följande ändringar i kommandot där det behövs:

    • Ersätt värdet your-language-resource-key med din nyckel.
    • Ersätt den första delen av begärande-URL:en your-language-resource-endpoint med din slutpunkts-URL.
  2. Öppna ett kommandotolksfönster (till exempel: BASH).

  3. Klistra in kommandot från textredigeraren i kommandotolken och kör sedan kommandot .

  4. operation-location Hämta från svarshuvudet. Värdet ser ut ungefär som följande URL:

https://<your-language-resource-endpoint>/language/analyze-text/jobs/12345678-1234-1234-1234-12345678?api-version=2022-10-01-preview
  1. Använd följande cURL-kommando för att hämta resultatet av begäran. Ersätt <my-job-id> med det numeriska ID-värdet som du fick från föregående operation-location svarsrubrik:
curl -X GET https://<your-language-resource-endpoint>/language/analyze-text/jobs/<my-job-id>?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>"

JSON-svar för abstrakt textsammanfattning

{
    "jobId": "cd6418fe-db86-4350-aec1-f0d7c91442a6",
    "lastUpdateDateTime": "2022-09-08T16:45:14Z",
    "createdDateTime": "2022-09-08T16:44:53Z",
    "expirationDateTime": "2022-09-09T16:44:53Z",
    "status": "succeeded",
    "errors": [],
    "displayName": "Text Abstractive Summarization Task Example",
    "tasks": {
        "completed": 1,
        "failed": 0,
        "inProgress": 0,
        "total": 1,
        "items": [
            {
                "kind": "AbstractiveSummarizationLROResults",
                "taskName": "Text Abstractive Summarization Task 1",
                "lastUpdateDateTime": "2022-09-08T16:45:14.0717206Z",
                "status": "succeeded",
                "results": {
                    "documents": [
                        {
                            "summaries": [
                                {
                                    "text": "Microsoft is taking a more holistic, human-centric approach to AI. We've developed a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We've achieved human performance on benchmarks in conversational speech recognition, machine translation, ...... and image captions.",
                                    "contexts": [
                                        {
                                            "offset": 0,
                                            "length": 247
                                        }
                                    ]
                                }
                            ],
                            "id": "1"
                        }
                    ],
                    "errors": [],
                    "modelVersion": "latest"
                }
            }
        ]
    }
}
parameter Description
-X POST <endpoint> Anger slutpunkten för åtkomst till API:et.
-H Content-Type: application/json Innehållstypen för att skicka JSON-data.
-H "Ocp-Apim-Subscription-Key:<key> Anger nyckeln för åtkomst till API:et.
-d <documents> JSON som innehåller de dokument som du vill skicka.

Följande cURL-kommandon körs från ett BASH-gränssnitt. Redigera dessa kommandon med ditt eget resursnamn, resursnyckel och JSON-värden.

Frågebaserad sammanfattning

Api:et för frågebaserad textsammanfattning är ett tillägg till det befintliga API:et för textsammanfattning.

Den största skillnaden är ett nytt query fält i begärandetexten (underquerytasksparameters>> ).

Dricks

Frågebaserad sammanfattning har viss differentiering i användningen av längdkontroll baserat på vilken typ av frågebaserad sammanfattning du använder:

  • Frågebaserad sammanfattning av extrahering stöder längdkontroll genom att ange sentenceCount.
  • Frågebaserad abstrakt sammanfattning stöder inte längdkontroll.

Nedan visas en exempelbegäran:

curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2023-11-15-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
' 
{
  "displayName": "Text Extractive Summarization Task Example",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code enables us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
      }
    ]
  },
"tasks": [
    {
      "kind": "AbstractiveSummarization",
      "taskName": "Query-based Abstractive Summarization",
      "parameters": {
          "query": "XYZ-code",
          "summaryLength": "short"
      }
    },    {
      "kind": "ExtractiveSummarization",
      "taskName": "Query_based Extractive Summarization",
      "parameters": {
          "query": "XYZ-code"
      }
    }
  ]
}
'

Kontroll av sammanfattningslängd

Använda parametern summaryLength i abstrakt sammanfattning

Om du inte anger summaryLengthanger modellen sammanfattningslängden.

För parametern summaryLength accepteras tre värden:

  • oneSentence: Genererar en sammanfattning av mestadels 1 mening, med cirka 80 tokens.
  • kort: Genererar en sammanfattning av mestadels 2-3 meningar, med cirka 120 tokens.
  • medium: Genererar en sammanfattning av mestadels 4–6 meningar med cirka 170 tokens.
  • long: Genererar en sammanfattning av mestadels över 7 meningar, med cirka 210 tokens.

Nedan visas en exempelbegäran:

curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2023-04-01 \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
' 
{
  "displayName": "Text Abstractive Summarization Task Example",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code enables us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
      }
    ]
  },
  "tasks": [
    {
      "kind": "AbstractiveSummarization",
      "taskName": "Length controlled Abstractive Summarization",
          "parameters": {
          "sentenceLength": "short"
      }
    }
  ]
}
'

Använda parametern sentenceCount i extraheringssammanfattning

För parametern sentenceCount kan du ange värdet 1–20 för att ange önskat antal utdatameningar.

Nedan visas en exempelbegäran:

curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2023-11-15-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
' 
{
  "displayName": "Text Extractive Summarization Task Example",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code enables us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
      }
    ]
  },
"tasks": [
    {
      "kind": "ExtractiveSummarization",
      "taskName": "Length controlled Extractive Summarization",
      "parameters": {
          "sentenceCount": "5"
      }
    }
  ]
}
'

Tjänst- och datagränser

Information om storleken och antalet begäranden som du kan skicka per minut och sekund finns i artikeln om tjänstbegränsningar .

Se även