Kunskaper i dokumentlayout

Artikel
11/23/2024

Kommentar

Den här funktionen är för närvarande i allmänt tillgänglig förhandsversion. Den här förhandsversionen tillhandahålls utan ett serviceavtal och rekommenderas inte för produktionsarbetsbelastningar. Vissa funktioner kanske inte stöds eller kan vara begränsade. Mer information finns i Kompletterande villkor för användning av Microsoft Azure-förhandsversioner.

Färdigheten Dokumentlayout analyserar ett dokument för att extrahera intressanta regioner och deras relationer för att skapa en syntaktisk representation av dokumentet i Markdown-format. Den här färdigheten använder den dokumentinformationslayoutmodell som tillhandahålls i Azure AI Document Intelligence.

Den här artikeln är referensdokumentationen för kunskaper i dokumentlayout. Information om användning finns i Strukturmedveten segmentering och vektorisering.

Kunskaper om dokumentlayout anropar den offentliga förhandsversionen av Document Intelligence version 2024-07-31-preview. Den är för närvarande endast tillgänglig i följande Azure-regioner:

USA, östra
USA, västra 2
Västeuropa
Norra centrala USA

Filformat som stöds är:

.PDF
.JPEG
.JPG
.PNG
.BMP
. TIFF
.DOCX
. XLSX
.PPTX
.HTML

Kommentar

Den här kompetensen är bunden till Azure AI-tjänster och kräver en fakturerbar resurs för transaktioner som överstiger 20 dokument per indexerare och dag. Körning av inbyggda kunskaper debiteras enligt det befintliga priset för Betala per användning för Azure AI-tjänster.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Databegränsningar

För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
Även om filstorleken för att analysera dokument är 500 MB för azure AI Document Intelligence-nivån (S0) och 4 MB för den kostnadsfria nivån för Azure AI Document Intelligence (F0) omfattas indexering av indexeringsgränserna för din söktjänstnivå.
Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter eller 10 000 bildpunkter x 10 000 bildpunkter.
Om dina PDF-filer är lösenordslåsta tar du bort låset innan du kör indexeraren.

Språk som stöds

Mer information om tryckt text finns i Layoutmodellen för Azure AI Document Intelligence som stöds.

Begränsningar

Under den offentliga förhandsversionen har den här färdigheten följande begränsningar:

Kunskapen kan inte extrahera bilder som är inbäddade i dokument.
Sidnummer ingår inte i de genererade utdata.
Färdigheten är inte lämplig för stora dokument som kräver mer än 5 minuters bearbetning i AI Document Intelligence-layoutmodellen. Kunskapen överskrider tidsgränsen, men avgifterna gäller fortfarande för AI Services-resursen för flera tjänster om den är kopplad till kompetensuppsättningen i faktureringssyfte. Se till att dokumenten är optimerade för att hålla sig inom bearbetningsgränserna för att undvika onödiga kostnader.

Kompetensparametrar

Parametrar är skiftlägeskänsliga.

Parameternamn	Tillåtna värden	beskrivning
`outputMode`	`oneToMany`	Styr kardinaliteten för utdata som genereras av färdigheten.
`markdownHeaderDepth`	`h1`, `h2`, `h3`, `h4`, , , `h5h6(default)`	Den här parametern beskriver den djupaste kapslingsnivån som bör beaktas. Om markdownHeaderDepth till exempel anges som "h3" betraktas ett markdown-avsnitt som är djupare än h3 (det vill säga #### och djupare) som "innehåll" som måste läggas till på den nivå som dess överordnade är på.

Kunskapsindata

Indatanamn	beskrivning
`file_data`	Filen som innehållet ska extraheras från.

Indata för "file_data" måste vara ett objekt som definieras som:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Alternativt kan den definieras som:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

Filreferensobjektet kan genereras på något av följande sätt:

Ange parametern för allowSkillsetToReadFileData indexerarens definition till true. Den här inställningen skapar en sökväg /document/file_data som är ett objekt som representerar de ursprungliga fildata som laddats ned från blobdatakällan. Den här parametern gäller endast för filer i Azure Blob Storage.
En anpassad färdighet returnerar ett JSON-objekt som har definierats som tillhandahåller $type, dataeller url och sastoken. Parametern $type måste vara inställd på file, och data måste vara den grundläggande 64-kodade bytematrisen för filinnehållet. Parametern url måste vara en giltig URL med åtkomst för att ladda ned filen på den platsen.

Kunskapsutdata

Utdatanamn	beskrivning
`markdown_document`	En samling "avsnittsobjekt" som representerar varje enskilt avsnitt i Markdown-dokumentet.

Exempeldefinition

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Exempelutdata

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

Värdet för markdownHeaderDepth styr antalet nycklar i ordlistan "avsnitt". Eftersom är "h3" finns det tre nycklar i ordlistan "sections" i exempelkompetensdefinitionen markdownHeaderDepth : h1, h2, h3.

Dela via