Kunskaper i dokumentlayout
Kommentar
Den här funktionen är för närvarande i allmänt tillgänglig förhandsversion. Den här förhandsversionen tillhandahålls utan ett serviceavtal och rekommenderas inte för produktionsarbetsbelastningar. Vissa funktioner kanske inte stöds eller kan vara begränsade. Mer information finns i Kompletterande villkor för användning av Microsoft Azure-förhandsversioner.
Färdigheten Dokumentlayout analyserar ett dokument för att extrahera intressanta regioner och deras relationer för att skapa en syntaktisk representation av dokumentet i Markdown-format. Den här färdigheten använder den dokumentinformationslayoutmodell som tillhandahålls i Azure AI Document Intelligence.
Den här artikeln är referensdokumentationen för kunskaper i dokumentlayout. Information om användning finns i Strukturmedveten segmentering och vektorisering.
Kunskaper om dokumentlayout anropar den offentliga förhandsversionen av Document Intelligence version 2024-07-31-preview. Den är för närvarande endast tillgänglig i följande Azure-regioner:
- USA, östra
- USA, västra 2
- Västeuropa
- Norra centrala USA
Filformat som stöds är:
- .JPEG
- .JPG
- .PNG
- .BMP
- . TIFF
- .DOCX
- . XLSX
- .PPTX
- .HTML
Kommentar
Den här kompetensen är bunden till Azure AI-tjänster och kräver en fakturerbar resurs för transaktioner som överstiger 20 dokument per indexerare och dag. Körning av inbyggda kunskaper debiteras enligt det befintliga priset för Betala per användning för Azure AI-tjänster.
@odata.type
Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill
Databegränsningar
- För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
- Även om filstorleken för att analysera dokument är 500 MB för azure AI Document Intelligence-nivån (S0) och 4 MB för den kostnadsfria nivån för Azure AI Document Intelligence (F0) omfattas indexering av indexeringsgränserna för din söktjänstnivå.
- Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter eller 10 000 bildpunkter x 10 000 bildpunkter.
- Om dina PDF-filer är lösenordslåsta tar du bort låset innan du kör indexeraren.
Språk som stöds
Mer information om tryckt text finns i Layoutmodellen för Azure AI Document Intelligence som stöds.
Begränsningar
Under den offentliga förhandsversionen har den här färdigheten följande begränsningar:
- Kunskapen kan inte extrahera bilder som är inbäddade i dokument.
- Sidnummer ingår inte i de genererade utdata.
- Färdigheten är inte lämplig för stora dokument som kräver mer än 5 minuters bearbetning i AI Document Intelligence-layoutmodellen. Kunskapen överskrider tidsgränsen, men avgifterna gäller fortfarande för AI Services-resursen för flera tjänster om den är kopplad till kompetensuppsättningen i faktureringssyfte. Se till att dokumenten är optimerade för att hålla sig inom bearbetningsgränserna för att undvika onödiga kostnader.
Kompetensparametrar
Parametrar är skiftlägeskänsliga.
Parameternamn | Tillåtna värden | beskrivning |
---|---|---|
outputMode |
oneToMany |
Styr kardinaliteten för utdata som genereras av färdigheten. |
markdownHeaderDepth |
h1 , h2 , h3 , h4 , , , h5 h6(default) |
Den här parametern beskriver den djupaste kapslingsnivån som bör beaktas. Om markdownHeaderDepth till exempel anges som "h3" betraktas ett markdown-avsnitt som är djupare än h3 (det vill säga #### och djupare) som "innehåll" som måste läggas till på den nivå som dess överordnade är på. |
Kunskapsindata
Indatanamn | beskrivning |
---|---|
file_data |
Filen som innehållet ska extraheras från. |
Indata för "file_data" måste vara ett objekt som definieras som:
{
"$type": "file",
"data": "BASE64 encoded string of the file"
}
Alternativt kan den definieras som:
{
"$type": "file",
"url": "URL to download file",
"sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}
Filreferensobjektet kan genereras på något av följande sätt:
Ange parametern för
allowSkillsetToReadFileData
indexerarens definition till true. Den här inställningen skapar en sökväg/document/file_data
som är ett objekt som representerar de ursprungliga fildata som laddats ned från blobdatakällan. Den här parametern gäller endast för filer i Azure Blob Storage.En anpassad färdighet returnerar ett JSON-objekt som har definierats som tillhandahåller
$type
,data
ellerurl
ochsastoken
. Parametern$type
måste vara inställd påfile
, ochdata
måste vara den grundläggande 64-kodade bytematrisen för filinnehållet. Parameternurl
måste vara en giltig URL med åtkomst för att ladda ned filen på den platsen.
Kunskapsutdata
Utdatanamn | beskrivning |
---|---|
markdown_document |
En samling "avsnittsobjekt" som representerar varje enskilt avsnitt i Markdown-dokumentet. |
Exempeldefinition
{
"skills": [
{
"description": "Analyze a document",
"@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"inputs": [
{
"name": "file_data",
"source": "/document/file_data"
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
}
]
}
Exempelutdata
{
"markdown_document": [
{
"content": "Hi this is Jim \r\nHi this is Joe",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": ""
},
"ordinal_position": 0
},
{
"content": "Hi this is Lance",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": "Boo"
},
"ordinal_position": 1,
}
]
}
Värdet för markdownHeaderDepth
styr antalet nycklar i ordlistan "avsnitt". Eftersom är "h3" finns det tre nycklar i ordlistan "sections" i exempelkompetensdefinitionen markdownHeaderDepth
: h1, h2, h3.