FormPage Classe
Représente une page reconnue à partir du document d’entrée. Contient des lignes, des mots, des marques de sélection, des tableaux et des métadonnées de page.
Nouveautés de la version v2.1 : propriété selection_marks, prise en charge des méthodes to_dict et from_dict
- Héritage
-
builtins.objectFormPage
Constructeur
FormPage(**kwargs: Any)
Méthodes
from_dict |
Convertit un dict dans la forme d’un FormPage en modèle lui-même. |
to_dict |
Retourne une représentation dict de FormPage. |
from_dict
Convertit un dict dans la forme d’un FormPage en modèle lui-même.
from_dict(data: Dict) -> FormPage
Paramètres
Retours
FormPage
Type de retour
to_dict
Attributs
height
Hauteur de l’image/PDF en pixels/pouces, respectivement.
height: float
lines
Quand include_field_elements a la valeur true, une liste de lignes de texte reconnues est retournée. Pour les appels pour reconnaître du contenu, cette liste est toujours remplie. Le nombre maximal de lignes retournées est de 300 par page. Les lignes sont triées de haut en bas, de gauche à droite, bien que dans certains cas la proximité soit traitée avec une priorité plus élevée. Comme l’ordre de tri dépend du texte détecté, il peut changer entre les images et les mises à jour de version OCR. Par conséquent, la logique métier doit être basée sur l’emplacement réel de la ligne plutôt que sur l’ordre. L’ordre de lecture des lignes peut être spécifié par l’argument mot clé reading_order (Remarque : reading_order pris en charge uniquement dans begin_recognize_content et begin_recognize_content_from_url).
lines: List[FormLine]
page_number
Numéro de base 1 de la page dans laquelle ce contenu est présent.
page_number: int
selection_marks
Liste des marques de sélection extraites de la page.
selection_marks: List[FormSelectionMark]
tables
Liste des tables extraites contenues dans une page.
tables: List[FormTable]
text_angle
Orientation générale du texte dans le sens des aiguilles d’une montre, mesurée en degrés compris entre (-180, 180).
text_angle: float
unit
LengthUnit utilisé par les propriétés largeur, hauteur et zone englobante. Pour les images, l’unité est « pixel ». Pour PDF, l’unité est « inch ».
unit: str
width
Largeur de l’image/PDF en pixels/pouces, respectivement.
width: float
Azure SDK for Python