Partager via


FormPage Classe

Représente une page reconnue à partir du document d’entrée. Contient des lignes, des mots, des marques de sélection, des tableaux et des métadonnées de page.

Nouveautés de la version v2.1 : propriété selection_marks, prise en charge des méthodes to_dict et from_dict

Héritage
builtins.object
FormPage

Constructeur

FormPage(**kwargs: Any)

Méthodes

from_dict

Convertit un dict dans la forme d’un FormPage en modèle lui-même.

to_dict

Retourne une représentation dict de FormPage.

from_dict

Convertit un dict dans la forme d’un FormPage en modèle lui-même.

from_dict(data: Dict) -> FormPage

Paramètres

data
dict
Obligatoire

Dictionnaire au format FormPage.

Retours

FormPage

Type de retour

to_dict

Retourne une représentation dict de FormPage.

to_dict() -> Dict

Retours

dict

Type de retour

Attributs

height

Hauteur de l’image/PDF en pixels/pouces, respectivement.

height: float

lines

Quand include_field_elements a la valeur true, une liste de lignes de texte reconnues est retournée. Pour les appels pour reconnaître du contenu, cette liste est toujours remplie. Le nombre maximal de lignes retournées est de 300 par page. Les lignes sont triées de haut en bas, de gauche à droite, bien que dans certains cas la proximité soit traitée avec une priorité plus élevée. Comme l’ordre de tri dépend du texte détecté, il peut changer entre les images et les mises à jour de version OCR. Par conséquent, la logique métier doit être basée sur l’emplacement réel de la ligne plutôt que sur l’ordre. L’ordre de lecture des lignes peut être spécifié par l’argument mot clé reading_order (Remarque : reading_order pris en charge uniquement dans begin_recognize_content et begin_recognize_content_from_url).

lines: List[FormLine]

page_number

Numéro de base 1 de la page dans laquelle ce contenu est présent.

page_number: int

selection_marks

Liste des marques de sélection extraites de la page.

selection_marks: List[FormSelectionMark]

tables

Liste des tables extraites contenues dans une page.

tables: List[FormTable]

text_angle

Orientation générale du texte dans le sens des aiguilles d’une montre, mesurée en degrés compris entre (-180, 180).

text_angle: float

unit

LengthUnit utilisé par les propriétés largeur, hauteur et zone englobante. Pour les images, l’unité est « pixel ». Pour PDF, l’unité est « inch ».

unit: str

width

Largeur de l’image/PDF en pixels/pouces, respectivement.

width: float