Condividi tramite


FormPage Classe

Rappresenta una pagina riconosciuta dal documento di input. Contiene righe, parole, segni di selezione, tabelle e metadati di pagina.

Novità della versione 2.1: proprietà selection_marks, supporto per metodi to_dict e from_dict

Ereditarietà
builtins.object
FormPage

Costruttore

FormPage(**kwargs: Any)

Metodi

from_dict

Converte un elemento dict nella forma di un formPage nel modello stesso.

to_dict

Restituisce una rappresentazione dict di FormPage.

from_dict

Converte un elemento dict nella forma di un formPage nel modello stesso.

from_dict(data: Dict) -> FormPage

Parametri

data
dict
Necessario

Dizionario nella forma di FormPage.

Restituisce

FormPage

Tipo restituito

to_dict

Restituisce una rappresentazione dict di FormPage.

to_dict() -> Dict

Restituisce

dict

Tipo restituito

Attributi

height

Altezza rispettivamente dell'immagine/PDF in pixel/pollici.

height: float

lines

Quando include_field_elements è impostato su true, viene restituito un elenco di righe di testo riconosciute. Per le chiamate a riconoscere il contenuto, questo elenco viene sempre popolato. Il numero massimo di righe restituite è 300 per pagina. Le linee vengono ordinate dall'alto verso il basso, da sinistra a destra, anche se in alcuni casi la prossimità viene trattata con priorità più alta. Poiché l'ordinamento dipende dal testo rilevato, può cambiare tra le immagini e gli aggiornamenti della versione OCR. Pertanto, la logica di business deve essere basata sulla posizione della riga effettiva anziché sull'ordine. L'ordine di lettura delle righe può essere specificato dall'argomento parola chiave reading_order (nota: reading_order supportato solo in begin_recognize_content e begin_recognize_content_from_url).

lines: List[FormLine]

page_number

Numero in base 1 della pagina in cui è presente questo contenuto.

page_number: int

selection_marks

Elenco di segni di selezione estratti dalla pagina.

selection_marks: List[FormSelectionMark]

tables

Elenco di tabelle estratte contenute in una pagina.

tables: List[FormTable]

text_angle

Orientamento generale del testo in senso orario, misurato in gradi compreso tra (-180, 180].

text_angle: float

unit

Oggetto LengthUnit utilizzato dalle proprietà width, height e rettangolo delimitatore. Per le immagini, l'unità è "pixel". Per il PDF, l'unità è "inch".

unit: str

width

Larghezza rispettivamente dell'immagine/PDF in pixel/pollici.

width: float