Condividi tramite


DocumentPage Classe

Contenuto e elementi di layout estratti da una pagina dell'input.

Novità nella versione 2023-07-31: i codici a barre e le proprietà delle formule .

Ereditarietà
builtins.object
DocumentPage

Costruttore

DocumentPage(**kwargs: Any)

Metodi

from_dict

Converte un valore dict nella forma di documentPage nel modello stesso.

to_dict

Restituisce una rappresentazione dict di DocumentPage.

from_dict

Converte un valore dict nella forma di documentPage nel modello stesso.

from_dict(data: Dict) -> DocumentPage

Parametri

data
dict
Necessario

Dizionario nella forma di DocumentPage.

Restituisce

DocumentPage

Tipo restituito

to_dict

Restituisce una rappresentazione dict di DocumentPage.

to_dict() -> Dict

Restituisce

dict

Tipo restituito

Attributi

angle

Orientamento generale del contenuto in direzione orario, misurato in gradi tra (-180, 180).

angle: float | None

barcodes

Codici a barre estratti dalla pagina.

barcodes: List[DocumentBarcode]

formulas

Formule estratte dalla pagina

formulas: List[DocumentFormula]

height

Altezza dell'immagine/PDF rispettivamente in pixel/pollici.

height: float | None

lines

Righe estratte dalla pagina, potenzialmente contenenti elementi testuali e visivi.

lines: List[DocumentLine]

page_number

Numero di pagina basato su 1 nel documento di input.

page_number: int

selection_marks

Contrassegni di selezione estratti dalla pagina.

selection_marks: List[DocumentSelectionMark]

spans

Posizione della pagina nel contenuto concatenato dell'ordine di lettura.

spans: List[DocumentSpan]

unit

Unità utilizzata dalle proprietà poligono di larghezza, altezza e associazione. Per le immagini, l'unità è "pixel". Per PDF, l'unità è "pollice". I valori possibili includono: "pixel", "pollice".

unit: str | None

width

Rispettivamente la larghezza dell'immagine/PDF in pixel/pollici.

width: float | None

words

Parole estratte dalla pagina.

words: List[DocumentWord]