Wyodrębnianie dat i liczb z dokumentów
Podczas gdy wiele pól do wyodrębnienia to proste teksty, zdarza się, że wyodrębnione informacje to data lub liczba z kwotami.
Importowanie tych danych do systemu docelowego może wymagać istotnej logiki konwersji niestandardowej. Większość łączników importu i interfejsów API akceptuje tylko daty normalizowane w formacie ISO 8601, tak jak YYYY-MM-DD
. Akceptują one także tylko liczby używające kropki (.
) jako separatora dziesiętnego bez separatora tysięcy, np. NNN.DD
.
Aby dowiedzieć się więcej o formacie daty, przejdź do części ISO 8601 — format daty i godziny.
Dodaliśmy możliwość zadeklarowania tego typu podczas kroku tworzenia pola w kreatorze oraz w celu wybrania konwencji daty lub numeru (odpowiednik ustawień regionalnych).
Konwencje dat
W następującym przykładzie przedstawiono instrukcję zachowania poufności informacji z polem daty.
W poniższym przykładzie przedstawiono formaty pól daty.
Obsługiwane formaty dat
Podczas definiowania pola wybierz Rok, Miesiąc, Dzień; Miesiąc, Dzień, Rok lub Dzień, Miesiąc, Rok.
Jako ograniczniki dat mogą być używane następujące znaki: ,
-
/
.
\
. Nie można używać odstępu jako ogranicznika. Na przykład:
- 01,01,2020
- 01-01-2020
- 01/01/2020
Dzień i miesiąc mogą być pisane jako jedna lub dwie cyfry, a rok może mieć dwie lub cztery cyfry:
- 1-1-2020
- 1-01-20
Jeśli ciąg daty ma osiem cyfr, ogranicznik jest opcjonalny:
- 01012020
- 01 01 2020
Miesiąc może być także zapisany jako jego pełna lub krótka nazwa. Jeśli nazwa jest używana, znaki ogranicznika są opcjonalne. Jednak ten format może zostać rozpoznany mniej dokładnie niż inne.
- 01/sty/2020
- 01sty2020
- 01 sty 2020
Konwencje liczbowe
W następującym przykładzie przedstawiono instrukcję zachowania poufności informacji z polami liczb.
W poniższym przykładzie przedstawiono formaty pól liczbowych.
Uwaga
W przypadku każdego pola dla wszystkich zbiorów tego modelu jest dozwolona tylko jedna konwencja. Na przykład w przypadku wyodrębnienia kwoty pola przy użyciu opcji Użyj przecinka (,) jako separatora dziesiętnego następujący tekst: 1234,56 lub 1 234, 56 zostanie przekonwertowany na wartość 1234.56. Kwoty z formatem 12,34,576.78 lub 1,234.56 nie są konwertowane.
Podczas wyodrębniania tekst jest automatycznie konwertowany na podstawie podanej konwencji. Przekonwertowaną wartość można odzyskać, używając wyniku YOURFIELDNAME value
. Ta wartość jest pusta, jeśli konwersja nie jest możliwa. Oryginalny tekst można odzyskać, korzystając z wyniku YOURFIELDNAME text
.
Obsługiwane formaty liczb
Podczas definiowania pola wybierz pozycję Użyj kropki (.) jako separatora dziesiętnego lub Użyj przecinka (,) jako separatora dziesiętnego.
Gdy separator dziesiętny to kropka (.
), można pominąć separatory tysięcy i można użyć przecinka (,
) lub odstępu. Na przykład:
- 1234.56
- 1,234.56
- 1 234.56
Gdy separator dziesiętny to przecinek (,
), można pominąć separatory tysięcy lub odstępy. Na przykład:
- 1234,56
- 1 234.56
Następny krok
Szkolenie i publikowanie modelu przetwarzania dokumentów
Informacje pokrewne
Szkolenie: przetwarzanie dokumentów niestandardowych za pomocą narzędzia AI Builder (moduł)