Udostępnij za pośrednictwem


Wyodrębnianie dat i liczb z dokumentów

Podczas gdy wiele pól do wyodrębnienia to proste teksty, zdarza się, że wyodrębnione informacje to data lub liczba z kwotami.

Importowanie tych danych do systemu docelowego może wymagać istotnej logiki konwersji niestandardowej. Większość łączników importu i interfejsów API akceptuje tylko daty normalizowane w formacie ISO 8601, tak jak YYYY-MM-DD. Akceptują one także tylko liczby używające kropki (.) jako separatora dziesiętnego bez separatora tysięcy, np. NNN.DD.

Aby dowiedzieć się więcej o formacie daty, przejdź do części ISO 8601 — format daty i godziny.

Dodaliśmy możliwość zadeklarowania tego typu podczas kroku tworzenia pola w kreatorze oraz w celu wybrania konwencji daty lub numeru (odpowiednik ustawień regionalnych).

Konwencje dat

W następującym przykładzie przedstawiono instrukcję zachowania poufności informacji z polem daty.

Zrzut ekranu przedstawiający pole daty w sekcji

W poniższym przykładzie przedstawiono formaty pól daty.

Zrzut ekranu formatów „Pola daty

Obsługiwane formaty dat

Podczas definiowania pola wybierz Rok, Miesiąc, Dzień; Miesiąc, Dzień, Rok lub Dzień, Miesiąc, Rok.

Jako ograniczniki dat mogą być używane następujące znaki: ,-/.\. Nie można używać odstępu jako ogranicznika. Na przykład:

  • 01,01,2020
  • 01-01-2020
  • 01/01/2020

Dzień i miesiąc mogą być pisane jako jedna lub dwie cyfry, a rok może mieć dwie lub cztery cyfry:

  • 1-1-2020
  • 1-01-20

Jeśli ciąg daty ma osiem cyfr, ogranicznik jest opcjonalny:

  • 01012020
  • 01 01 2020

Miesiąc może być także zapisany jako jego pełna lub krótka nazwa. Jeśli nazwa jest używana, znaki ogranicznika są opcjonalne. Jednak ten format może zostać rozpoznany mniej dokładnie niż inne.

  • 01/sty/2020
  • 01sty2020
  • 01 sty 2020

Konwencje liczbowe

W następującym przykładzie przedstawiono instrukcję zachowania poufności informacji z polami liczb.

Zrzut ekranu przedstawiający pole liczby w sekcji

W poniższym przykładzie przedstawiono formaty pól liczbowych.

Zrzut ekranu formatów „Pola liczb

Uwaga

W przypadku każdego pola dla wszystkich zbiorów tego modelu jest dozwolona tylko jedna konwencja. Na przykład w przypadku wyodrębnienia kwoty pola przy użyciu opcji Użyj przecinka (,) jako separatora dziesiętnego następujący tekst: 1234,56 lub 1 234, 56 zostanie przekonwertowany na wartość 1234.56. Kwoty z formatem 12,34,576.78 lub 1,234.56 nie są konwertowane.

Podczas wyodrębniania tekst jest automatycznie konwertowany na podstawie podanej konwencji. Przekonwertowaną wartość można odzyskać, używając wyniku YOURFIELDNAME value. Ta wartość jest pusta, jeśli konwersja nie jest możliwa. Oryginalny tekst można odzyskać, korzystając z wyniku YOURFIELDNAME text.

Obsługiwane formaty liczb

Podczas definiowania pola wybierz pozycję Użyj kropki (.) jako separatora dziesiętnego lub Użyj przecinka (,) jako separatora dziesiętnego.

Gdy separator dziesiętny to kropka (.), można pominąć separatory tysięcy i można użyć przecinka (,) lub odstępu. Na przykład:

  • 1234.56
  • 1,234.56
  • 1 234.56

Gdy separator dziesiętny to przecinek (,), można pominąć separatory tysięcy lub odstępy. Na przykład:

  • 1234,56
  • 1 234.56

Następny krok

Szkolenie i publikowanie modelu przetwarzania dokumentów

Szkolenie: przetwarzanie dokumentów niestandardowych za pomocą narzędzia AI Builder (moduł)