Document Intelligence のカスタム テンプレート モデル
このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (GA)
カスタム テンプレート (以前のカスタム フォーム) は、ラベル付けされたキーと値のペア、選択マーク、テーブル、リージョン、署名をドキュメントから正確に抽出する、簡単にトレーニングできるドキュメント モデルです。 テンプレート モデルは、レイアウト キューを使用してドキュメントから値を抽出するもので、定義されたビジュアル テンプレートを使用して高度に構造化されたドキュメントからフィールドを抽出するのに適しています。
カスタム テンプレート モデルは、カスタム ニューラル モデルと同じラベル付け形式と戦略を共有し、より多くのフィールドの種類と言語をサポートします。
モデル機能
カスタム テンプレート モデルでは、キーと値のペア、選択マーク、テーブル、署名フィールド、および選択した領域がサポートされます。
フォーム フィールド | 選択マーク | 表形式フィールド (テーブル) | 署名 | 選択された領域 | 重複するフィールド |
---|---|---|---|---|---|
サポートされています | サポート対象 | サポート対象 | サポート対象 | サポート対象 | サポートされていません |
表形式フィールド
API バージョン v3.0 以降のリリースでは、カスタム テンプレート モデルによって、ページ間表形式フィールド (テーブル) のサポートが追加されます。
- 複数のページにまたがるテーブルにラベルを付ける場合は、1 つのテーブル内のさまざまなページでそのテーブルの各行にラベルを付けます。
- ベスト プラクティスとして、データセットに予想されるバリエーションのサンプルがいくつか含まれていることを確認します。 たとえば、ドキュメントにそれらのバリエーションを表示する必要がある場合は、テーブル全体が 1 つのページ上にあり、テーブルが複数のページにまたがるサンプルを含めます。
表形式フィールドは、テーブルとして認識されないドキュメント内で繰り返し情報を抽出する場合にも便利です。 たとえば、履歴書の実務経験の繰り返しセクションにラベルを付け、表形式フィールドとして抽出できます。
バリエーションの処理
テンプレート モデルは、定義されたビジュアル テンプレートに依存します。テンプレートを変更すると、精度が低下します。 これらのインスタンスでは、トレーニング データセットを分割して、各テンプレートのサンプルを少なくとも 5 つ含め、各バリエーションのモデルをトレーニングします。 その後、モデルを 1 つのエンドポイントに構成できます。 デジタル PDF ドキュメントや画像などの微妙なバリエーションでは、同じトレーニング データセットに各種類の例を少なくとも 5 つ含めることをお勧めします。
入力の要件
最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。
サポートされているファイル形式:
モデル PDF 画像:
JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX)、Excel (XLS)、PowerPoint (PPT)、HTML既読 ✔ ✔ ✔ Layout ✔ ✔ ✔ 一般的なドキュメント ✔ ✔ 事前構築済み ✔ ✔ Custom ✔ ✔ ✱ 現在、Microsoft Office ファイルは他のモデルやバージョンではサポートされません。
PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。
画像のディメンションは、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。
PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、1 インチあたり 150 ドット (
DPI
) で約8
ポイントのテキストに相当します。カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。
カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1GB です。
カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは
1GB
で、最大 10,000 ページです。
Training a model
カスタム テンプレート モデルは、v2.0 API 以降のバージョンで一般公開されています。 新しいプロジェクトから始める場合、または既存のラベル付きデータセットがある場合は、v3.1 または v3.0 の API と Document Intelligence Studio を使用してカスタム テンプレート モデルをトレーニングします。
モデル | REST API | SDK | モデルのラベル付けとテスト |
---|---|---|---|
カスタム テンプレート | v3.1 API | ドキュメント インテリジェンス SDK | Document Intelligence Studio |
v3.0 以降の API では、モデルをトレーニングするビルド操作で新しい buildMode
プロパティがサポートされます。カスタム テンプレート モデルをトレーニングするには、buildMode
を template
に設定します。
https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-11-30
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
カスタム テンプレート モデルは、 v3.1 APIで一般提供されています。 新しいプロジェクトから始める場合、または既存のラベル付きデータセットがある場合は、v3.1 または v3.0 の API と Document Intelligence Studio を使用してカスタム テンプレート モデルをトレーニングします。
モデル | REST API | SDK | モデルのラベル付けとテスト |
---|---|---|---|
カスタム テンプレート | v3.1 API | ドキュメント インテリジェンス SDK | Document Intelligence Studio |
v3.0 以降の API では、モデルをトレーニングするビルド操作で新しい buildMode
プロパティがサポートされます。カスタム テンプレート モデルをトレーニングするには、buildMode
を template
に設定します。
https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
サポートされている言語とロケール
サポートされている言語の完全なリストについては、以下を 参照してください。 言語サポート—のカスタム モデル ページ。
カスタム (テンプレート) モデルは、v2.1 API で一般提供されています。
モデル | REST API | SDK | モデルのラベル付けとテスト |
---|---|---|---|
カスタム モデル (テンプレート) | Document Intelligence 2.1 | ドキュメント インテリジェンス SDK | Document Intelligence サンプル ラベル付けツール |
次のステップ
カスタム モデルの作成について学習します。