事前トレーニング済みのドキュメント タイプの使用

事前トレーニング済みのドキュメント タイプとは、請求書、到着通知、船荷証券などの類似ドキュメントの大規模なデータセットですでにトレーニングされているモデルのことです。

概要

事前トレーニングは社内またはサードパーティ プロバイダーによって行われるため、お客様自身で行う必要はありません。こうしたドキュメント タイプは、キーと値のペア、テーブルからのデータ、および同じタイプまたは類似タイプのドキュメントからの非構造化情報を抽出するように設計されています。事前トレーニング済みのドキュメント タイプ (事前トレーニング済みのモデル) には、ラーニングインスタンスの作成時にユーザーが選択してカスタマイズできる一連の定義済みフィールドが揃っています。

事前トレーニング済みのドキュメント タイプを使用すると、以下が実現されます。

迅速なデプロイ
カスタム モデルの作成、トレーニング、デプロイにかかる時間を削減し、ドキュメント抽出プロセスを迅速に実装します。
精度の向上
こうしたドキュメント タイプは大規模なドキュメント セットでトレーニングされているため、カスタム ドキュメント タイプに比べて精度が高くなります。

事前トレーニング済みのドキュメント タイプは、抽出プロバイダーによって提供されます。抽出プロバイダーは、特定のドキュメント タイプを処理し、事前定義されたルールまたはモデルに基づいてドキュメントからデータを抽出することに特化したサービスです。

オートメーション・エニウェア
この抽出サービスは社内で開発され、請求書、到着通知、船荷証券、類似タイプの書類などのドキュメントからデータを抽出するようにトレーニングされます。これらのドキュメント タイプは、必要に応じて Azure OpenAIAnthropic などの生成 AI プロバイダーに接続して、モデルのデータ抽出機能をさらに強化できます。
Google Document AI
この抽出サービスは Google によって開発されており、請求書、領収書、公共料金請求書などのドキュメントからデータを抽出するための事前トレーニング済みのパーサーが提供されます。Document Automation で、Google Document AI から事前学習済みのドキュメント パーサーを統合することで、ユーザーは、すぐに使用できる高度な文書処理機能を活用できます。

サポート マトリックス

次の表は、Document Automation でサポートされている事前トレーニング済みのドキュメントのタイプを示しています。

ドキュメント タイプ 抽出プロバイダー 生成 AI プロバイダー
請求書 オートメーション・エニウェア はい
Google Document AI いいえ
着荷通知 オートメーション・エニウェア はい*
船荷証券 オートメーション・エニウェア はい*
梱包明細書 オートメーション・エニウェア はい*
領収書 Google Document AI いいえ
公共料金請求書 Google Document AI いいえ
貨物運送状 オートメーション・エニウェア はい*

*生成 AI プロバイダー オプションはデフォルトで有効になっており、このドキュメント タイプでは無効にすることはできません。