事前トレーニング済みのドキュメント タイプの使用
- 最終更新日2024/10/31
事前トレーニング済みのドキュメント タイプの使用
事前トレーニング済みのドキュメント タイプとは、請求書、到着通知、船荷証券などの類似ドキュメントの大規模なデータセットですでにトレーニングされているモデルのことです。
概要
事前トレーニングは社内またはサードパーティ プロバイダーによって行われるため、お客様自身で行う必要はありません。こうしたドキュメント タイプは、キーと値のペア、テーブルからのデータ、および同じタイプまたは類似タイプのドキュメントからの非構造化情報を抽出するように設計されています。事前トレーニング済みのドキュメント タイプ (事前トレーニング済みのモデル) には、ラーニングインスタンスの作成時にユーザーが選択してカスタマイズできる一連の定義済みフィールドが揃っています。
事前トレーニング済みのドキュメント タイプを使用すると、以下が実現されます。
- 迅速なデプロイ
- カスタム モデルの作成、トレーニング、デプロイにかかる時間を削減し、ドキュメント抽出プロセスを迅速に実装します。
- 精度の向上
- こうしたドキュメント タイプは大規模なドキュメント セットでトレーニングされているため、カスタム ドキュメント タイプに比べて精度が高くなります。
事前トレーニング済みのドキュメント タイプは、抽出プロバイダーによって提供されます。抽出プロバイダーは、特定のドキュメント タイプを処理し、事前定義されたルールまたはモデルに基づいてドキュメントからデータを抽出することに特化したサービスです。
- Automation Anywhere
- この抽出サービスは社内で開発され、請求書、到着通知、船荷証券、類似タイプの書類などのドキュメントからデータを抽出するようにトレーニングされます。これらのドキュメント タイプは、必要に応じて Azure OpenAI や Anthropic などの生成 AI サービスに接続して、モデルのデータ抽出機能をさらに強化できます。
- Google Document AI
- この抽出サービスは Google によって開発されており、請求書、領収書、公共料金請求書などのドキュメントからデータを抽出するための事前トレーニング済みのパーサーが提供されます。ドキュメント オートメーション で、Google Document AI から事前学習済みのドキュメント パーサーを統合することで、ユーザーは、すぐに使用できる高度な文書処理機能を活用できます。
サポート マトリックス
次の表は、ドキュメント オートメーション でサポートされている事前トレーニング済みのドキュメントのタイプを示しています。
ドキュメント タイプ | 抽出プロバイダー | 生成 AI プロバイダー |
---|---|---|
請求書 | Automation Anywhere | はい |
Google Document AI | いいえ | |
着荷通知 | Automation Anywhere | はい* |
船荷証券 | Automation Anywhere | はい* |
梱包明細書 | Automation Anywhere | はい* |
領収書 | Google Document AI | いいえ |
公共料金請求書 | Google Document AI | いいえ |
貨物運送状 | Automation Anywhere | はい* |
*生成 AI プロバイダー オプションはデフォルトで有効になっており、このドキュメント タイプでは無効にすることはできません。
注:
注: 使用したいドキュメント タイプが見つからない場合は、[ユーザー定義] ドキュメント タイプを使用して事例をサポートできます。「ドキュメント タイプ: サポート マトリックス」を参照してください。