Document Automation - 生成 AI を使用したデータ抽出
- 最終更新日2024/11/20
Document Automation - 生成 AI を使用したデータ抽出
Document Automation Automation 360およびクラウド向けオンプレミスでは生成 AI (GenAI) 機能が提供され、事前のトレーニングなしに、非構造化および半構造化のドキュメントからシームレスにデータを抽出できます。 大規模言語モデル (LLM) を使用して、英語のドキュメントを処理するための GenAI 機能を備えたラーニングインスタンスを作成してください。
メリット
フォーム フィールドおよびテーブル フィールドの定義時に、[生成 AI モデルのクエリを検索] 機能を使用することで、ラーニングインスタンスでの抽出精度を高めることができます。Document Automation は、選択したフィールドに基づいてカスタマイズ可能なデフォルトのクエリを提供します。 クエリを GenAI に送信することで、事前のトレーニングなしに、さまざまなドキュメント タイプからのデータ抽出が強化されてそれが可能になります。 このイノベーションを活用して、ドキュメント処理能力を強化してください。
生成 AI が抽出を改善する方法
非構造化ドキュメント (たとえば、 契約書、合意書、レポート、レター、E メール) のラーニングインスタンスを作成するとき、GenAI によるデータ抽出機能は自動的に選択されます。 ラーニングインスタンスのフォーム フィールドおよびテーブル フィールドの定義時に、[生成 AI モデルのクエリを検索] オプションを活用して、データ抽出要求をカスタマイズできます。
住所フィールドの場合、GenAI クエリは「物件の住所は?」 このクエリをカスタマイズして、 「郵便番号、都道府県、市町村を含めた、完全な物件住所は?」のように、焦点を絞った抽出を行うことができます。
このラーニングインスタンスを使用してドキュメントを処理すると、GenAI 機能は、番地だけでなく、完全な住所を抽出します。 検索クエリを一度だけモデルに定義するだけで、このモデルを使用して処理されたすべてのドキュメントについて、追加の設定なしにデータが抽出されます。
請求書、ユーザー定義、発注書などの半構造化ドキュメントや、サプライチェーン ドキュメント (運送状、船荷証券、着荷通知書、梱包リストなど) のラーニングインスタンスを作成する場合、検証ツール 内のユーザー指定の更新に基づくネイティブの抽出機能に加えて、GenAI 駆動型データ抽出機能を活用できます。