Document Automation - 生成 AI を使用したデータ抽出

Document AutomationAutomation 360 クラウドおよびオンプレミスでは生成 AI(GenAI)機能が提供され、非構造化および半構造化のドキュメントから事前トレーニングなしでシームレスにデータを抽出できます。 大規模言語モデル (LLM) を使用して、英語のドキュメントを処理するための GenAI 機能を備えたラーニングインスタンスを作成してください。

注: 生成 AI モデルは、誤りを生み出したり、生成した情報を誤って伝えたりすることがあります。 AI モデルによって生成されたコンテンツの正確性、信頼性、および完全性を検証することをお勧めします。

ベネフィット

フォーム フィールドおよびテーブル フィールドの定義時に、生成 AI モデルのクエリを検索 機能を使用することで、ラーニングインスタンスでの抽出精度を高めることができます。Document Automation は、選択したフィールドに基づいてカスタマイズ可能なデフォルトのクエリを提供します。 クエリを GenAI に送信することで、事前のトレーニングなしに、さまざまなドキュメント タイプからのデータ抽出が強化されてそれが可能になります。 このイノベーションを活用して、ドキュメント処理能力を強化してください。

生成 AI が抽出を改善する方法

非構造化ドキュメント (たとえば、契約書、合意書、レポート、レター、E メール) のラーニングインスタンスを作成するとき、GenAI によるデータ抽出機能は自動的に選択されます。 ラーニングインスタンスのフォーム フィールドおよびテーブル フィールドの定義時に、生成 AI モデルの検索クエリ オプションを活用して、データ抽出要求をカスタマイズできます。

住所フィールドの場合、GenAI クエリは物件の住所は? このクエリをカスタマイズして、郵便番号、都道府県、市町村を含めた、完全な物件住所は?のように、焦点を絞った抽出を行うことができます。

Document Automationを使用したデータ抽出生成 AI

このラーニングインスタンスを使用してドキュメントを処理すると、GenAI 機能は、番地だけでなく、完全な住所を抽出します。 検索クエリを一度だけモデルに定義するだけで、このモデルを使用して処理されたすべてのドキュメントについて、追加の設定なしにデータが抽出されます。

請求書、ユーザー定義、発注書などの半構造化ドキュメントや、サプライチェーン ドキュメント (運送状、船荷証券、着荷通知書、梱包リストなど) のラーニングインスタンスを作成する場合、検証ツール 内のユーザー指定の更新に基づくネイティブの抽出機能に加えて、GenAI 駆動型データ抽出機能を活用できます。

重要:
  • プライバシー通知: 生成 AI 機能を選択すると、クエリはサードパーティのサービスに送信されます。 現在、データは Microsoft Azure OpenAI サービス または Anthropic に送信されます。これは Amazon Bedrock または Google Vertex AI で利用可能です。 サードパーティのサービスにデータを送信したくない場合は、生成 AI 機能をそのまま使用する非構造化および半構造化ドキュメント タイプを使用しないことをお勧めします。 地域サポートマトリックスについては、Document Automation 設定を参照してください。
  • 生成 AI クエリが結果と一致しない場合、生成 AI モデルは空の値または空の応答を返します。 そのようなシナリオでは、クエリを調整して望ましい結果を求めてください。