ドキュメント オートメーションでの 標準フォームのデータ フロー

次のデータ フロー図は、ドキュメント オートメーションとサードパーティ抽出サービスの間のデータの流れを促進するさまざまなコンポーネントを使用して、ドキュメント オートメーション標準フォームを構成する方法を示しています。


Document Automation と Standard Forms 間のデータのフロー
  • ラベリングおよびモデル作成ツール

    モデル作成ツールを使用して、ラベル付けとモデル作成を行います。この図では、トレーニング ドキュメントは、ツール内でアップロードされ、サードパーティ サービスの Blob ストレージに保存されます。最良の結果を得るには、最低 5 つのトレーニング ドキュメントをアップロードおよびラベル付けしてモデルを作成することをお勧めします。

  • Blob ストレージ

    Blob ストレージは、トレーニング ドキュメント、およびトレーニングに関連する情報を格納するストレージ ユニットです。

  • 抽出モデル

    サードパーティ サービス用の Blob ストレージに保存されているトレーニング済みモデルは、API を使用して取得されます。モデル ID は、GUI ID や標準名にすることができ、ラーニングインスタンスを作成するために使用されます。

  • ラーニングインスタンス作成

    ラーニングインスタンスを作成するモデルを参照して、選択することができます。モデルを選択すると、このラーニングインスタンスに抽出用のドキュメントをアップロードすることができます。ラーニングインスタンスは、サードパーティの抽出サービスにアクセスして、抽出結果を取得します。結果が出力フォルダーに移動するか、ドキュメントが検証ツールに移動します。

  • 抽出エンジン

    抽出エンジンは、モデル ID に基づいた抽出を行い、その結果をラーニングインスタンスに返します。

  • 出力の結果
    抽出が完了した後の出力結果には、次の 3 つのコンポーネントが含まれます。
    • 抽出 .csv:
    • 自動検出テーブル .csv
    • レスポンス .json